1. 數據挖掘中的聚類(比如K均值,模糊C均值...)可不可以用來預測
可以,一般預測指的是分類預測、回歸預測、時間序列預測等等,這里首先聚類(不屬於預測)是歸納推理,聚類後得到了類別,然後對新的數據就可以進行KNN等分類啦,這就是預測啦。這種在客戶群分類預測中用的比較多。
2. 聚類演算法可以和時間序列相結合做預測嗎
你好,
如果你處理的數據本身就是時間序列數據,如果採用聚類的話,就會忽略數據的順序信息。也就是說並不知道得到那些簇之間的先後順序,既然不知道順序用時間序列來坐預測就沒有什麼意義。
你對數據先聚類後預測,我大致能了解你的意圖。你可以試著把聚類演算法換成序列模式挖掘演算法。比如,利用PrefixSpan找出頻繁出現的序列模式,那樣的話,給定一個序列模式,直接去匹配最符合的頻繁模式,就可以做簡單的預測。
此外,針對時間序列預測,有專門的比如ARIMA這種演算法來進行預測,為什麼要先聚類了?
3. 上證綜指與地域板塊的聚類分析如何分析
炒股扣扣群117986153
剛建的新群,希望大家都進來交流。沒事的時候也可以在群里聊聊天,吹吹牛。
4. 聚類分析方法有什麼好處
聚類分析:將個體(樣品)或者對象(變數)按相似程度(距離遠近)劃分類別,使得同一類中的元素之間的相似性比其他類的元素的相似性更強。目的在於使類間元素的同質性最大化和類與類間元素的異質性最大化。其主要依據是聚到同一個數據集中的樣本應該彼此相似,而屬於不同組的樣本應該足夠不相似。
常用聚類方法:系統聚類法,K-均值法,模糊聚類法,有序樣品的聚類,分解法,加入法。
注意事項:
1. 系統聚類法可對變數或者記錄進行分類,K-均值法只能對記錄進行分類;
2. K-均值法要求分析人員事先知道樣品分為多少類;
3. 對變數的多元正態性,方差齊性等要求較高。
應用領域:細分市場,消費行為劃分,設計抽樣方案等
優點:聚類分析模型的優點就是直觀,結論形式簡明。
缺點:在樣本量較大時,要獲得聚類結論有一定困難。由於相似系數是根據被試的反映來建立反映被試間內在聯系的指標,而實踐中有時盡管從被試反映所得出的數據中發現他們之間有緊密的關系,但事物之間卻無任何內在聯系,此時,如果根據距離或相似系數得出聚類分析的結果,顯然是不適當的,但是,聚類分析模型本身卻無法識別這類錯誤。
5. 通過聚類分析對客戶進行分類後,再通過模型分析預測哪些人可能成為我們的客戶,其可能存在的弊端是什麼
聚類分析依賴於聚類演算法的選取,如果是k-mans聚類演算法,對於初始值的選取是隨機的,初始選擇會影響結果,所以可能不準確!聚類分析依賴於聚類演算法的選取,如果是k-mans聚類演算法,對於初始值的選取是隨機的,初始選擇會影響結果,所以可能不準確!聚類分析依賴於聚類演算法的選取,如果是k-mans聚類演算法,對於初始值的選取是隨機的,初始選擇會影響結果,所以可能不準確!
6. 聚類分析在基因表達的數據挖掘分析中的地位有多大
數據挖掘有三個主要的應用方向:關聯/相關分析、分類與預測、聚類。
除了你提到的那些方面,就是關聯分析了。
所謂基因表達的聚類分析的應用,應該主要是相似基因的聚類吧。不好量化說,但應該是一個主要的方向。
7. 一直搞不懂,什麼情況下做聚類分析,求大神指點,最好有些簡單的數據說明
聚類分析 是在你需要對所有樣本進行分類時使用
比如市場調查了我的所有客戶基本信息 消費行為特徵等,然後根據這些數據 我要對我的客戶進行一下分類,找出我的客戶主要有哪幾類 每類有什麼共同特點 等
之後就可以根據每類的特殊性 做不同的活動
8. 如何進行聚類分析
聚類分析指將物理或抽象對象的集合分組成為由類似的對象組成的多個類的分析過程。它是一種重要的人類行為。聚類分析的目標就是在相似的基礎上收集數據來分類。聚類源於很多領域,包括數學,計算機科學,統計學,生物學和經濟學。在不同的應用領域,很多聚類技術都得到了發展,這些技術方法被用作描述數據,衡量不同數據源間的相似性,以及把數據源分類到不同的簇中。
9. 聚類分析最少需要幾個指標
聚類分析最少需要2個指標,
聚類分析和聚類評估這兩個指標。