1. 数据挖掘中的聚类(比如K均值,模糊C均值...)可不可以用来预测
可以,一般预测指的是分类预测、回归预测、时间序列预测等等,这里首先聚类(不属于预测)是归纳推理,聚类后得到了类别,然后对新的数据就可以进行KNN等分类啦,这就是预测啦。这种在客户群分类预测中用的比较多。
2. 聚类算法可以和时间序列相结合做预测吗
你好,
如果你处理的数据本身就是时间序列数据,如果采用聚类的话,就会忽略数据的顺序信息。也就是说并不知道得到那些簇之间的先后顺序,既然不知道顺序用时间序列来坐预测就没有什么意义。
你对数据先聚类后预测,我大致能了解你的意图。你可以试着把聚类算法换成序列模式挖掘算法。比如,利用PrefixSpan找出频繁出现的序列模式,那样的话,给定一个序列模式,直接去匹配最符合的频繁模式,就可以做简单的预测。
此外,针对时间序列预测,有专门的比如ARIMA这种算法来进行预测,为什么要先聚类了?
3. 上证综指与地域板块的聚类分析如何分析
炒股扣扣群117986153
刚建的新群,希望大家都进来交流。没事的时候也可以在群里聊聊天,吹吹牛。
4. 聚类分析方法有什么好处
聚类分析:将个体(样品)或者对象(变量)按相似程度(距离远近)划分类别,使得同一类中的元素之间的相似性比其他类的元素的相似性更强。目的在于使类间元素的同质性最大化和类与类间元素的异质性最大化。其主要依据是聚到同一个数据集中的样本应该彼此相似,而属于不同组的样本应该足够不相似。
常用聚类方法:系统聚类法,K-均值法,模糊聚类法,有序样品的聚类,分解法,加入法。
注意事项:
1. 系统聚类法可对变量或者记录进行分类,K-均值法只能对记录进行分类;
2. K-均值法要求分析人员事先知道样品分为多少类;
3. 对变量的多元正态性,方差齐性等要求较高。
应用领域:细分市场,消费行为划分,设计抽样方案等
优点:聚类分析模型的优点就是直观,结论形式简明。
缺点:在样本量较大时,要获得聚类结论有一定困难。由于相似系数是根据被试的反映来建立反映被试间内在联系的指标,而实践中有时尽管从被试反映所得出的数据中发现他们之间有紧密的关系,但事物之间却无任何内在联系,此时,如果根据距离或相似系数得出聚类分析的结果,显然是不适当的,但是,聚类分析模型本身却无法识别这类错误。
5. 通过聚类分析对客户进行分类后,再通过模型分析预测哪些人可能成为我们的客户,其可能存在的弊端是什么
聚类分析依赖于聚类算法的选取,如果是k-mans聚类算法,对于初始值的选取是随机的,初始选择会影响结果,所以可能不准确!聚类分析依赖于聚类算法的选取,如果是k-mans聚类算法,对于初始值的选取是随机的,初始选择会影响结果,所以可能不准确!聚类分析依赖于聚类算法的选取,如果是k-mans聚类算法,对于初始值的选取是随机的,初始选择会影响结果,所以可能不准确!
6. 聚类分析在基因表达的数据挖掘分析中的地位有多大
数据挖掘有三个主要的应用方向:关联/相关分析、分类与预测、聚类。
除了你提到的那些方面,就是关联分析了。
所谓基因表达的聚类分析的应用,应该主要是相似基因的聚类吧。不好量化说,但应该是一个主要的方向。
7. 一直搞不懂,什么情况下做聚类分析,求大神指点,最好有些简单的数据说明
聚类分析 是在你需要对所有样本进行分类时使用
比如市场调查了我的所有客户基本信息 消费行为特征等,然后根据这些数据 我要对我的客户进行一下分类,找出我的客户主要有哪几类 每类有什么共同特点 等
之后就可以根据每类的特殊性 做不同的活动
8. 如何进行聚类分析
聚类分析指将物理或抽象对象的集合分组成为由类似的对象组成的多个类的分析过程。它是一种重要的人类行为。聚类分析的目标就是在相似的基础上收集数据来分类。聚类源于很多领域,包括数学,计算机科学,统计学,生物学和经济学。在不同的应用领域,很多聚类技术都得到了发展,这些技术方法被用作描述数据,衡量不同数据源间的相似性,以及把数据源分类到不同的簇中。
9. 聚类分析最少需要几个指标
聚类分析最少需要2个指标,
聚类分析和聚类评估这两个指标。