35.
聚类分析
(一)概?/p>
聚类分析,相当于“物以类聚?/p>
,用于对事物的类别面貌尚不清
楚,甚至在事前连总共有几类都不能确定的情况下对数据进行分类?/p>
而判别分析,
必须事先知道各种判别的类型和数目?/p>
并且要有一
批来自各判别类型的样本,
才能建立判别函数来对未知属性的样本?/p>
行判别和归类?/p>
聚类分析是把分类对象按一定规则分成组或类?/p>
这些组或类不?/p>
事先给定的而是根据数据特征而定的?/p>
在同类的对象在某种意义上?/p>
向于彼此相似?/p>
而在不同类里的这些对象倾向于不相似?/p>
根据这种?/p>
似性的不同定义,聚类分析也有不同的方法?/p>
聚类分析分为:对样品的聚类,对变量的聚类?/p>
样品聚类?/p>
其统计指标是类与类之间距离,
把每一个样品看成空
间中的一个点?/p>
用某种原则规定类与类之间的距离,
将距离近的点?/p>
合成一类,距离远的点聚合成另一类?/p>
变量聚类?/p>
其统计指标是相似系数?/p>
将比较相似的变量归为一类,
而把不怎么相似的变量归为另一类,
用它可以把变量的亲疏关系直观
地表示出来?/p>
(二)原?/p>