聚类分析模式识别

聚类分析实验

一、实验目的

加深对K 均值聚类分析算法的理解，掌握K 均值聚类分析分类器的设计方法。

二、实验内容

根据实验数据设计K均值聚类分析分类器，实验数据采用遥感彩色图像，以图像的所有象素为样本集，每一象素点的R、G、B值作为其特征向量。

1）选择合适的类别数K和初始聚类中心。 2）选择距离测度。

3）设计迭代中止条件，或人为设定迭代次数。

4）循环迭代结束时，各类的所有象素其R、G、B值用各类中心的R、G、B值表示，画出分类结果图。

5）分析不同初始聚类中心和迭代条件对分类效果的影响。

三、实验思路

利用K均值算法的思路，根据其步骤，将实验分为以下几步： 1、本实验中选定K=5，即选K个聚类中心，任选K个样本为初始聚类中心；

2、分别计算每个样本到各聚类中心的距离，按照最小距离原则，将全部样本分配到K个聚类中；

3、利用下式计算重新分类后的各聚类中心

z(jr?1)?1n(jr)x?S(jr)?x j=(1,2,3)

4、比较新的聚类中心和旧的聚类中心之间的距离，如果它们的距离小于等于0.01，则认为两聚类中心相等，跳出迭代，否则转2，进行迭代，直至达到最大迭代数；

5、分类结束，将所有样本分成K类，各类值都与其对应聚类中心值相等。画出图像，算法结束。

四、实验结果

最后的聚类中心和一共迭代次数为：