聚类分析模式识别

聚类分析实验

一、实验目的

加深对K 均值聚类分析算法的理解,掌握K 均值聚类分析分类器的设计方法。

二、实验内容

根据实验数据设计K均值聚类分析分类器,实验数据采用遥感彩色图像,以图像的所有象素为样本集,每一象素点的R、G、B值作为其特征向量。

1)选择合适的类别数K和初始聚类中心。 2)选择距离测度。

3)设计迭代中止条件,或人为设定迭代次数。

4)循环迭代结束时,各类的所有象素其R、G、B值用各类中心的R、G、B值表示,画出分类结果图。

5)分析不同初始聚类中心和迭代条件对分类效果的影响。

三、实验思路

利用K均值算法的思路,根据其步骤,将实验分为以下几步: 1、本实验中选定K=5,即选K个聚类中心,任选K个样本为初始聚类中心;

2、分别计算每个样本到各聚类中心的距离,按照最小距离原则,将全部样本分配到K个聚类中;

3、利用下式计算重新分类后的各聚类中心

z(jr?1)?1n(jr)x?S(jr)?x j=(1,2,3)

4、比较新的聚类中心和旧的聚类中心之间的距离,如果它们的距离小于等于0.01,则认为两聚类中心相等,跳出迭代,否则转2,进行迭代,直至达到最大迭代数;

5、分类结束,将所有样本分成K类,各类值都与其对应聚类中心值相等。画出图像,算法结束。

四、实验结果

最后的聚类中心和一共迭代次数为:

联系客服:779662525#qq.com(#替换为@) 苏ICP备20003344号-4