聚类分析实验
一、实验目的
加深对K 均值聚类分析算法的理解,掌握K 均值聚类分析分类器的设计方法。
二、实验内容
根据实验数据设计K均值聚类分析分类器,实验数据采用遥感彩色图像,以图像的所有象素为样本集,每一象素点的R、G、B值作为其特征向量。
1)选择合适的类别数K和初始聚类中心。 2)选择距离测度。
3)设计迭代中止条件,或人为设定迭代次数。
4)循环迭代结束时,各类的所有象素其R、G、B值用各类中心的R、G、B值表示,画出分类结果图。
5)分析不同初始聚类中心和迭代条件对分类效果的影响。
三、实验思路
利用K均值算法的思路,根据其步骤,将实验分为以下几步: 1、本实验中选定K=5,即选K个聚类中心,任选K个样本为初始聚类中心;
2、分别计算每个样本到各聚类中心的距离,按照最小距离原则,将全部样本分配到K个聚类中;
3、利用下式计算重新分类后的各聚类中心
z(jr?1)?1n(jr)x?S(jr)?x j=(1,2,3)
4、比较新的聚类中心和旧的聚类中心之间的距离,如果它们的距离小于等于0.01,则认为两聚类中心相等,跳出迭代,否则转2,进行迭代,直至达到最大迭代数;
5、分类结束,将所有样本分成K类,各类值都与其对应聚类中心值相等。画出图像,算法结束。
四、实验结果
最后的聚类中心和一共迭代次数为: