龙源期刊?/p>
http://www.qikan.com.cn
基于划分的聚类算法研究与应用
作者:何宇
来源:《电脑知识与技术?/p>
2017
年第
16
?/p>
摘要:随着数学、计算机科学以及统计学、生物学等的快速发展,促进了聚类算法的?/p>
生。聚类分析在数据的处理和分析当中有着举足轻重的作用,并且被广泛应用到多个领域,介
于此人们发明出了聚类算法。这些算法可以被分为以划分方法为代表的多种多样的处理方法?/p>
今天我们着重来探讨一下基于划分的聚类算法的研究与应用?/p>
关键词:划分方法;聚类算法;研究与应?/p>
随着我国的数学、计算机科学以及经济学学科的快速发展,聚类算法得到广泛使用,加?/p>
了数据处理与分析的速度,很大程度上促进了这些学科的发展。而且聚类算法的应用领域已?/p>
涉及生活和生产的方方面面,它是将物理或抽象对象的集合分组为由类似的对象组成的多个?/p>
的分析过程。这有很多具体应用的实例,比如说在商业方面,聚类分析方法可以帮助销售工?/p>
者找到不同的客户群,并且通过聚类分析中特定的模式来展现客户群的差异性。实际出真知?/p>
聚类分析方法对于市场的整体分析和数据处理等有着极其重要的作用,而且可以根据对客户群
特点的分析准确把握客户的消费心理,这样一来能够促使厂商发现新的商机,开发新型的产业
和地区市场,并且能够将这些信息整合起来;在保险行业,聚类分析的应用更是在很大程度?/p>
解放的人力,很多数据的收集、处理变得极其方便,主要是根据地区的保险业的平均水平来划
分的,以平均值为划分的界限,再结合局部地区的经济发展速度、人均工资水平以及对保险?/p>
的态度和购买程度进行分组;再者便是在近些年来最为流行的贸易方式
—?/p>
电子商务。电子商
务顾名思义用的就是计算机,其本身在数据处理上就占有一定的优势,利用聚类分析的方法?/p>
得电子商务中的交易数据和人群划分更加明显,交易人群特点的掌握有利于电商事业的发展?/p>
也为更近一步的商务交流提供了建设性的意见?/p>
1
划分方法的基本概念及其常用的方法
划分方法?/p>
PAM
?/p>
Partitioning method
)的定义是首先创?/p>
k
个划分,
k
为要创建的划分个
数。常用的划分方法有:
k-means
?/p>
k-medics
?/p>
CLARA
?/p>
Clustering Large Application
),
CLARANS
?/p>
Clus-tering Large Application based upon Randomized Searchl.FCM
。其中以
k-means
的使用最为普通,严格来说
k--means
属于非层次聚类法的一种,下面我们来看一下它的整?/p>
执行过程,一共分为两个部分,分别是初始化,循环。所谓初始化就是指选择或是人为指定?/p>
些记录作为凝聚点,但是要注意的一点就是按就近原则进行初始化的选择,而且要注意记录中
心的数据,最后根据记录数据重新进行这一过程。一直不断地重复这一过程,直到凝聚点位置
收敛为止。这种方法一般具有节省运算时间等特点?/p>
2
具体的运算过?/p>