计量地理学 论文 下载本文

2010-2011学年第二学期《计量地理学》考察作业

如何有效利用主成分分析进行综合评价

学生姓名: 指导老师:

摘要 由于主成分分析在多元统计分析中的降维作用,使之在社会、经济、医疗、生化等各领域运用越来越广泛,但由于传统主成分分析方法的局限性导致了一些问题的产生。这些问题吸引了许多领域专家的关注,并具有针对性的提出了一些不同的改进方法。本文介绍了主成分分析的基本和性质,并整理了近年来主成分分析在综合评价应用中遇到的普遍问题并整理验证了认同率较强的一些改进方法,以供大家研究学习。

关键词 主成分分析,综合评价,均值化 1引言

1.1研究的背景和意义

随着生产力的不断进步,生产方式由外延式扩张转化为追求经济效益的内涵式发展,以致在生产过程中必须考虑经济效益的各个方面,如生产力水平、技术进步、资源占用等情况,并需要就综合各方面的因素进行综合评价。

评价是根据确定的目的来测定对象系统的属性,并将这种属性变为客观定量的计值或者主观效用行为,整个过程离不开评价者的参与,而综合评价作为评价的一种也需要评价者做出相应反应或指示,而很多综合评价过程易受到评价者的干预,使评价结果产生偏差。

主成分分析能将高维空间的问题转化到低维空间去处理

【9】

,使问题变得比较简单、直观,而且这

些较少的综合指标之间互不相关,又能提供原有指标的绝大部分信息。而且,伴随主成分分析的过程,将会自动生成各主成分的权重,这就在很大程度上抵制了在评价过程中人为因素的干扰,因此以主成分为基础的综合评价理论能够较好地保证评价结果的客观性,如实地反映实际问题。主成分综合评价提供了科学而客观的评价方法,完善了综合评价理论体系,为管理和决策提供了客观依据,能在很大程度上减少了上述不良现象的产生。

所以在社会经济、管理、自然科学等众多领域的多指标体系中,如节约型社会指标体系、生态环境可持续型指标体系、和谐社会指标体系、投资环境指标体系等,主成分分析法常被应用于综合评价与监控

【6】

综上所述,对综合评价指标体系理论进行研究,既有理论上的必要性,更有实践中的迫切性。 1.2研究的发展史

1

2010-2011学年第二学期《计量地理学》考察作业

基于主成分分析的综合评价以主成分分析为理论基础,以综合评价为主线,着眼于作出合理公正的综合评价。以下从综合评价和主成分分析两个方面来讨论主成分综合评价的发展史。

1.2.1综合评价的发展史

综合评价是伴随着人类文明的产生、发展而产生、发展的。其基本思想是将反映研究对象数量特征的多个指标转化为一个综合指标,并据以对各个具体评价对象进行排序比较,从而做出好坏优劣的评价结论。

1888年,艾奇沃斯(Edgeworth)发表了论文《考试中的统计学》,提出了对考生中的不同部分应如何加权。1913年,斯皮而曼(sPe~an)发表了《和与差的相关性》一文,讨论了不同加权的作用。在20世纪30年代,瑟斯通(Thurstone)和利克特(Likert)又对定性记分方法的工作给予了新的推动。20世纪60年代,美国学者查德(L·A·zadaen)模糊集合理论,为模糊综合评价法奠定了基础。20世纪70一80年代,是现代科学评价蓬勃兴起的年代。在此期间,产生了多种应用广泛的评价方法,诸如ELECTRE法(1971一1977,1983)、多维偏好分析的线性规划法(LINMAP,1973)、层次分析法(AHP,1977)、数据包络分析法(DEA,1978)、逼近于理想解的排序法(TOPSIS,1981)等

1.2.2主成分分析的发展史

主成分分析,首先是由英国的皮尔生(Kar卜Pearson)对非随机变量引入的,而后美国的数理统计学家赫特林(Harold.Hotelling)在1933年将此方法推广到随机向量的情形团一开始就很好地为综合评价提供了有力的理论和技术支持。

20世纪80~90年代,是现代科学评价在我国向纵深发展的年代,人们对包括主成分综合评价在内的评价理论、方法和应用开展了多方面的、卓有成效的研究,主要表现为:常规评价方法在国民经济、生产控制和社会生活中的广泛应用;多种评价方法的组合研究,综合应用及比较;新评价方法的研究和应用;评价方法的深入研究,如:评价属性集的设计、标准化变换、评价模型选择等等。

1.3主成分做综合评价的研究现状

目前国内外关于综合评价的方法很多,在根据各指标间相关关系或各指标值的变异程度来确定权重系数的方法中,主成分分析法是应用尤为广泛。在使用该方法的早期,大多都是按照传统的主成分分析法做综合评价的步骤来计算综合得分来对样品排序,即利用主成分F1,F2,?,Fm做线性组合,并以每个主成分Fi的方差贡献率αi作为权重系数来构造一个综合评价函数:

Y =α1F1 +α2F2 +?+αm F m

然而,随着传统主成分分析方法在综合评价中的进一步应用,人们发现此方法时经不起实践检验的。在实际应用中,经常发现运用此方法所得结果的解释往往与实际情况不符。举了一个简单的例子,假定高考中考试科目有四门:数学(x1)、语文(x2)、外语(x3)和物理(x4),满分都是相同的150分。考生的四门考试成绩必须综合成一个综合评价函数,一般取为总分

但从统计学的角度来看,可能取为?xi*?xi。

i?1i?144【8】【7】

。主成分分析的降维思想从

更为合理,这里xi*是xi的标准化数值(x1* 、x2* 、x3* 、x4*有相同的均值和标准差)。如果我们使用

2

2010-2011学年第二学期《计量地理学》考察作业

传统的主成分分析法,根据上述综合评价函数F的得分来对学生进行排名,那就酿成大错了。

就此,一些学者提出了一些改进的方法,其中具有代表性的方法有:Yan(1998)提出,当第一主成分的方差比较大时,即贡献率较大时,用它做综合评价指标。如果觉得用一个主成分解释的方差不够大时,综合反映X1 ,X 2 ,?,Xp信息的能力不够,而用多个主成分构造综合评价函数又不合适时,可以像因子分析那样对主成分进行旋转。Hou(2006)也提出,当用第一主成分进行综合评价达不到理想结果时,可用分组主成分评价法。即先用因子分析法将p个变量分成k组,然后分别对各组变量进行主成分分析,只取每组的一主成分,求出各组第一主成分的得分Cj(j=1,2,?,k)以因子旋转后各因子的放差贡献率为权重Wj??j??jj?1k建立综合评价函数:z??WjCj。最后根据各评价样本综合得分y来对样品

j?1【4】

k进行排序。但其可行性也受到了一些学者的质疑深耕细作的热土。

2关于主成分分析基本知识 2.1主成分分析

。由此可见,主成分综合评价法是一片有待进一步

设要进行主成分分析的原指标有p个,记作x 1 ,x2 ,?,x p 。现有n个样品,相应的观测值为x

ik ,

i =1,2,?,n,而k =1,2,?,p。

作标准化变换后,将Xk变换为Xk*,即

Xk*?Xk-Xk,k =1,2,?,m. Sk式中,Xk及Sk分别是xk的均值及标准差,x k*的均值为0、标准差为1. 主成分分析的原理是:

根据各样品原指标的观测值x ik或标准化变换后的观测值x ik*求出系数 a ik (k=1,2,?,p,j=1,2,?,m,m

建立用标准化变换后的指标x k*表示综合指标Fj的方程Fj?表示综合指标Fj的方程Fj??akjxk*,也可建立用原指标X

kk

?akjxk*。

k对系数a ik由下列原则决定:

(1)各个综合指标Fj彼此独立或不相关;

(2)各个综合指标Fj所反映的各个样品的总信息等于原来p个指标Xk*所反映的各个样品的总信息,即p个Fj的方差λj之和等于p个Xk*的方差之和,也就是

??j?P且λ

j1≥λ2 ? ≥λP。

3