多元统计分析题

多元统计分析模拟试题(两套:每套含填空、判断各二十道)

1) 2) 3) 4) 5) 6) 7)

A卷

判别分析常用的判别方法有距离判别法、贝叶斯判别法、费歇判别法、逐步判别法。

Q型聚类分析是对 样品 的分类,R型聚类分析是对变量_的分类。 主成分分析中可以利用协方差矩阵和相关矩阵求解主成分。

因子分析中对于因子载荷的求解最常用的方法是主成分法、主轴因子法、极大似然法

聚类分析包括系统聚类法、模糊聚类分析、K-均值聚类分析

分组数据的Logistic回归存在 异方差性 ,需要采用加权最小二乘估计 误差项的路径系数可由多元回归的决定系数算出,他们之间的关系为????=√??????? 8) 最短距离法适用于条形的类,最长距离法适用于椭圆形的类。

9) 主成分分析是利用降维的思想,在损失很少的信息前提下,把多个指标转化

为几个综合指标的多元统计方法。

10) 在进行主成分分析时,我们认为所取的m(m

分的累积贡献率达到85%以上比较合适。

11) 聚类分析的目的在于使类内对象的同质性最大化和类间对象的异质性最大

化 12) ??1是随机变量,并且有??1~??(0,1),那么??12服从(卡方)分布。

13) 在对数线性模型中,要先将概率取对数,再分解处理,公式:??????=??????????=????????+??????.??+????????,??,??=??,?? ??????????

14) 将每个原始变量分解为两部分因素,一部分是由所有变量共同具有的少数几

个 公共因子 组成的,另一部分是每个变量独自具有的因素,即 特殊因子

15) 判别分析的最基本要求是分组类型在两组之上,每组案例的规模必须至少一

个以上,解释变量必须是可测量的

16) 当被解释变量是属性变量而解释变量是度量变量时判别分析是合适的统计

分析方法

17) 多元正态分布是一元正态分布的推广

18) 多元分析的主要理论都是建立在多元正态总体基础上的,多元正态分布是多

元分析的基础 19) 因子分析中,把变量表示成各因子的线性组合,而主成分分析中,把主成分

表示成各变量的线性组合。

20) 统计距离包括欧氏距离和马氏距离两类

1) 因子负荷量是指因子结构中原始变量与因子分析时抽取出的公共因子的相

关程度。 (√) (p147)

2) 主成分分析是将原来较少的指标扩充为多个新的综合指标的多元统计方法。

(×)(p24) 3) 判别分析其被解释变量为属性变量,解释变量是度量变量。(√)(p90) 4) Logistic回归对于自变量有要求,度量变量或者非度量变量都不可以进行回

归。 (×) (p220) 5) 在系统聚类过程中,聚合系数越大,合并的两类差异越小。(×) (P59) 6) spss只能对单变量进行正态性检验。 (√)

7) Logistic回归中的估计参数(??0,??1,??2,… ,????)反应优势比率的变化,

如果????是正的,它的反对数值(指数)一定小于1。 (228) 8) 密度函数可以是负的。(×) (p3)

9) 计算典型函数推导的典型权重有较小的不稳定性。 (×) (p205) 10) 10、对应分析可以用图形的方式提示变量之间的关系,同时也可以给出具体

的统计量来度量这种相关关系,使研究者在作用对应分析时得到主观性较强

的结论。(×)(p179) 11) 多元检验具有概括和全面考察的特点,容易发现各指标之间的关系和差异。

(×)p25

12) 名义尺度的指标用一些类来表示,这些类之间有等级关系,但没有数量关

系。(×)p43

13) k-均值法是一种非谱系聚类法(√)p44

14) 一般而言,不同聚类方法的结果不完全相同(√)p6

15) 判别分析最基本要求是分组类型在两组以上且解释变量必须是可测量的

(√)p90

16) 非谱系聚类法是把变量聚集成k个类的集合。(×)p64 17) 主成分的数目大大少于原始变量的数目。(√)p114 18) 因子分析只能用于研究变量之间的相关关系。(×)p143

19) 聚类分析中的分类方法中,系统聚类法和分解法相似(相反)。(×)P43

20) 聚类分析的目的就是把相似的研究对象归类。(√)P42

B卷

一、填空题

1. 因子分析中因子载荷系数??????的统计意义是第i个变量与第j个公因子的相关系数;(??146)

2. 类平均法的两种形式为组间联结法和组内联结法 (P56) 3. 设x~x(?,?),i?1,2???,10.则10i3W??(x??)~,?)i?1iW3(10 (p5)

4.聚类分析根据实际的需要可能有两个方向,一是对样品,一是对指标聚类。(P43)

5. 模糊聚类分析方法中对原始数据进行变换,变换方法通常有标准化变换,极差变换,对数变换 (p63)

26、设X~N(?,?),其中X?(x,x),??(?,?),???21212?1?则Cov(x?x,x?x)=012127.非谱系聚类法是把样品聚集成K个类的集合。(P64)

8.因子分析的基本思想是根据相关性大小把原始变量分组,使得同组内的变量之间相关性较高,而不同组间的相关性较低。(P142) 9.两总体均值的比较问题也可分为两总体协方差阵相等与两总体协方差不相等两种情形。(P25)

10.因子旋转分为正交旋转和斜交旋转。(P150)

??,111. Q型聚类是指对样品进行聚类,R型聚类是指对指标(变量)进行聚类。(42页)

12. 一元回归的数学模型是: y =β0+β1x +ε,多元回归的数学模型是:_y =β0+β1x 1+β2x 2+ βp x p +ε_。

13. 变量的类型按尺度划分有间隔尺度、有序尺度、名义尺度_. (43页)

14. 判别分析是判别样品所属类型的一种统计方法,常用的判别方法有距离判别法、Fisher判别法、Bayes判别法、逐步判别法。(80页) 15若A1~Wp(n1,?),n1?p,A2~Wp(n2,?),??0,,且A1和A2相互独立,则

AA1?1A~?(p,. n1,n2)2。(19页)

16. 对应分析是将R型因子分析和Q型因子分析结合起来进行的统计分析方法。(170页)

17.典型相关分析是研究两组变量之间相关分析的一种多元统计方法。(194页)

18. 判别分析适用于被解释变量是非度量变量的情形。

19. 主成分分析是利用降维的思想,在损失很少信息的前提下,把多个指标转化为几个综合指标的多元统计方法。(113页)

20. 设xi,i?1,2???,16是来自多元正态总体Np(?,?),X和A分别为正态总体

Np(?,?)的样本均值和样本离差阵,则

?12T2?15[4(X??)]?A[4(X??)]~T(15,P)或15pF(p,n?p). 16?p二、判断题

1、 对于任何随机向量X=(X1,X2,...,Xp)'来说,其协方差阵?都是对称

阵,同时总是非负定的。 ( T ) P5

2、 能够体现各个变量在变差大小上的不同,以及有时存在的相关性

还要求距离与各变量所用的单位无关,这种距离是欧式距离。( F )P7

3、 最长距离法中,选择最小的距离作为新类与其他类之间的距离,然后将类间距离最小的两类进行合并,一直合并到只有一类为止。 ( F )P55

4、 当总体G1和G2为正态总体且协方差相等时,选用马氏距离。( T )P90

5、 进行主成分分析的目的之一是减少变量的个数,所以一般不会去p个主成分,而是取m(m

6、 第k个主成分Yk与原始变量Xi的相关系数?(Yk,Xi)称为因子负荷量。( T )P120

’(F1,F2,......,Fm)7、 F=(m

=0,协方差矩阵cov(F)=I,即向量F的各分量不是相互独立的。 (F)P145

8、 每个典型函数都包括一对变量,通常一个代表自变量,另一个代表因变量。(T)P202

9、 分组数据的Logistic回归不仅适用于大样本的分组数据,对小样本的未分组数据也适用。(F)P232

联系客服:779662525#qq.com(#替换为@) 苏ICP备20003344号-4