多元统计分析实例剖析

交通学院小组作业

从《2010年统计摘要》上获得了民航客运量和它的影响因素的数据。若以Y表示民航客运量(万人),X1表示国民收入总值(亿元),X2表示消费金额(亿元),X3表示铁路承载量(万人)X4 表示民航航线距离(万公里),X5表示境外旅客人数(万人),则可以得到下表:

年份 1995 1996 1997 1998 1999 2000 2001 2002 2003 2004 2005 2006 2007 2008 2009 2010 Y 277 358 412 481 534 469 665 893 1196 1572 1730 1540 1992 2614 3463 4060 X1 3162 4020 4426 4729 5110 5683 6782 8424 9431 11176 14086 15811 17261 19868 24268 29858 X2 2266 2634 3037 3359 3665 4030 4686 5855 6662 7663 9646 10806 11596 13163 15582 19139 X3 97789 103667 110645 114360 119906 127253 132424 134532 130295 134915 147174 136568 114854 114097 119632 126550 X4 18 19 23 26 28 27 31 33 39 47 45 57 61 67 100 115 X5 217 504 684 932 951 1137 1542 2140 2738 3228 3803 2940 3295 4003 3974 4983

参数估计

通过SPSS软件的处理可以得到以下的结果

Coefficients Standardized Unstandardized Coefficients Model 1 (Constant) x1 x2 x3 x4 x5 a. Dependent Variable: y B 714.040 .396 -.618 -.008 19.729 .429 Std. Error 213.378 .097 .141 .002 4.541 .054 Coefficients Beta t 3.346 2.751 -2.735 -.094 .485 .556 4.106 -4.391 -4.028 4.345 7.968 Sig. .007 .002 .001 .002 .001 .000 a

由以上的表格可以行到各个参数的估计值,从而可以得到:

回归系数的解释

1、常系数?0表示,当X1?X2?…?Xp?0时Y的值。 2、回归系数?j有两种解释。

一种是,当Xj变化一个单位而其他预测变量固定取常数时,Y的该变量,这个该变量与其他预测变量固定取什么常数无关。在实际中,预测变量间往往是有关联的,可能无法做到固定某些预测变量的值而改变其他变量的值。这是这种解释的弱点。

另一种表示,经过其他预测变量的“调整”后,Xj对响应变量Y的贡献。现以回归系数?1的估算为例来说明这种解释。

1)拟合Y对X2,…,X5的回归模型。记此回归的残差为eY?(X,?,X5),拟合的回

2归方程为

Y?826.035?0.052X2?0.012X3?32.256X4?0.391X5

2)拟合X1对X2,…,X5的回归模型。记此回归的残差为eX?(X12~,?,X5),拟合的回

归方程为

X1?282.591?1.429X2?0.009X3?31.610X4?0.097X5

残差eY?(X2~,?,X5)和

eX?(X,?,X)的值见下表。

125偏残差表

3)拟合残差eY?(X2行号 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 eX?(X,?,X) 125eY?(X2,?,X5) -62.663 316.506 97.961 -97.800 -167.503 -2.953 116.312 101.261 -212.794 -63.323 238.516 -247.931 -205.675 35.246 -18.576 173.416 37.211 60.955 17.347 -47.643 13.589 12.229 14.762 29.346 -102.436 -70.707 171.781 -130.822 -157.696 66.206 51.486 34.391 ,?,X5)对Y?(X2,?,X5)的简单回归模型的回归方程为

eeY?(X

在此回归方程中eX?(X1~2,?,X5)?0?0.396eX1?(X2,?,X5)

,X5)2,?的系数与全模型拟合的方程中X1的系数是一样

的,都是0.396。由上述计算过程可以看出这种解释比第一种解释统计意义更深

刻一些。

中心化和规范化

中心化: 年份 1995 1996 1997 y -1114 -1033 -979 X1 X2 X3 X4 X5 -8343.94 -5470.81 -25002.31 -7485.94 -5102.81 -19124.31 -7079.94 -4699.81 -12146.31 -28 -27 -23 -2099.94 -1812.94 -1632.94

联系客服:779662525#qq.com(#替换为@) 苏ICP备20003344号-4