多元线性回归 下载本文

偏决定系数的平方根称为偏相关系数,其符号与相应的回归系数的符号相同。偏相关系数与回归系数显著性检验的t值是等价的。下面看一个例子: x1 25 20 6 1001 525 825 120 28 x2 3547.79 896.34 750.32 2087.05 1639.31 3357.7 808.47 520.27 y 553.96 208.55 3.1 2815.4 1052.12 3427 442.82 70.12 x1 7 532 75 40 187 122 74 x2 671.13 2863.32 1160 862.75 672.99 901.76 3546.18 y 122.24 1400 464 7.5 224.18 538.94 2442.79 对上面的数据做二元线性回归得到结果如下所示: Model Summary Adjusted R Model 1 R .918 aStd. Error of the Estimate R Square .842 Square .816 475.75182 a. Predictors: (Constant), x2, x1 偏相关系数表 Unstandardized Coefficients (Constant) x1 x2 B -327.039 2.036 0.468 Std. Error 218.001 0.438 0.123 Standardized Coefficients Beta t -1.5 0.594 0.485 4.649 3.799 Sig. 0.159 0.001 0.003 Correlations Zero-order Partial 0.807 0.746 0.802 0.739 a. Dependent Variable: y 从输出结果可以看到,两个偏相关系数分别为ry1;2=0.802,ry2;1=0.739,进一步计算偏决定系数ry21;2=0.802^2=0.643, ry22;1=0.739^2=0.546,表中相关系数栏的Zero-order为y与xi的简单相关系数,分别为ry1=0.807,ry2=0.746,两个决定系数分别为ry21=0.807^2=0.651,ry22=0.746^2=0.557。

以上数据表明,用y与x1作一元线性回归时,x1能消除y的变差SST的比例为

ry1=0.651=65.1%,再引入变量x2时,x2能消除剩余变差SSE(x1)的比例为

ry2;1=0.546=54.6%,因而自变量x1和x2消除y变差的总比例为(1-ry1)(1-ry2)

2222=84.2%。这个值84.2%恰好是y对x1和x2二元线性回归的决定系数R2.

偏相关系数反映的是变量间的相关性,任意p个变量x1,x2,?,xp定义它们之间的偏相关系数。记rij?LijLii?Ljj。再看一个例子说明偏相关系数和简单相关系数

的关系。分别以x1表示商品的销售量,x2表示消费者人均可支配收入,x3表示商品价格。从经验上看,销售量与消费者的人均可支配收入之间应该有正相关,简单相关系数r12应该是正的。但是如果计算出的r12是个负数也不要感到惊讶,这是因为还有其他没有被固定的变量在发挥影响,例如商品的价格x3在这期间大幅提高了。反映固定x3后x1与x2相关程度的偏相关系数r12;3会是个正数。如果计算出的偏相关系数r12;3仍然是个负数的话,是什么原因呢?肯定是还有需要考虑而没有考虑的重要变量,也就是没有被固定的变量,会是什么变量?如果这种商品已经进入淘汰期正在被其他商品所取代的,那么计算出负的r12;3也就不奇怪了。在多元回归中,应该注意简单相关系数只是两个变量局部的相关性质,而并非整体的性质。所以在多元线性回归分析中我们并不看重简单相关系数,而认为偏相关系数才是真正反映因变量y与自变量xi以及自变量xi与xj的相关性的数量。根据偏相关系数,可以判断哪些自变量对因变量的影响较大,而选择必须考虑的变量,对于那些对因变量影响较小的自变量,则可以舍去不顾,所以在剔除某个自变量时,可以结合偏相关系数考虑。