第6章 多重共线性的情形及其处理
思考与练习参考答案
6.1 试举一个产生多重共线性的经济实例。
答: 例如有人建立某地区粮食产量回归模型,以粮食产量为因变量Y,化肥用量为X1,水浇地面积为X2,农业投入资金为X3。由于农业投入资金X3与化肥用量X1,水浇地面积X2有很强的相关性,所以回归方程效果会很差。再例如根据某行业企业数据资料拟合此行业的生产函数时,资本投入、劳动力投入、资金投入与能源供应都与企业的生产规模有关,往往出现高度相关情况,大企业二者都大,小企业都小。
6.2多重共线性对回归参数的估计有何影响? 答:1、完全共线性下参数估计量不存在;
2、近似共线性下OLS估计量非有效; 3、参数估计量经济含义不合理; 4、变量的显著性检验失去意义; 5、模型的预测功能失效。
6.3 具有严重多重共线性的回归方程能不能用来做经济预测?
答:虽然参数估计值方差的变大容易使区间预测的“区间”变大,使预测失去意义。但如果利用模型去做经济预测,只要保证自变量的相关类型在未来期中一直保持不变,即使回归模型中包含严重多重共线性的变量,也可以得到较好预测结果;否则会对经济预测产生严重的影响。
6.4多重共线性的产生于样本容量的个数n、自变量的个数p有无关系? 答:有关系,增加样本容量不能消除模型中的多重共线性,但能适当消除多重共线性造成的后果。当自变量的个数p较大时,一般多重共线性容易发生,所以自变量应选择少而精。
6.5 自己找一个经济问题来建立多元线性回归模型,怎样选择变量和构造设计矩阵X才可能避免多重共线性的出现?
答:请参考第三次上机实验题——机场吞吐量的多元线性回归模型,注意利用二手数据很难避免多重共线性的出现,所以一般利用逐步回归和主成分回归消除多重共线性。如果进行自己进行试验设计如正交试验设计,并收集数据,选择向量
使设计矩阵X的列向量(即X1,X2, Xp)不相关。
6.6对第5章习题9财政收入的数据分析多重共线性,并根据多重共线性剔除变量。将所得结果与逐步回归法所得的选元结果相比较。
附5.9 在研究国家财政收入时,我们把财政收入按收入形式分为:各项税收收入、企业收入、债务收入、国家能源交通重点建设收入、基本建设贷款归还收入、国家预算调节基金收入、其他收入等。为了建立国家财政收入回归模型,我们以财政收入y(亿元)为因变量,自变量如下:x1为农业增加值(亿元),
x2为工业增加值(亿元),x3为建筑业增加值(亿元),x4为人口数(万人),x5为社会消费总额(亿元),x6为受灾面积(万公顷)。据《中国统计年鉴》获得1978—1998年共21个年份的统计数据,见表5.4(P167)。由定性分析知,所有自变量都与y有较强的相关性,分别用后退法和逐步回归法作自变量选元。 解:逐步回归法
CoefficientsaUnstandardizedCoefficientsBStd. Error715.30990.574.179.0041010.840136.027.308.048-.405.152865.929103.725.639.086-.601.119-.361.086StandardizedCoefficientsBeta.9941.706-.7143.541-1.059-1.493Model123(Constant)x5(Constant)x5x1(Constant)x5x1x2t7.89840.7397.4316.367-2.6658.3487.439-5.057-4.216Sig..000.000.000.000.016.000.000.000.001a. Dependent Variable: y 回归方程为:
y=865.929—0.601x1-0.361x2+0.639x5
但是回归系数的解释不合理。
解:(1)分析数据的多重共线性。直接进行Y与四个变量的线性回归方程,并做多重共线性的诊断,由SPSS分析得相应输出结果如下: a方差扩大因子法,
由表1中VIF值, 可知x1,x2,x3,x5的方差扩大因子远大于10,这几个自变量之间存在很高的线性相关性,即回归方程存在严重的多重共线性。 b.特征根和条件数判定法。输出结果如表2:
表1
表2
其中最大的条件数k7=290.443,说明自变量间存在严重的多重共线性,这与方差扩大因子法的结果一致。其中x0,x2,x4,x5在第五行同时较大,表明其间存在多重共线性。
(2)消除多重共线性。
下面根据多重共线性剔除变量。先剔除VIF值最大的自变量x2,得:
CoefficientsaUnstandardizedCoefficientsBStd. Error-1503.1751546.931-.717.163-.801.467.029.017.487.078-.010.008StandardizedCoefficientsBeta-1.264-.526.1022.701-.026Collinearity StatisticsToleranceVIF.004.003.085.002.616268.990305.76911.701609.0671.624Model1(Constant)x1x3x4x5x6t-.972-4.391-1.7131.6956.238-1.177Sig..347.001.107.111.000.258a. Dependent Variable: y