多元线性回归实例分析 - 图文 下载本文

从“共线性诊断”表中可以看出:

1:共线性诊断采用的是“特征值”的方式,特征值主要用来刻画自变量的方差,诊断自变量间是否存在较强多重共线性的另一种方法是利用主成分分析法,基本思想是:如果自变量间确实存在较强的相关关系,那么它们之间必然存在信息重叠,于是就可以从这些自变量中提取出既能反应自变量信息(方差),而且有相互独立的因素(成分)来,该方法主要从自变量间的相关系数矩阵出发,计算相关系数矩阵的特征值,得到相应的若干成分。

从上图可以看出:从自变量相关系数矩阵出发,计算得到了三个特征值(模型2中),最大特征值为2.847,最小特征值为0.003

条件索引=最大特征值/相对特征值再进行开方(即特征值2的条件索引为 2.847/0.150 再开方=4.351)

标准化后,方差为1,每一个特征值都能够刻画某自变量的一定比例,所有的特征值能将刻画某自变量信息的全部,于是,我们可以得到以下结论:

1:价格在方差标准化后,第一个特征值解释了其方差的0.02,第二个特征值解释了0.97,第三个特征值解释了0.00

2:轴距在方差标准化后,第一个特征值解释了其方差的0.00,第二个特征值解释了0.01,第三个特征值解释了0.99

可以看出:没有一个特征值,既能够解释“价格”又能够解释“轴距”所以“价格”和“轴距”之间存在共线性较弱。前面的结论进一步得到了论证。(残差统计量的表中数值怎么来的,这个计算过程,我就不写了)

从上图可以得知:大部分自变量的残差都符合正太分布,只有一,两处地方稍有偏离,如图上的(-5到-3区域的)处理偏离状态