二、多元线性回归模型
在多要素的地理环境系统中,多个(多于两个)要素之间也存在着相互影响、相互关联的情况。因此,多元地理回归模型更带有普遍性的意义。 (一)多元线性回归模型的建立
假设某一因变量y受k个自变量x1,x2,...,xk的影响,其n组观测值为(ya,x1a,x2a,...,xka),
a?1,2,...,n。那么,多元线性回归模型的结构形式为:
ya??0??1x1a??2x2a?...??kxka??a(3.2.11)
式中:
?0,?1,...,?k为待定参数; ?a为随机变量。
如果b0,b1,...,bk分别为?0,?1,?2...,?k的拟合值,则回归方程为
?=b0?b1x1?b2x2?...?bkxk(3.2.12)
式中:
b0为常数;
b1,b2,...,bk称为偏回归系数。
偏回归系数bi(i?1,2,...,k)的意义是,当其他自变量xj(j?i)都固定时,自变量xi每变化一个单位而使因变量y平均改变的数值。
根据最小二乘法原理,?i(i?0,1,2,...,k)的估计值bi(i?0,1,2,...,k)应该使
n???Q???ya?ya????ya??b0?b1x1a?b2x2a?...?bkxka???min(3.2.13)
?a?1?a?1n22有求极值的必要条件得
n??Q?????2??ya?ya??0??b0??a?1?(3.2.14) ??Qn??????2??ya?ya?xja?0(j?1,2,...,k)??a?1???bj将方程组(3.2.14)式展开整理后得:
nnnn?nb0?(?x1a)b1?(?x2a)b2?...?(?xka)bk??ya?a?1a?1a?1a?1?nnnnn2?(x)b?(x)b?(xx)b?...?(xx)b?xy????1a01a11a2a21akak1aa??a?1a?1a?1a?1a?1?nnnnn (3.2.15) ?2?(?x2a)b0?(?x1ax2a)b1?(?x2a)b2?...?(?x2axka)bk??x2ayaa?1a?1a?1a?1?a?1...?nnnnn?(x)b?(xx)b?(xx)b?...?(x2)b?xy?ka0????1aka12aka2kakkaa?a?1a?1a?1a?1?a?1
方程组(3.2.15)式,被称为正规方程组。 如果引入一下向量和矩阵:
?b0??1x11???y?1????b1??1x12y??b??b2?,Y??2?,X??1x13???...???...??......?y??b??1x?n?1n?k???1??x11A?XTX??x21??...?x?k1??n??n??x1aa?1n???x2a??a?1?...?n???xka?a?1x21x22x23...x2nx11x12x13...x1n...............xk1??xk2?xk3? ?...?xkn??...............xk1??xk2?xk3? ?...?xkn??1x12x22...xk2n1x13x23...xk3...1??1??...x1n??1...x2n??1??......??...?...xkn???1x21x22x23...x2nn?x?ka?a?1a?1a?1?nnn?x12ax1ax2a...?x1axka???a?1a?1a?1? nnn2x1ax2ax2...?x2axka???a?a?1a?1a?1............?nnn?2x1axka?x2axka...?xka???a?1a?1a?1??n???ya??11...1??y1??na?1?1??????xy?x11x12x13...x1n??y2???1aa?a?1?? T????B?XY?x21x22x23...x2ny3??n?????x2aya???...............??...??a?1?x??y??...?xx...xk2k3kn??n??k1?n????xkaya???a?1??x1a?x2an...
则正规方程组(3.2.15)式可以进一步写成矩阵形式
Ab?B(3.2.15’)
求解(3.2.15’)式可得:
b?A?1B?(XTX)?1XTY(3.2.16)
如果引入记号:
Lij?Lji??(xia?xi)(xja?xj)(i,j?1,2,...,k)
a?1nLiy??(xia?xi)(ya?y)(i?1,2,...,k)
a?1n则正规方程组也可以写成:
?L11b1?L12b2?...?L1kbk?L1y?Lb?Lb?...?Lb?L2112222kk2y??(3.2.15’’) ............??Lb?Lb?...?Lb?Lk22kkkky?k11??b0?y?b1x1?b2x2?...?bkxk
(二)多元线性回归模型的显著性检验
与一元线性回归模型一样,当多元线性回归模型建立以后,也需要进行显著性检验。与前面的一元线性回归分析一样,因变量y的观测值y1,y2,...,yn之间的波动或差异,是由两个因素引起的,一是由于自变量x1,x2,...,xk的取之不同,另一是受其他随机因素的影响而引起的。为了从y的离差平方和中把它们区分开来,就需要对回归模型进行方差分析,也就是将y的离差平方和ST或(Lyy)分解成两个部分,即回归平方和U与剩余平方和Q:
ST?Lyy?U?Q
在多元线性回归分析中,回归平方和表示的是所有k个自变量对y的变差的总影响,它可以按公式
U??(ya?y)??biLiy
a?1i?1n?2k计算,而剩余平方和为
Q??(ya?ya)?Lyy?U
a?1n?2以上几个公式与一元线性回归分析中的有关公式完全相似。它们所代表的意义也相似,即回归平方和越大,则剩余平方和Q就越小,回归模型的效果就越好。不过,在多元线性回归分析中,各平方和的自由度略有不同,回归平方和U的自由度等于自变量的个数k,而剩余平方和的自由度等于n?k?1,所以F统计量为: