(整理)多元线性回归—国内旅游收入因素研究分析

-------------

统计学课程案例研究

题 目: 国内旅游收入因素研究分析

学 院: 经济管理学院 指导教师: 王秀芝 团队成员: 卢盈(11097111)

欧阳园园(11096103) 黄升(11096119) 范哲武(11096118) 陈光星(11096117)

-------------

-------------

二O一四 年 五 月

-------------

-------------

1. 多元线性回归的概念及主要内容框架 1.1 多元线性回归的概念

多元线性回归模型是用两个或两个以上的解释变量来解释因变量的一种模

?,Xk为k个用来说明Y的被称为解释变量的不同变型。设为Y因变量,X1,X2,量,其中X1恒等于1,则Yi??1??2X2i????kXki??i,(i?1,2,?,n) (1)式 称为多元线性回归模型。其中,?i(i?1,2,?,n)为随即扰动项;参数?1,?2,?,?k称为回归系数。若令

?Y1??X11????Y??XY??2?,X??12??????Y??X?n??1nXk1???1???1??????Xk2???2???2?,??,????????, ???????????????X2n?Xkn???k??n?X21?X22?则(1)式可用矩阵形式表示为:Y?X??? 式。

1.2 多元线性回归的主要内容框架

-------------

-------------

2. 多元线性回归模型的检验 2.1 拟合优度的检验

回归方程的拟合优度检验是检验样本的数据点聚集在回归线周围的密集程度,从而评价回归方程对样本数据的代表程度。拟合优度从对被解释变量 y 取值变化的成因分析入手。被解释变量 y 的变化可由两部分解释:第一,有p个解释变量x的变化引起的y的变化部分;第二,由其他随机因素引起的y的变化部分。

定义由第一部分引起的 y 的变差平方和为ESS,称为回归平方和;由随机因素引起的 y 的变差平方和称为剩余平方和RSS, SST称为总离差平方和,其中有TSS=ESS+RSS

定义多重判定系数是多元线性回归中回归平方和占总平方和的比例,计算公式为:

ESSRSS?1?TSSTSS

R2? R2度量了多元回归方程的拟合优度,反映了回归方程所能解释的变差的比例,该统计量越接近于1,模型的拟合优度越高。

在应用过程中发现,如果在模型中增加一个解释变量, R2往往增大,这就给人一个错觉:要使得模型拟合得好,只要增加解释变量即可。但是,现实情况往往是,由增加解释变量个数引起的R2的增大与拟合好坏无关,R2需调整。

从而引入调整后的R2。在样本容量一定的情况下,增加解释变量必定使得自由度减少,所以调整的思路是:将残差平方和与总离差平方和分别除以各自的自由度,以剔除变量个数对拟合优度的影响:

R2?1?RSS/(n?k?1)TSS/(n?1) 其中:n-k-1为残差平方和的自由度,n-1为总体平方和的自由度。

-------------

-------------

2.2 回归方程的检验

在已知回归系数?1,?2,?,?k的条件下,还需对整个回归方程进行显著性检验。在对整个回归方程进行显著性检验时通常是构造F统计量,类似的,F检验时仍需四个步骤: ①提出原假设和备择假设:

原假设H0:?1??2????k?0,备择假设H1:?1,?2,?,?k不全为零;

SSR/(k?1)②作统计量:F?,其中SSR为残差平方和,SSE为回归平方和,

SSE/(n?k)(k-1),(n-k)分别为SSR,SSE的自由度; ③根据样本数据和原假设计算统计量F的值;

④将统计量F的值与临界值F?相比较,若F的值大于临界值F?,则需拒绝原假设H0,说明回归方程显著。反之,则需接受原假设H0,说明回归方程不显著。

2.3 回归系数的检验

运用计算方法或者通过计算机的运行可以得出回归系数?1,?2,?,?k的估计,但所估计的回归系数在给定的显著性水平?下是否具有显著性呢?这需要给予相应的显著性检验,通常是构造t统计量。那么在进行t检验过程中需遵循以下四个步骤:

①提出原假设和备择假设:

原假设H0:?j?0,(j?1,2,?,k),备择假设H1:?j?0,(j?1,2,?,k); ②作统计量:t??jS???,其中S?为?j的标准差;

?j???j③根据样本数据和原假设计算统计量t的值;

④将统计量t的值与临界值t?相比较,若t的绝对值大于临界值t?,则拒绝原假设H0,说明?j显著不为零。反之,则接受原假设H0,说明?j显著为零。 -------------

联系客服:779662525#qq.com(#替换为@) 苏ICP备20003344号-4