计量经济学第二篇一元线性回归模型 下载本文

如有你有帮助,请购买下载,谢谢!

第二章 一元线性回归模型

2.1 一元线性回归模型的基本假定

有一元线性回归模型(统计模型)如下, yt = ?0 + ?1 xt + ut

上式表示变量yt 和xt之间的真实关系。其中yt 称被解释变量(因变量),xt称解释变量(自变量),ut称随机误差项,?0称常数项,?1称回归系数(通常未知)。上模型可以分为两部分。(1)回归函数部分,E(yt) = ?0 + ?1 xt,(2)随机部分,ut 。

图2.1 真实的回归直线

这种模型可以赋予各种实际意义,居民收入与支出的关系;商品价格与供给量的关系;企业产量与库存的关系;身高与体重的关系等。

以收入与支出的关系为例。假设固定对一个家庭进行观察,随着收入水平的不同,与支出呈线性函数关系。但实际上数据来自各个家庭,来自同一收入水平的家庭,受其他条件的影响,如家庭子女的多少、消费习惯等等,其出也不尽相同。所以由数据得到的散点图不在一条直线上(不呈函数关系),而是散在直线周围,服从统计关系。

“线性”一词在这里有两重含义。它一方面指被解释变量Y与解释变量X之间为线性关系,即

另一方面也指被解释变量与参数?0、?1之间的线性关系,即。

?yt??1?x,

?2yt??12?0 ,

?yt??0?1,

?2yt??02?0

2.1.2 随机误差项的性质

随机误差项ut中可能包括家庭人口数不同,消费习惯不同,不同地域的消费指数不同,不同家庭的外来收入不同等因素。所以在经济问题上“控制其他因素不变”是不可能的。随机误差项ut正是计量模型与其它模型的区别所在,也是其优势所在,今后咱们的很多内容,都是围绕随机误差项ut进行了。

回归模型的随机误差项中一般包括如下几项内容: (1)非重要解释变量的省略,

1页

如有你有帮助,请购买下载,谢谢!

(2)数学模型形式欠妥, (3)测量误差等,

(4)随机误差(自然灾害、经济危机、人的偶然行为等)。 2.1.3 一元线性回归模型的基本假定

通常线性回归函数E(yt) = ?0 + ?1 xt 是观察不到的,利用样本得到的只是对E(yt) =

?0 + ?1 xt 的估计,即对?0和?1的估计。

在对回归函数进行估计之前应该对随机误差项ut做出如下假定。 1、零均值:随机误差项的的期望为零

E(ut) = 0,yt = ?0 + ?1 xt + ut的期望值E(yt) = ?0 + ?1 xt正是由E(ut) = 0推出的 2、同方差:随机误差项的方差与t无差。 D(ut) = E[ut - E(ut) ]2 = E(ut)2 = ? 2

不难推出:D(yt)?E?(yt?E(yt)??E?(?0??1xt?ut)?(?0??1xt)??E?ut2???2

223、无自相关:即不同的误差项相互独立。

Cov(ui, uj) = E[(ui - E(ui) ) ( uj - E(uj) )] = E(ui, uj) = 0, (i ? j )。含义是不同观测值所对应的随机项相互独立。称为ui 的非自相关性。

不难推出:cov(yt,ys)?E?yt?E(yt)??ys?E(ys)??E(utus)?0 4、解释变量与随机误差项不相关

Cov(ui, xi) = E[(ui - E(ui) ) (xi - E(xi) )] = E[ui (xi - E(xi) ] = E[ui xi - ui E(xi) ] = E(ui xi) = 0。ui 与xi 相互独立。否则,分不清是谁对yt的贡献。

5、正态假定。即误差项服从均值为零,方差为? 2的正态分布。

ut ? N (0, ? ? )

不难推出,yt ? N (?0 + ?1 xt, ? ? )。

以上这些对随机误差项的假设是德国数学家高斯最早提出的,也称高斯假设或古典假设。满足以上古典假设的线性回归模型,也称古典线性回归模型。

回归模型存在两个特点。(1)建立在某些假定条件不变前提下抽象出来的回归函数不能百分之百地再现所研究的经济过程。(2)也正是由于这些假定与抽象,才使我们能够透过复杂的经济现象,深刻认识到该经济过程的本质。

2页

如有你有帮助,请购买下载,谢谢!

2.2一元线性回归模型的参数估计

对于所研究的经济问题,通常真实的回归直线是观测不到的。收集样本的目的就是要对这条真实的回归直线做出估计。

怎样估计这条直线呢?显然综合起来看,这条直线处于样本数据的中心位置最合理。怎样用数学语言描述“处于样本数据的中心位置”?设估计的直线用

? xt ?+??t=? y10?分别是 ?和?的估计量。观测值?和??t称yt的拟合值(fitted value)表示。其中y,?100 1

?t表示,称为残差。 到这条直线的纵向距离用u?x+u?+??t=??t ?t+u yt =y1 t 0称为估计的模型。假定样本容量为T。(1)用“残差和最小”确定直线位置是一个途径。但很快发现计算“残差和”存在相互抵消的问题。(2)用“残差绝对值和最小”确定直线位置也是一个途径。但绝对值的计算比较麻烦。(3)最小二乘法的原则是以“残差平方和最小”确定直线位置。用最小二乘法除了计算比较方便外,得到的估计量还具有优良特性。(这种方法对异常值非常敏感)设残差平方和用Q表示,

?t2= Q = ?ui?1T?t)2= ?(yt?yi?1T?(yt???0???1xt)2,

i?1T?的估计值。以??为变量,把Q看作?和??和?则通过Q最小确定这条直线,即确定?1100?的函数,这是一个求极值的问题。求Q对??的偏导数并令其为零,得?和??和?是?1100正规方程,

T?Q????x)(-1) = 0 (1) = 2?(yt??01t???i?10T?Q????x)(- xt) = 0 (2) = 2?(yt??01t???i?11?=?x、??= y??解这个方程组得:?101?(x?x)(y?y)

?(x?x)tt2t下面用代数和矩阵两种形式推导计算结果。首先用代数形式推导。由(1)、(2)式得,

?(yt???0???1xt)= 0 (3)

i?1T3页