1992 1993 1994 1995 1996 1997 1998 1999 2000 2001 2002 2003 2004 2005 2006 2007 1.7663 1.5016 1.5319 1.5785 1.5607 1.6376 1.6573 1.6172 1.5156 1.4396 1.5025 1.6347 1.8330 1.8204 1.8434 2.0020 140.3 144.5 148.2 152.4 156.9 160.5 163.0 166.6 172.2 177.1 179.9 184.0 188.9 195.3 201.6 207.3 162.7 165.3 169.3 175.2 179.4 185.1 191.4 194.3 200.1 203.6 207.0 213.0 219.4 225.6 232.8 242.7 资料来源:Economic Report of the President £,2008.U.K Pound/$from Table B-110;CPI(1982~1984=100)from Table B-108.
(1)以时间(年)为横轴,以汇率(ER)与两个消费者价格指数为纵轴作图。 (2)求相对价格比率(RPR)(用英国CPI除美国CPI)。 (3)用ER对RPR作图。
(4)目测描绘通过散点图的回归线。 答:(1)如图所示,两个国家的消费者价格指数均随着时间的推移而增长,但汇率与时间之间的关系在不同时期则有所不同,但在1985年广场协议签署之后,G7纷纷有意调低了美元对本国货币的汇率。
(2)、(3)、(4)从下图中可以看出,汇率(ER)(英镑兑美元)同相对价格比率(RPR)之间大致呈现负相关关系。
第二章 线性回归的基本思想:双变量模型
2.1 复习笔记
一、回归的含义 1.回归分析的概念
回归分析用于研究一个变量(称为被解释变量或应变量)与另一个或多个变量(称为解释变量或自变量)之间的关系,但它并不一定表明存在因果关系;即它并不意味着自变量是因,应变量是果。如果两者之间存在因果关系,则一定建立在某个经济理论基础之上。总之,回归并不意味着存在因果关系,因果关系的判定或推断必须建立在经实践检验的相关理论基础之上。
2.回归分析的目的
(1)根据自变量的取值,估计应变量的均值。 (2)检验(建立在经济理论基础之上的)假设。
(3)根据样本外自变量的取值,预测应变量的均值。 (4)可同时进行上述各项分析。
二、总体回归函数(PRF)
双变量模型的线性总体回归函数如下式所示:
E?YXi??B1?B2Xi (2-1)
在式(2-1)中,EYXi表示与给定X值相对应的Y的均值。下标i代表第i个子总体。B1、B2称为参数,也称为回归系数。B1称为截距,B2称为斜率。斜率系数度量了X每变动一单位,Y(条件)均值的变化率。
三、总体回归函数的统计或随机设定
总体回归函数给出了自变量每个取值相应的应变量的平均值,但对每一个个体,其应变量并不一定等于平均值,而是存在一定的偏差,因此总体回归函数的随机形式如下式所示:
Yi?B1?B2Xi?ui (2-2)
其中,ui表示随机误差项,或简称为误差项。误差项是一个随机变量,其值无法先验确定,通常用概率分布(例如正态分布或t分布)描述随机变量。
式(2-2)称为随机或统计总体回归函数;而式(2-1)称为确定或非随机总体回归函数。后者表示给定X各个Y的平均值。而前者表示由于误差项的存在,个体值在均值附近是如何变动的。
四、随机误差项的性质
1.误差项代表了未纳入模型变量的影响; 2.误差项代表内在随机性; 3.误差项代表了度量误差;
4.误差项代表众多的细小影响因素。
五、样本回归函数
要估计式(2-1)的总体回归函数,只要求出相对每个X的Y的条件均值,然后再把这些均值连接起来,就得到了总体回归线。但是实际中很少能够获得整个总体的数据。通常,仅仅有来自总体的一个样本,因此就需要根据样本信息估计总体回归函数。
样本回归函数形式为:
????b?bX (2-3) Yi12i
?=总体条件均值EYX的估计量;b1?B1的估计量;b2?B2的估计量。 其中,Yii??同理,并非所有的样本数据都准确地落在各个样本回归线上。因此,与建立随机总体回归函数式(2-2)一
样,需要建立随机样本回归函数:
Yi?b1?b2Xi?ei (2-4)
其中,ei是ui的估计量。ei称为残差项,简称残差。从概念上讲,它与ui类似,可作为ui的估计量,SRF中ei的产生原因与PRF中ui的产生原因相同。ei表示了Y的实际值与根据样本回归得到的估计值的差。
? (2-5) ei?Yi?Yi总之,回归分析的主要目的是根据样本回归函数
Yi?b1?b2Xi?ei
估计总体回归函数
Yi?B1?BXi?ui
因为通常的分析是建立在来自某个总体的单个样本上的。但由于抽样的差异性,根据SRF得到的PRF的估计值仅仅是近似值。事实上,无法观察到B1、B2和u。一旦得到某个样本,所能观察到的只是它们的替代量b1、
b2和e。
六、“线性”回归的特殊含义 1.变量线性
变量的线性是指应变量的条件均值是自变量的线性函数,所以下面的函数不是线性的:
E(Y)?B1?B2Xi2 (2-6)
E(Y)?B1?B21 (2-7) Xi因为在式(2-6)中Xi以平方形式出现,而在式(2-7)中Xi以倒数形式出现。对于解释变量线性的回归模型,解释变量的单位变动引起的应变量的变化率为一常数,也就是说,斜率保持不变。但对于解释变量非线性的回归模型,斜率是变化的。
2.参数线性
参数线性是指应变量的条件均值是参数B的线性函数,而变量之间并不一定是线性的。与变量线性函数类似,如果参数B2仅以一次方的形式出现,则称函数为参数线性的。按照这个定义,模型(2-6)和式(2-7)都是线性模型,因为B1、B2以线性形式进入模型,变量X以非线性进入模型则无关紧要。但下面的模型是参数非线性的,因为B2以平方形式出现:
2E(Y)?B1?B2Xi (2-8)
在计量经济学中,线性回归是指参数线性的回归(即参数仅以一次方的形式出现在模型中),而解释变量并
不一定是线性的。
七、从双变量回归到多元线性回归