19.参考习题5。表2-5给出了基本数据。
(1)用钟表价格对钟表年代和投标人数作图。散点图表明教材线性回归模型(2-27),和教材式(2-28)是否适合?
(2)用投标人数对钟表年代作图是否有意义?散点图说明了什么?
表2-5 拍卖数据(钟表价格、钟表年代和投标人数)
观察值 价格 年代 投标人数 1 1235 127 13 2 1080 115 12 3 845 127 7 4 1552 150 9 5 1047 156 6 6 1979 182 11 7 1822 156 12 8 1253 132 10 9 1297 137 9 10 946 113 9 11 1713 137 15 12 1024 117 11 13 2131 170 14 14 1550 182 8 15 1884 162 11 16 2041 184 10 答:(1)图形如下:
观察值 价格 年代 投标人数 17 854 143 6 18 1483 159 9 19 1055 108 14 20 1545 175 8 21 729 108 6 22 1792 179 9 23 1175 111 15 24 1593 187 8 25 1147 137 8 26 1092 153 6 27 1152 117 13 28 1336 126 10 29 785 111 7 30 744 115 7 31 1356 194 5 32 1262 168 7
从图中可知,投标人越多,古董钟的价格会越高,这或许是古董钟拍卖市场的规律。初次估计时,可以用线性模型来拟合价格和年限之间的关系,但同样用线性模型来拟合价格和投标人数的关系就显得过于粗略了。
(2)投标者人数同年限的散点图如下图所示:
散点图显示,钟表年限同投标者人数大致呈负相关关系,但这种关系并不明显。这可能是因为钟表的年限越高,价格越高,而有能力参与投标的人也就越少。
20.参考本章讨论的数学S.A.T分数一例。教材表2-4给出了计算OLS估计量必需的原始数据。观察Y(实
?(估计值)并作图。散点图说明了什么?如果认为拟合的模型(教材方程(2-20))是“好的”模型,际值)和Y散点图的形状应该是怎样的?下一章将讨论“好的”模型看起来是什么样子。
?的散点图如下。 答:被解释变量的实际值Y(数据见教材表2-4)和拟合值Y
如果模型拟合得好,被解释变量的实际值和拟合值则较为接近。如果模型是完美拟合的,则上述散点图应是一条直线。
21.表2-15(参见网上教材)给出了1972~2007年男、女生S.A.T词汇和数学分数。
(1)假设想要根据男生的词汇分数(X)预测其数学分数(Y),建立合适的线性回归模型并估计参数。 (2)解释回归结果。
(3)颠倒一下Y和X的角色,做词汇分数对数学分数的回归,解释回归结果。
(4)令a2为数学对词汇分数回归中的斜率系数,b2为词汇对数学分数回归中的斜率系数。把这两个系数相乘,并与两个回归方程的r值进行比较。得出什么样的结论?
答:(1)Male Math=511.607+0.0259MaleCR。
(2)该回归结果表明,男生的词汇(critical reading score)每上升一单位,男生的数学成绩平均上升0.0259个单位。
(3)Male CR=499.734+0.0196Male Math。
该回归结果表明,男生的数学成绩每上升一单位。其词汇得分平均上升0.0196个单位。 (4)将上述两个回归模型的斜率估计值相乘,可得0.0259×00196=0.0005。
在第3章我们将会介绍r,其衡量了回归线对数据的拟合程度。上述两个模型的r均是0.0005,即两个回归模型斜率估计值的乘积。值得注意的一点是,在二元回归模型中,无论是Y对X回归还是X对Y回归,r值均相同。
22.表2-16(参见网上教材)给出了不同国家1960~1974年间投资率和储蓄率的数据,两个指标都是用其占GDP的比重来度量。
(1)以投资率为纵轴,储蓄率为横轴作图。
2222
(2)通过上图,观察出一条合适的曲线。 (3)估计下面的模型:
ipergdpi?B1?B2spergdpi?ui
(4)解释回归系数。
(5)从分析中你能得出什么结论? 答:略。
三、选作题 23.证明:证明:
?e?0,从而证明:e?0。
i?e???Y?b?bX??nY???Y?bX??b?X?bii12i22i1?Y?b2X?
?nY?nY?b2nX?b2nX?0
24.证明:证明:
?exii?0。
?eiXi???Yi?b1?b2Xi?Xi??YiXi?b1?Xi?b2?Xi?0
25.证明:证明:
2?eY??0,即对残差e与Y估计值之积求和为零。
iiii???e?b?bX??b?e?b?eX?eYiii12i1i2ii?0
?,即Y的实际均值与Y估计值的均值相同。 26.证明:Y?Y??e,两边同时对i求和,可得: 证明:因为有Yi?Yii???e
?Y??Yiii两边同时除以n可得:
?Y/n??Y?/n??e/n
iii因为上式的最后一项等于0,因此得证。
27.证明:证明:
?xy??xY??Xyiiiiiiiiii,其中,xi?(Xi?X),yi?(Yi?Y)。
iiii?xy??x?Y?Y???xY?Y?x??xY,因为Y为常数且?x???Xii?X?0,本
?问题中的另一个表达式也可以通过类似的方法来推导。
28.证明:证明:
i?x??y?0,其中,x?(Xiiiii?X),yi?(Yi?Y)。
?x???X?X??Xi?nX?nX?nX?0,第一个等号是因为X常数,第二个等号是因为
?X??Xi/n。
相似的推导过程
?y同样适用。牢记一个随机变量的离差平方和为零是十分有益的。
i
29.利用数学S.A.T分数一例的数据验证习题22(保留舍入误差)。 答:该问题的证明过程比较简单,保存舍入误差。
第三章 双变量模型:假设检验
3.1 复习笔记
一、古典线性回归模型
古典线性回归模型假定如下:
假定1:回归模型是参数线性的,但不一定是变量线性的。回归模型形式如下:
Yi?B1?B2Xi?ui
这个模型可以扩展到多个解释变量的情形。
假定2:解释变量X与扰动误差项u不相关。但是,如果X是非随机的(即为固定值),则该假定自动满足。即使X值是随机的,如果样本容量足够大,也不会对分析产生严重影响。
假定3:给定X,扰动项的期望或均值为零。即
E(u|Xi)?0 (3-1)
假定4:ui的方差为常数,或同方差,即
var(ui)??2 (3-2)
假定5:无自相关假定,即两个误差项之间不相关。
cov(ui,uj)?0 i?j (3-3)
无自相关假定表明误差ui是随机的。由于假定任何两个误差项不相关,所以任何两个Y值也是不相关的,即cov(Yi,Yj)?0。由于Yi?B1?B2Xi?ui,则给定B值和X值,Y随u的变化而变化。因此,如果u是不相关的,则Y也是不相关的。
假定6:回归模型是正确设定的。换句话说,实证分析的模型不存在设定偏差或设定误差。 这一假定表明,模型中包括了所有影响变量。
二、普通最小二乘估计量的方差与标准误
有了上述这些假定就能够估计出OLS估计量的方差和标准误。由此可知,教材式(2-16)和教材式(2-17)给出的OLS估计量是随机变量,因为其值随样本的不同而变化。这种抽样变异性通常由估计量的方差或其标准误(方差的平方根)来度量。教材式(2-16)和式(2-17)中OLS估计量的方差及标准误是:
var?b1???b12?X?n?x22? (3-4) 2iise(b1)?var(b1) (3-5) var(b2)=??2b2?2?x2i (3-6)
(3-7) se(b2)=var(b2)其中,var表示方差,se表示标准误,?2是扰动项ui的方差。根据同方差假定,每一个ui具有相同的方差
?2。
一旦知道了?2,就很容易计算等式右边的项,从而求得OLS估计量的方差和标准误。根据下式估计?2: