福格勒(Fogler)和加纳帕希(Ganapathy)根据1956~1976年240个月度数据,得到IBM股票的回归方程,市场指数采用的是作者在芝加哥大学建立的市场有价证券指数:
?t?0.7264?1.0598rmtrse??0.3001?(1)解释估计的斜率与截距。 (2)如何解释r?
2?0.0728?r2?0.4710
(3)beta系数大于1的证券称为不稳定证券。建立适当的零假设及备择假设。并用t检验进行假设检验(??5%)。
答:(1)斜率系数为1.0598,其经济意义为在1956~1976年间,市场有价证券收益率每上升1个百分点,IBM股票的平均收益率上升约1.06个百分点。若同时期的市场有价证券收益率为零,IBM股票的平均收益率约为0.73%,当然这是不符合经济学常识的。
(2)有价证券收益率(的变异程度)可以解释IBM股票收益率变异程度的47%。
(3)H0:B2?1,H1:B2?1,t??1.0598?1??0.82140.0728。
该检验的自由度为238,通过检验可知B2没有通过显著性水平为5%的统计性检验(单边检验)。因此,在所研究的样本区间内,IBM股票的贝塔系数并不显著的不等于1。这意味着于整个股票市场来讲,IBM的增长势头并不是十分强劲。
9.根据X和Y的10组观察值得到如下数据。
?Y?1110;?X?1680;?XY?204200; ?X?315400;?Y?133300iiii22ii假定满足CLRM的所有假定,求 (1)b1和b2。 (2)b1和b2的标准误。 (3)r。
(4)对B1、B2分别建立95%的置信区间。
(5)根据(4)建立的置信区间,能否接受零假设:B2=0? 答:(1)b1?2111;b2?0.5344。 (2)se?b1?=8.5894;se?b2?=0.0484。 (3)r=0.9385。
22B1置信水平为95%的置信区间为B2置信水平为95%的置信区间为(4)(1.4128,41.0272),(0.4228,0.6460)。
(5)拒绝H0,因为上述置信区间中不包含B2?0。
10.根据美国1970~1983年的数据(参见网上教材表3-4),得到如下回归结果:
GNPt??995.5183?8.7503M1t????r2?0.9488se???t???3.8258??0.3214???
其中,GNP是国民生产总值(10亿美元),M1是货币供给(10亿美元)。 注:M1包括现金、活期存款、旅游支票等。
(1)填充括号内缺省的数值。
(2)货币学家认为:货币供给对GNP有显著的正面影响,如何检验这个假设? (3)负的截距有什么意义?
(4)假定2007年M1为7500亿美元,预测该年平均的GNP? 答:(1)完整的回归结果如下:
GNPt??995.5183?8.7503M1tse??260.2128?t???3.8258?(2)H0:B2?0,H0:B2?0。拒绝零假设。 (3)这里负的截距项没有特殊的经济学意义。
?0.3214??27.2230?R2?0.9488
?(4)GNP2007??995.5183?8.7503?750?55670。
11.政治的经济周期:经济事件会影响总统选举吗?为了检验政治周期理论,格雷(GarySmith)20根据1928~1980年每四年(即1928,1932,…)总统选举的数据得到如下回归结果:
??53.10?1.70XYttt??34.10???2.67?r?0.372
其中,Y表示在职总统收到的公众投票(%),X表示失业的变化率——选取当年的失业率减去上一年的失
业率。
(1)先验地,预期X的符号为正还是负?
(2)该回归结果证实了政治周期理论吗?写出求证过程。 (3)1984~1988年总统选举的结果是否验证了该理论?
(4)如何计算b1和b2的标准误? 答:(1)负的。
(2)是的。本例中,n?14(1928~1980年间共有14次大选),因此自由度为12。显著性水平为5%时,
。 t统计量是显著的(t统计量为-2.67,检验为单边检验)
(3)可能。但罗纳德·里根的个人知名度也是其能赢得1984年大选的重要原因之一。
(4)因为当零假设为真,即Bi等于零时,t?bi/se?bi?,经变换可得se?bi??bi/t。在当前的例子中,其标准误分别为1.5572和0.6367。 12.为了研究美国制造业设备利用率与通货膨胀之间的关系,得到表3-5的数据(参见网上教材)。其中,Y=通胀率(用GDP价格平减指数的变化率来度量),X=制造业设备利用率。
(1)先验地,预期设备利用率与通货膨胀之间有怎样的关系?理论基础是什么? (2)做Y对X的回归,并按照教材式(3-46)的形式报告回归结果。 (3)回归方程中的斜率是统计显著的吗? (4)它是否显著不为1?
(5)设备自然利用率定义为当Y为零时的值。求样本期内设备自然利用率? 答:(1)可能正相关也可能负相关。如果产出的增加是因为设备利用率的增长的话,价格(通货膨胀)增长速度就会缓慢下降。但是如果当前的设备利用率水平已经处于最佳水平,此时总需求的增加将会推动价格水平的上涨。
(2)EViews的数据结果如下:
Dependent Variable:INFLATION Sample:1960 2007 Variable Coefficient Std Error t-Statistic Prob C 5.9531476 7.76210416 0.7669918 0.4470 CAPACITY -0021545 0.095918 -0.224615 0.82303 R-squared 0.001096 (3)虽然斜率的估计值为负,但其在统计上并不显著,因为p值很高。 (4)是的。在零假设为真的条件下,即斜率为1,估计量的t统计量为
t??0.0215?1
0.0959得到上述大小的t统计量的概率几乎为零,因此可拒绝零假设。
(5)解方程5.9535?0.0215C?0,可得C?276.91,并称其为设备自然利用率。
注意:上述回归结果是不显著的,而且估计出的自然设备利用率高达276.91也是有问题的,因为该数值不应该超过100。上述回归之所以失效,是因为20世纪70年代出现了高通胀率且在70年代中期出现了滞涨。如果去掉70年代的数据,即运用1982~2001年的数据进行回归,就会得到较为合理且统计上显著的结果,不难发现,此时估计出的自然设备利用率为93.90。
13.反向回归。继续习题12,但现在做X对Y的回归。 (1)报告回归结果,并解释回归结果。
(2)如果把两个回归的斜率系数相乘,得到什么结果?
(3)习题12中的回归称为直接回归。什么时候采取反向回归是适合的?
(4)假定X与Y的r为1。是否意味着Y对X的回归与X对Y的回归没什么差别? 答:(1)EViews的数据结果如下:
Dependent Variable:CAPACITY Sample:1960 2007 Variable Coefficient Std. Error t-Statistic Prob C 81.0226 1.147241 70.6238 0.0000 INFLATION -0.05085 0.226396 -0.22462 0.8223 R-squared 0.00011 注意:该回归的回归系数也是不显著的,原因与之前所述的相同。
(2)上述两个回归中斜率估计值的乘积为0.0011,与两个回归模型的R相同。曾经在练习2.21中讨论过这个问题。
(3)考虑另外一个例子。令Y为职工工资,X为职工学历水平。马达拉的研究表明,以Y为被解释变量,X为解释变量进行回归可以检验具有相同学历的男职工和女职工是否获得相同的工资,而以X为被解释变量,
女职工的学历水平是否相同。而后者可以用来说明在工Y为解释变量进行回归可以检验获得相同工资水平的男、
资发放过程中是否存在性别歧视。
(4)不是。
14.表3-1给出了1974~1986年美国制造业税后利润X(100万美元)以及3月期现金利息Y(100万美元)的数据。
表3-1 美国制造业现金利息(Y)与税后利润(X) 年 份 Y X 年 份 Y X 22
1974 19 467 58 747 1975 19 968 49 135 1976 22 763 64 519 1977 26 585 70 366 1978 28 932 81 148 1979 32 491 98 698 1980 36 495 92 579 1981 40 317 101 302 1982 41 259 71 028 1983 41 624 85 834 1984 45 102 107 648 1985 45 517 87 648 1986 46 044 83 121 资料来源:Business Statistics,1986,U.S.Department of Commerce,Bureau of Economic Analysis,December1987,P.72.
(1)预期现金利息与税后利润的关系如何? (2)做Y对X的散点图。
(3)该散点图是否与预期相符?
(4)如果是,做Y对X的OLS回归,并给出常用统计量。
(5)对斜率建立一个99%置信区间,并检验假设:真实的斜率为零;即现金利息与税后利润之间不相关。 答:(1)正相关。 (2)、(3)从散点图看,虽然存在个别的异常值,但总体上讲,显示两者之间存在正相关关系。 (4)回归结果如下:
??373.3014?0.4199XYttse??9530.3786?t??0.0392??0.1154??0.1154?R2?0.5464
(5)置信水平为99%的置信区间为?0.0615,0.778?。
因为置信区间中不包含0,所以可以拒绝零假设。
15.参考表2-15给出的S.A.T数据(参见网上教材)。根据如下回归方程,通过女学生的数学分数来预测男生的数学分数:
Yt?B1?B2Xt?ut
其中Y和X分别代表男、女生的数学分数。 (1)估计上述回归方程,给出常用的统计量。 (2)检验假设:Y与X不相关。
(3)假定2008年女生的数学分数为490,预测该年男生的数学平均分数。 (4)对(3)的预测值建立一个95%的置信区间。 答:(1)回归结果如下:
?MATHMt?198.7370?0.6705MATHFMtse??12.8754??0.0265?t??15.4354??25.3325??(3)MATHM2008?527.282?527。
(4)置信区间为?526.7373,527.8090?。
R2?0.9497(2)拒绝零假设,因为t值为25.3325远远大于显著性水平为0.001时的临界值。
16.重复习题15,但令Y和X分别代表男、女生逻辑分数,并假定2008年女生的逻辑分数为505。 解答:(1)回归结果如下:
??132.7778?0.75FemaleCRMaleCRttse??33.7245?(2)因为t值很大,因此可拒绝零假设。
?0.0265?t??15.4354??25.3325??(3)MaleCR2008?511.528。
(4)置信区间为?510.5676,512.4879?。
17.考虑下面的回归结果:
R2?0.9497???0.17?5.26XYttt???1.73?2?2.71?
R?0.10DW?2.01其中,Y——当年1月份到次年1月份股票价格指数的实际收益;X——去年总股息与去年股票价格指数
之比;t——时间。
注:DW统计量参见第10章。 时间从1926~1982年。
R2表示经过校正的判定系数。DW统计量是自相关的度量指标,将在随后章节中进一步解释。
(1)如何解释上述回归方程?
(2)如果接受了上面的结论,是不是意味着:当股息/价格比很高时,最好的投资策略是投资股票? (3)如果想知道(2)的答案,参阅希勒的分析。 答:(1)本年的股票价格指数实际收益率和上一年的总股息和股票价格指数比之间呈正相关关系,后者每提高一单位,实际收益将平均上升5.26个百分点。而截距项的估计值没有实际的经济学意义。
(2)如果上述回归结果成立,这将对当代金融的有效市场假说产生重大影响。
18.参考教材例2-1(受教育年限与平均小时收入)。教材表2-5给出了相应数据,教材式(2-21)给出了回归结果。
(1)求截距和斜率的标准误以及r。
(2)检验假设:受教育年限对平均小时工资没有影响?你使用哪种检验?为什么?
(3)如果拒绝(2)中的零假设,那么是否也拒绝假设:教材式(2-21)中的斜率系数显著不为1?给出必要的计算。
答:(1)EViews的回归结果如下: Dependent Variable:AVGHWAGE Sample:1 13 Variable Coefficient Std. Error t-Statistic Prob C -0.014 453 0.874 624 -0.016 525 0.9871 YEARSSCH 0.724 097 0.069 581 10.40648 0.0000 R-squared 0.907791 (2)可以拒绝零假设,因为t值很大,且其p值几乎为零。 (3)t?20.7204?1??3.9712,经检验可知,t统计量是显著的,得到上述t值的p值为0.0011(双边检
0.0695验),因此可以拒绝零假设。认为教育水平的估计系数是显著不为1的。
19.教材例2-2讨论了奥肯定律,见教材式(2-22)。这个方程还可以写成Xt?B1?B2Yt,其中,X=实际产出增长率(即GDP增长率),Y=失业率的变化率(%)。利用表2-13中的数据(见网上教材)。