序号 1 2 3 4 5 ∑ Yt Xt 1 3 5 2 4 6 11 17 8 13 yt?Yt?Y xt?Xt?X xtyt -2 0 2 -1 1 0 -5 0 6 -3 2 0 10 0 12 3 2 27 xt2 yt2 Xt2 25 0 36 9 4 74 4 0 4 1 1 10 36 121 289 64 169 679 15 55 Y??Ytn?15/5?3 X??Xtn?55/5?11
??xy??tt?x2t?27/74?0.365?*X?3?0.365*11??1.015 ??Y??????1.015?0.365X 我们有:Ytt (2)
?xy)(n?2)?(10?0.365*27)/3?0.048 ?2??et2(n?2)?(?yt2???ttR2?(?xtyt?xt222y)?(27/74*10)?0.985 ?t2?=-1.015+0.365*10=2.635 (3) 对于X0=10 ,点预测值 Y0Y0 的95%置信区间为:
2??t?Y(5?2)*?1?1/n?(X?X)00.02502x?
=2.635?3.182*0.048*1?1/5?(10?11)2/74?2.635?0.770 即 1.895 -3.099,也就是说,我们有95%的把握预测Y0将位于1.865 至3.405 之间.
3.11根据上题的数据及回归结果,现有一对新观测值X0=20,Y0=7.62,试问它们是否可能来自产生样本数据的同一总体? 问题可化为“预测误差是否显著地大?”
11
???1.015?0.365?20?6.285 当X0 =20时,Y0??7.62?6.285?1.335 预测误差 e0?Y0?Y0原假设H0:E(e0)?0 备择假设H1:E(e0)?0 检验:
若H0为真,则
t?e0?E(e0)1(X0?X)2?1???n?x2?1.335?01(20?11)20.0481??574?1.335?4.021 0.332对于5-2=3个自由度,查表得5%显著性水平检验的t临界值为:
tc?3.182 结论:
由于t?4.021?3.182
故拒绝原假设H0,接受备则假设H1,即新观测值与样本观测值来自不同的总体。 3.12有人估计消费函数Ci????Yi?ui,得到如下结果(括号中数字为t值):
?= 15 + 0.81Yi R2=0.98 Ci (2.7) (6.5) n=19 (1) 检验原假设:?=0(取显著性水平为5%) (2) 计算参数估计值的标准误差;
(3) 求?的95%置信区间,这个区间包括0吗?
(1)原假设 H0:??0 备择假设 H1:??0
?检验统计量 t?(??0)?)?6.5 Se(?查t表,在5%显著水平下 t0.025(19?1?1)?2.11 ,因为t=6.5>2.11
12
故拒绝原假设,即??0,说明收入对消费有显著的影响。 (2)由回归结果,立即可得:
?)?15 Se(?2.7?5.556 ?0.125
?)?0.81Se(?6.5(3)?的95%置信区间为:
??tSe(??)?0.81?2.11*0.125?0.81?0.264??2 即为0.546~1.074,也就是说有95%的把握说?在0.546~1.074
之间,所以在这个区间中不包括0。3.13 回归之前先对数据进行处理。把名义数据转换为实际数据,公式如下: 人均消费C=C/P*100(价格指数)
人均可支配收入Y=[Yr*rpop/100+Yu*(1-rpop/100)]/P*100 农村人均消费Cr=Cr/Pr*100
城镇人均消费Cu=Cu/Pu*100
农村人均纯收入Yr=Yr/Pr*100 城镇人均可支配收入Yu=Yu/Pu*100 处理好的数据如下表所示:
年份 1985 1986 1987 1988 1989 1990 1991 1992 1993 1994 1995 1996 C 401.78 436.93 456.14 470.23 444.72 464.88 491.64 516.77 550.41 596.23 646.35 689.69 Y 478.57 507.48 524.26 522.22 502.13 547.15 568.03 620.43 665.81 723.96 780.49 848.30 Cr 317.42 336.43 353.41 360.02 339.06 354.11 366.96 372.86 382.91 410.00 449.68 500.03 13
Cu 673.20 746.66 759.84 785.96 741.38 773.09 836.27 885.34 962.85 1040.37 1105.08 1125.36 Yr 397.60 399.43 410.47 411.56 380.94 415.69 419.54 443.44 458.51 492.34 541.42 612.63 Yu 739.10 840.71 861.05 841.08 842.24 912.92 978.23 1073.28 1175.69 1275.67 1337.94 1389.35 1997 1998 1999 2000 2001 2002 2003 711.96 737.16 785.69 854.25 910.11 1032.78 1114.40 897.63 957.91 1038.97 1103.88 1198.27 1344.27 1467.11 501.75 498.38 501.88 531.89 550.11 581.95 606.90 1165.62 1213.57 1309.90 1407.33 1484.62 1703.24 1822.63 648.50 677.53 703.25 717.64 747.68 785.41 818.93 1437.05 1519.93 1661.60 1768.31 1918.23 2175.79 2371.65
根据表中的数据用软件回归结果如下:
Ct= 90.93 + 0.692Yt R2=0.997
?t: (11.45) (74.82) DW=1.15
农村:Crt= 106.41 + 0.60Yrt R2=0.979
t: (8.82) (28.42) DW=0.76
城镇:Cut= 106.41 + 0.71Yut R2=0.998
t: (13.74) (91.06) DW=2.02
从回归结果来看,三个方程的R2都很高,说明人均可支配收入较好地解释了人均消费支出。
三个消费模型中,可支配收入对人均消费的影响均是显著的,并且都大于0小于1,符合经济理论。而斜率系数最大的是城镇的斜率系数,其次是全国平均的斜率,最小的是农村的斜率。说明城镇居民的边际消费倾向高于农村居民。
??第四章 多元线性回归模型
4.1 应采用(1),因为由(2)和(3)的回归结果可知,除X1外,其余解释变量的系数均不显著。(检验过程略) 4.2 (1) 斜率系数含义如下:
14
0.273: 年净收益的土地投入弹性, 即土地投入每上升1%, 资金投入不
变的情况下, 引起年净收益上升0.273%.
0.733: 年净收益的资金投入弹性, 即资金投入每上升1%, 土地投入不变的情况下, 引起年净收益上升0.733%.
(n?1)(1?R2)8*(1?0.94)R?1??1??0.92,表明模型 拟合情况:
n?k?19?2?12拟合程度较高.
(2) 原假设 H0:??0
备择假设 H1:??0
?检验统计量 t???)?0.273/0.135?2.022 Se(?查表,t0.025(6)?2.447 因为t=2.022 备择假设 H1:??0 ??检验统计量 t??)?0.733/0.125?5.864 Se(?查表,t0.025(6)?2.447 因为t=5.864>t0.025(6),故拒绝原假设,即β显著异于0,表明资金投入变动对年净收益变动有显著的影响. (3) 原假设 H0:????0 备择假设 H1: 原假设不成立 检验统计量 R2/k0.94/2F???47 2(1?R)/(n?k?1)(1?0.94)/(9?2?1)查表,在5%显著水平下F(2,6)?5.14 因为F=47>5.14,故拒绝原假设。 结论,:土地投入和资金投入变动作为一个整体对年净收益变动有影响. 15