?,再做如下回归: 采用工具变量法:先求Yt关于X1t与X2t回归,得到Yt
???Yt??0??1X1t??2X2t??3Yt?1t试问:这一方法能否消除原模型中Yt?1与?t的相关性?为什么?
3、以某地区22年的年度数据估计了如下工业就业回归方程
Y??3.89?0.51lnX1?0.25lnX2?0.62lnX3
(-0.56)(2.3) (-1.7) (5.8)
R?0.996 DW?1.147
式中,Y为总就业量;X1为总收入;X2为平均月工资率;X3为地方政府的总支出。 (1)试证明:一阶自相关的DW检验是无定论的(取显著性水平??0.05)。 (2)逐步描述如何使用LM统计量进行一阶自相关检验
2
第八章 虚拟变量模型
一、名词解释
1、虚拟变量
2、虚拟变量陷阱
二、单项选择题
1、某商品需求函数为Yi??0??1Xi??i,其中Y为需求量,X为价格。为了 考虑“地区”(农村、城市)和“季节”(春、夏、秋、冬)两个因素的影响,
拟引入虚拟变量,则应引入虚拟变量的个数为 ( ) A、2 B、4 C、5 D、6
??100.50?55.35D?0.45X,其中C为消费,2、根据样本资料建立某消费函数如下:CttX为收入,虚拟变量D???1 城镇家庭?0 农村家庭,所有参数均检验显著,则城镇家庭的消费函数
为 ( )
??155.85?0.45X B、C??100.50?0.45X A、Ctttt??100.50?55.35X D、C??100.95?55.35X C、Ctttt3、假设某需求函数为Yi??0??1Xi??i,为了考虑“季节”因素(春、夏、秋、冬四个不同的状态),引入4个虚拟变量形成截距变动模型,则模型的 ( ) A、参数估计量将达到最大精度 B、参数估计量是有偏估计量 C、参数估计量是非一致估计量 D、参数将无法估计
4、对于模型Yi??0??1Xi??i,为了考虑“地区”因素(北方、南方),引入2个虚拟变量形成截距变动模型,则会产生 ( ) A、序列的完全相关 B、序列的不完全相关 C、完全多重共线性 D、不完全多重共线性 5、设消费函数为Yi??0??1D??0Xi??1DXi??i,其中虚拟变量D???1 城镇家庭?0 农村家庭,
当统计检验表明下列哪项成立时,表示城镇家庭与农村家庭有一样的消费行为 ( ) A、?1?0,?1?0 B、?1?0,?1?0 C、?1?0,?1?0 D、?1?0,?1?0 6、设消费函数Yi??0??1D??Xi??i,其中虚拟变量D???1 北方?0 南方,如果统计检验表
明?1?1成立,则北方的消费函数与南方的消费函数是 ( ) A、相互平行的 B、相互垂直的 C、相互交叉的 D、相互重叠的
7、假定月收入水平在1000元以内时,居民边际消费倾向维持在某一水平,当月收入水平达到或超过1000元时,边际消费倾向将明显下降,则描述消费(C)依收入(I)变动的线性关系宜采用 ( )
?0 I<1000元A、Ct??0??1It??2DIt??t, D??
1 I?1000元?B、Ct??0??1D??2It??t, D???0 I<1000元
?1 I?1000元?0 I<1000元C、Ct??0??1(It?I)D??t, I?1000元, D??
1 I?1000元?**D、Ct??0??1It??2(It?I)D??t, I?1000元, D??**?0 I<1000元
?1 I?1000元8、虚拟变量 ( )
A、主要来代表质的因素,但在有些情况下可以用来代表数量因素 B、主能代表质的因素 C、只能代表数量因素 D、只能代表季节影响因素
9、如果一个模型中不包含截距项,对一个具有m个特征的质的因素要引入虚拟变量的数目为 ( ) A、m B、m-1 C、m-2 D、m+1
10、由于引入虚拟变量,回归模型的截距项和斜率都发生变换,则这种模型称为 A、平行模型 B、重合模型 C、汇合模型 D、相异模型
三、多项选择题
1、关于虚拟变量,下列表述正确的有 A、是质的因素的数量变化 B、一般情况下取值为1和0 C、代表质的因素 D、在有些情况下可以代表数量因素 E、代表数量因素
2、在线性模型中引入虚拟变量,可以反映 A、截距项变动 B、斜率变动 C、截距项和斜率同时变动 D、分段回归 E、以上都可以
3、关于虚拟变量设置原则,下列表述正确的有 A、当定性因素有m个类别时,引入m-1个虚拟变量
B、当定性因素有m个类别时,引入m个虚拟变量,会产生多重共线性问题 C、虚拟变量的值只能去0和1
D、在虚拟变量的设置中,基础类别一般取值为0 E、以上说法都正确
四、判断题,并说明理由
1、在回归模型Yi??0??1Xi??2Di??i中,如果虚拟变量Di的取值为0或2,而非通常情况下的0或1,那么,参数?0、?1、?2的估计值将减半。 理由:
) ) ) ) ) ( ( ( (
(
2、在引入虚拟变量后,OLS估计量的性质受到了影响。 ( )
理由:
五、计算分析题
1、一个由容量为209的样本估计的解释CEO薪水的方程为
LnY?4.59?0.257LnX1?0.011X2?0.158D1?0.181D2?0.283D3
(15.3)(8.03) (2.75) (1.775) (2.130) (-2.895)
其中,Y表示年薪水平(单位:万元),X1表示年销售收入(单位:万元),X2表示公司股票收益(单位:万元),D1,D2,D3均为虚拟变量,分别表示金融业、消费品行业、公用事业。假定对比行业为交通运输业。 (1)解释三个虚拟变量参数的经济含义
(2)保持X1和X2不变,计算公用事业和交通运输业之间估计薪水的近似百分比差异。
这个差异在1%的显著性水平上是统计显著的吗?
(3)消费品行业和金融业之间的估计薪水的近似百分比差异是多少?写出一个使你能
直接检验这个差异是否统计显著的方程。
2、为了研究体重与身高的关系,某学校随机抽样调查了51名学生(男生36名,女生15名),并得到如下两种回归模型: (a)W??232.06551?5.5662h (-5.21) (8.62)
(b)W??122.9621?23.8238D?3.7402h (-2.59) (4.01) (5.16)
其中,W表示体重(单位:磅),h表示身高(单位:英寸),虚拟变量 D=1, 表示男, D=0,表示女。回答下面的问题: (1)你将选择哪个模型?为什么?
(2)如果模型b确实更好而你选择了a,你犯了什么错误?
(3)D的系数说明了什么?
3、假设利率r?0.08时,投资I取决于利润X;而利率r?0.08时,投资I同时取决于利润X和一个固定的级差利润R。试用一个可以检验的模型来表达上述关系,并简述如何对利率的影响进行检验。
4、根据美国1961年第一季度至1977年第二季度的季度数据,我们得到了如下的咖啡需求函数的回归方程:
??1.2789?0.1647lnP?0.5115lnI?0.1483lnP??0.0089T?0.0961D lnQtttt1t(?2.14) (1.23) (0.55) (?3.36) (?3.74)
?0.1570D2t?0.0097D3t
(?6.03) (?0.37)
R2?0.80
其中:Q——人均咖啡消费量(单位:磅)
P——咖啡的价格
I——人均收入 P?——茶的价格
T——时间趋势变量(1961年第一季度为1,……1977年第二季度为66)
D1=??1?0第一季度其它?1; D2=??0第二季度其它1; D3=???0第三季度其它
要求回答下列问题:
(1)模型中P、I和P?的系数的经济含义是什么? (2)咖啡的价格需求是否很有弹性? (3)咖啡和茶是互补品还是替代品? (4)如何解释时间变量T的系数? (5)如何解释模型中虚拟变量的作用? (6)哪些虚拟变量在统计上是显著的? (7)咖啡的需求是否存在季节效应?