9.8 问题可通过使用一个F检验来回答,但最容易的方法是采用两年的混合数据估计下面
的回归方程:
DVDEXP = β0 +β1INCOME +β2PRICE +β3RAINFALL +β4YEAR2 + u 其中YEAR2=1,若观测值来自第二年的数据;0,其它
回归结果如下:
Dependent Variable is DVDEXP
Variable Constant INCOME PRICE RAINFALL YEAR2
Coefficient 86.04
0.06 -3.20 7.46 -5.21
Standard Error
24.39 0.01 0.90 2.40 6.59
t-Statistic
3.53 6.22 -3.57 3.11 -0.79
p-Value 0.00 0.00 0.00 0.01 0.44
Observations: 24 2
R = 0.79
2
Adjusted R = 0.74
Residual Sum of Squares = 4877.24 F-statistic = 18.18
对β4进行t检验显示,YEAR2统计上不显著,表明不需要固定效应模型。由于仅有两年的
数据,因而可以用t检验来替代F检验,检验是否需要固定效应模型。
第十章 定性选择模型
10.1 一般来说,普通最小二乘法不是估计定性选择模型的好方法,这是因为OLS假定因变量和自变量之间存在线性关系,但是对于定性选择模型,二者关系通常不是线性的。具体说来,有以下三个问题:
(1)因变量拟合值代表概率,但它们常常小于0或大于1,而概率值是不可能取这类值的; (2)往往存在异方差性; (3)扰动项不服从正态分布。
10.2 没有问题。两种方法得到的斜率估计值不同是因为估计方法不同。Probit估计是基于累积正态概率分布,而logit估计是基于累积logistic分布。
10.3 一个事件发生的机会是该事件发生的概率除以该事件不发生的概率。如果P是因变量
等于1的概率,那么因变量等于1的机会是P/(1-P).。logit模型的拟合值是因变量等于1的机会的自然对数。
31
10.4 (1) 不是。拟合值0.48的含义是,考虑家庭的收入、孩子的数目以及房价等因素,
该家庭将买房的概率估计值为0.48;
(2)不会。因为估计的概率小于0.5,因此预测为0。
(3)若该家庭买了房,不会惊讶。因为买房的估计概率接近0.5,0.48仅仅是估计概
率。同时,即便估计值完全正确,它也只是个概率。如果估计概率是0.9,我们预测该家庭将买房,但我们仍有10%的错误机会:该家庭继续租房;
10.5(1)PRICE和CHILDREN不变的情况下,INCOME增加一个单位(1000元),则该家庭将买房的概率增加0.005;
INCOME和CHILDREN不变的情况下,PRICE上升一个单位(1000元),则该家庭将买房的概率减少0.008;
INCOME和PRICE不变的情况下,该家庭添一个小孩,则该家庭将买房的概率增加0.3。 (2)若采用logit模型,因变量将是ln[HOME/(1-HOME)],每个斜率系数被解释为对
机会的对数的影响。
10.6 (1)86.7%;(2)78.6%;(3)93.8%
10.7 (1)估计方程(10.11),比较CAND1的拟合值和实际值,将大于等于0.5的拟合值记入支持候选人甲(CAND1)的预测值。用全部观测值进行回归,但只用CAND1等于1的观测值来计算预测正确的观测值的百分比,答案是11/14或78.6%. (2)估计方程(10.12),其它步骤与(1)同,答案是7/10或70%.
(3)为回答此问题,第一步是找出甲(CAND1)和丙(CAND3)都等于0的所有观测值。
因为所有支持丙的观测值都包含在表10-6中,在表10-1中被省略,因而支持乙(CAND2)的观测值就是在表10-1中甲(CAND1)等于0的观测值。对于这些观测值,逐个检查甲和丙在上面两个回归中的拟合值,对于某观测值,如果CAND1和CAND3的拟合值都小于0.5,则模型预测该选民不支持甲和丙,而必支持乙,该观测值预测正确。如果CAND1或CAND3的拟合值大于等于0.5,则模型预测该选民支持甲或丙,而不支持乙,该观测值预测不正确。答案是12/16或75%. (4)将上面三问中预测正确的观测值数目加在一起,11+7+12=30,即对30个观测值
预测正确,由于观测值总数是30,因此预测正确的观测值的总百分比是75%.
10.8 证:
logF(zi)1?F(zi)exp(zi)exp(zi)1?exp(zi)1?exp(zi) ?log?logexp(zi)1?exp(zi)?exp(zi)1?1?exp(zi)1?exp(zi)exp(zi)1?exp(zi)?log?logexp(zi)?zi11?exp(zi)
32