stata建模中的各种小问题(我的笔记) 下载本文

保存估计结果的命令:est store 名称 使用保存结果的命令:,estimates(名称) 如果你把那个显示你用过的命令的窗口: 窗口操作:Windows——Review 如果你把那个显示变量的窗口: 窗口操作:Windows——Variables 时间序列填充和扩展时间区间:

命令:tsappend ,add(n) 增加n个观测值

窗口操作:在上面找data edit 即像一个表格一样的图标点开即可编辑数据 时间序列存在间断点问题,需要补齐处理: 命令:tsfill 信息准则

赤池信息准则(AIC)——判断判断模型的最大滞后阶数 STATA命令: 1. 先回归 2. estat ic

如何看AIC统计量:

Breusch-Pagan,Cook-Weisberg异方差检验 STATA命令: 1. 先回归

2. estat hettest [varlist] 或者在Statistics——Postestimation(倒数第二个)——Reports and

Statistics(倒数第二个)——在里面选择(hettest) 如何看统计量: White异方差检验: STATA命令: 3. 先回归

4. estat imtest,white [varlist] 或者在Statistics——Postestimation(倒数第二个)——Reports

and Statistics(倒数第二个)——在里面选择(imtest) 如何看统计量:

Ramsey回归设定误差检验: STATA命令: 1. 先回归

2. estat ovtest 或者在Statistics——Postestimation(倒数第二个)——Reports and Statistics(倒

数第二个)——在里面选择(ovtest) 如何看统计量:

多重共线性方差膨胀因子检验: 1. 先回归

2. estat vif[,uncentered] 或者在Statistics——Postestimation(倒数第二个)——Reports and

Statistics(倒数第二个)——在里面选择(vif) 如何看统计量:

一般的当最大的方差膨胀因子超过10(相对保守的临界值定位30)后者平均方差膨胀因子超过1表示模型存在多重共线性的问题。Uncentered用于当模型没有常数项时的未中心化的方差膨胀因子。

多重共线性的其他侦查方法:

值高而显着的t比率小:多重共线性的“经典”征兆 克里安经验法则:仅当来自一个辅助回归的 R 2 大于得自Y对全部回归元中的总 R 2 时,多重共线性才算是一个麻烦的问题。 做拟合图(前提是先回归) STATA命令:

1. 解释变量对成分残差图——用于考察模型形式是否设定准确。 cprplot 被解释变量 acprplot 被解释变量

2. 增加变量图——用于考察数据是否存在异常值 avplotd 被解释变量

3. 拟合值对残差图的散点图——用于考察残差是否满足经典的假设条件 rvfplot

4. 解释变量对残差的散点图 stdp表示样本内预测的标rvpplot 被解释变量 准差 stdr 表示样本外预测的标STATA对于数据的储存与重现 准差 R2est命令的用法: (1)储存回归结果:

reg y x1 x2 x3(不限于reg,也可储存ivreg、mvreg、reg3) est store A

(2)重现回归结果: est replay A

(3)对回归结果进行进一步分析

est for A:sum(对A回归结果中的各个变量运行sum命令) 在非时间序列的数据的情况下, 异方差的修正——用GLS

具体的方法如下:

1.quietly regress y x 做回归 2.predict u,residual 取残差

3.predict yf,xb (xb表示拟合值) 将拟合值取出放到yf里 4.gen lnu2=ln(u^2) 将残差做平方且取对数的处理

5.gen yf2=yf^2(将yf这个拟合值同上面的残差做相同的处理)

6.quietly regress lnu2 yf yf2 对处理过的残差对 拟合值 以及 处理过的拟合值 做回归 7.predictnl u2f=exp(xb()) 再将回归后的拟合值取出并作对数处理放到 u2f里 8.gen sd=sqrt(u2f) 将u2f做平方处理 然后,利用vwls进行加权估计

predictnl表示模型估计后的非线性预测,比如指数预测 xb表示线性预测 exp表示指数预测 pr表示概率预测 vwls y x , sd(sd)

GLS也可以通过regress命令中的weight选项来实现。

存在自相关的修正——用广义差分 自相关的修正——用广义差分

el(mat,i,j)矩阵的第i具体的方法如下:

行第j列 1. 一阶自相关的修正

prais y x,rhotype(regress) prais y x,corc rhotype(regress)

2. 高阶自相关的修正——以二阶自回归为例

①quietly regress D.y x 对被解释变量取差分并且做回归 ②predict u,resid 取出残差

③quietly reg u l(2).u,noconstant 令u对其二阶滞后期做自回归(无截距)

④matrix mat=e(b) 生成矩阵mat 将回归的结果放到矩阵里(如果是更高阶可能有多个自相关系数)

⑤gen m=d.y-el(mat,1,1)*l(2)d.y 对y的一阶差分与y的一阶差分的滞后期与权重的乘积做差分,这个权重就是mat矩阵里的第一行第一列的系数,刚好使我们刚刚回归出来的自相关系数(如果是高阶可能不只做一个差分,会更为复杂)

⑥gen n=d.x-el(mat,1,1)*l(2)d.x 对x进行和y一样的处理方法 ⑦reg m n 然后令m对n做回归

关于参数约束的模型估计问题(P178张晓峒)

STATA命令:

cnsreg 被解释变量 解释变量 [条件if] [in] [weight] ,constraints(constraints) [options] 其中constraints(constraints)表示线性约束 例如:

约束规模报酬不变的估计模型 命令如下:

1. constraint define 1 lnk+lnl=1 将等于1的线性约束(不可以为不等号)条件定义为1 2. cnsreg lny lnk lnl ,constraints(1) 约束为lnk=lnl=0的估计模型: 命令如下:

1. constraint define 2 lnk lnl 等于0的条件可以不写出来 2. cnsreg lny lnk lnl,constraints(2)

约束条件为lnk=0.6, lnl=0.4的估计模型: 命令如下:

1. constraint define 3 lnk=0.6 2. constraint define 3 lnl=0.4

3. cnsreg lny lnk lnl,constraints(3,4)

注意:要先有约束条件的定义,然后再做约束性回归。