与时间序列相关的STATA 命令及其统计量的解析
残差U 序列相关:
①DW 统计量——针对一阶自相关的(高阶无效) STATA 命令: 1.先回归
2.直接输入dwstat 统计量如何看:查表
②Q 统计量——针对高阶自相关correlogram-Q-statistics STATA 命令: 1. 先回归reg
2. 取出残差predict u,residual(不要忘记逗号) 3. wntestq u Q
统计量如何看:p 值越小(越接近0)Q 值越大 ——表示存在自相关
具体自相关的阶数可以看自相关系数图和偏相关系数图: STATA 命令: 自相关系数图:
ac u( 残差) 或者窗口操作在 Graphics ——Time-series graphs —— correlogram(ac) 偏相关系数图:
pac u 或者窗口操作在Graphics——Time-series graphs—— (pac) 自相关与偏相关系数以及Q 统计量同时表示出来的方法: corrgram u 或者是窗口操作在
Statistics——Time-series——Graphs—— Autocorrelations&Partial autocorrelations
③LM 统计量——针对高阶自相关 STATA 命令: 1. 先回归reg
2. 直接输入命令 estate bgodfrey,lags(n) 或者窗口操作
在 Statistics— —Postestimation(倒数第二个)——Reports and Statistics(倒数第二个) ——在里面选择 Breush-Godfrey LM(当然你在里面还可以找到方差膨胀因子还有DW 统计量等常规统计量)
LM 统计量如何看:
P 值越小(越接近 0)表示越显著(显著拒绝原假设),存在序列相关 具体是几阶序列相关,你可以把滞后期写为几,当然默认是 1,(通常的方法是先看图,上面说的自相关和偏相关图以及Q 值,然后再利用LM 肯定)。
平稳时间序列存在自相关的问题的解决方案
残差出现序列相关的补救措施: 1、一阶自相关 :
最近简单的方法是用AR(1)模型补救,就是在加一个残差的滞后项即可。 2、高阶的自相关: 用AR(n)模型补救。
1
AR 模型的识别与最高阶数的确定:
可通过自相关系数来获得一些有关 AR(p) 模型的信息,如低阶 AR(p) 模型系数符号的信息。但是,对于自回归过程AR(p),自相关系数并不能帮助我们确定 AR(p) 模型的阶数 p。所以,可以考虑使用偏自相关系数?k,k,以便更加全面的描述自相关过程AR(p)的统计特征。
且对于一个AR(p) 模型,?k,k 的最高阶数为p,也即AR(p) 模型的偏自相关系数是 p 阶截尾的。因此,可以通过识别AR(p)模型的偏自相关系数的个数,来确定 AR(p) 模型的阶数 p,进而设定正确的模型形式,并通过具体的估计方法估计出AR(p) 模型的参数。
如果AR(p)还解决不了则进一步使用:MA(q)模型,以及ARMA(p,q)模型 。 1、MA(q)
MA(q) 的偏自相关系数的具体形式随着 q 的增加变得越来越复杂,很难给出一个关于 q 的一般表达式,但是,一个MA(q) 模型对应于一个AR(∞) 模型。因此,MA(q) 模型的偏自相关系数一定呈现出某种衰减的形式是拖尾的。故可以通过识别一个序列的偏自相关系数的拖尾形式,大致确定它应该服从一个MA(q) 过程。 2、ARMA(p,q)就是既含有AR 项又含有MA 项。
我们引入了自相关系数和偏自相关系数这两个统计量来识别 ARMA(p,q) 模型的系数特点和模型的阶数。但是,在实际操作中,自相关系数和偏自相关系数是通过要识别序列的样本数据估计出来的,并且随着抽样的不同而不同,其估计值只能同理论上的大致趋势保持一致,并不能精确的相同。因此,在实际的模型识别中,自相关系数和偏自相关系数只能作为模型识别过程中的一个参考,并不能通过它们准确的识别模型的具体形式。具体的模型形式,还要通过自相关和偏自相关系数给出的信息,经过反复的试验及检验,最终挑选出各项统计指标均符合要求的模型形式。
注:无论采取什么样的方式,只要能够把残差中的序列相关消除掉,又不会引入新的问题,这样的模型就是最优模型。
与平稳性检验相关的STATA命令及其统计量解析(P212 张晓峒)
白噪声检验:
1. Q 检验 wntestq var ,lag(n)
2.Bartlett 检验 wntestb var ,table(表示结果以列显示,而不做图。不加 table 就以图形的方式现实)
或者在Statistics——Time-series——TEST——Bartlett 检验(第四个)
画密度图:
1、 概率密度图
命令:pergram var ,generate(新变量名字) 将概率密度的图上所生成的值生成并储存在新变量里,这个不是必须的,只是为了日后方便。
窗口:Statistics——Time-series——Graphs——Periodogram(第五个) 2. 累积分布函数图
命令:cumsp var ,generate(新变量名字) 解释同上,并且这个生成新变量的功能似乎只能通过命令完成。
窗口:Statistics——Time-series——Graphs——Cumulative Spectral distribution
单位根检验(219)
2
1、 Dickey-Fuller 检验
命令:dfuller var (,lags(#)/trend/noconstant/regress/)
对变量做ADF 检验可以加滞后期或趋势项或不含常数项等等这些取决于你的模型。
窗口:Statistics——Time-series——TEST——ADF 单位根检验(第一个)在里面你也可以选择滞后期数,常数项等等。 如何看结果:
原假设为:至少存在一个单位根;备选假设为:序列不存在单位根。 如果统计量小于后面的显著性水平给出的值且P 值很大——有单位; 如果统计量大于后面的显著性水平给出的值且 P 值很小——无单位根
ADF 检验需要注意的地方:
(1)必须为回归定义合理的滞后阶数,通常采用AIC 准则来确定给定时间序列模型的滞后阶数。在实际应用中,还需要兼顾其他的因素,如系统的稳定性、模型的拟合优度等。 (2)可以选择常数和线性时间趋势,选择哪种形式很重要,因为检验显著性水平的 t 统计量在原假设下的渐进分布依赖于关于这些项的定义。
① 如果在检验回归中含有常数,意味着所检验的序列的均值不为 0,一个简单易行的办法是画出检验序列的曲线图,通过图形观察原序列是否在一个偏离 0 的位臵随机变动,进而决定是否在检验时添加常数项;
② 如果在检验回归中含线性趋势项,意味着原序列具有时间趋势。同样,决定是否在检验中添加时间趋势项,也可以通过画出原序列的曲线图来观察。如果图形中大致显示了被检验序列的波动趋势随时间变化而变化,那么便可以添加时间趋势项。
2、Phillips-Perron 检验
命令:pperron var , (,lags(#)/trend/noconstant/regress/)对变量做 PP 检验可以加滞后期或趋势项或不含常数项等等这些取决于你的模型。
窗口操作:Statistics——Time-series——TEST——PP 单位根检验(第三个) 如何看结果:
同ADF 一样 原假设为:至少存在一个单位根;备选假设为:序列不存在单位根。 P 值越小(统计量大于各显著性水平值)——不存在单位根 P 值越大(统计量小于各显著性水平值)——存在单位根
向量自相关回归VAR 模型
向量自回归(VAR)模型是AR 模型的多元扩展,用以反映在一个系统中的多个变量之间的动态影像,格兰杰因果检验、脉冲响应、方差分解都是 VAR 模型中重要的分析工具。
与VAR 模型相关的STATA 命令与解析
1、 VAR 模型的估计
STATA 命令:
var 解释变量 (,无常数项noconstant/滞后期lags(n)/ 外生变量exog(varlist)/constraints(numlist)线性约束的个数
{注意:使用线性约束要提前定义,详情见建模中的各种小问题}/LIKEPOHL 滞后阶数选择的统计量lutstats)
窗口操作:Statistics——Multivariate time series——VAR(第二项) 如何看结果:
3