经济数据的特点与类型。
1、横截面数据:多个经济个体的变量在同一时间点上的取值,如2012年中国各省的GDP 2、时间数列数据:指的是某个经济个体的变量在不同时点上的取值,如1978-2012年山东省每年的GDP
3、面板数据:多个经济个体的变量在不同时点上的取值,如1978-2012年中国各省的GDP
小样本OLS(最小二乘法):单一方程线性回归最常见方法
条件:解释变量与扰动项正交、扰动项无自相关、同方差。 拟合优度:衡量线性回归模型对样本数据的拟合程度(R2),越高说明模型拟合程度越好。
单系数T检验:对回归方程扰动项的具体概率进行假设
显著性水平进行检验
F检验:整个回归方程是否显著 STATA操作简介:
如果数据中包含1949-10-01或1949/10/01的时间变量,导入stata后可能会被视为字符串,因此对于日度数据,可以使用命令gen newvar=date(varname,YMD),将其转换为整数日期变量,其中YMD说明原始数据的格式为年月日,如果原始数据的格式为月日年则使用MDY;对于月度数据则gen newvar=monthly(varname,YM)。
.describe:数据的概貌 .drop keep:删除和保留 .su:统计特征 Pwcorr:变量之间相关系数 Star(.05):5%显著性水平 gen:产生 g intc=log(tc):取自然对数. reg:OLS回归 .Vce:协方差矩阵 reg。。。,noc表示在进行回归时不要常数项
大样本OLS:只要求解释变量与同期的扰动项正交即可
Robust:稳健标准误,如果存在异方差,则应使用稳健标准误
最大似然估计法:如果回归方程存在非线性,则使用最大似然估计法(MLE)或非线性最小二乘法(NLS)
三类在大样本下渐进等价的统计检验:Wald test LR(似然比检验) LM 操作步骤如下:sysuse auto(调用数据集)
Hist mpg,normal(画变量mpg的直方图,并与正态密度比较)
.1Density.020.04.06.081020Mileage (mpg)3040
直方图显示,变量mpg的分布于正态分布有一定差距。 变量可以取对数解决非正态分布的问题。
异方差与GLS(广义最小二乘法)
异方差的检验:看残差图、怀特检验(white test)、BP检验(Breusch and Pagan) 异方差的处理:1、OLS+稳健标准误(最好的) 2、广义最小二乘法(GLS) 3、加权最小二乘法(WLS) 实例操作:
1、 使用数据:use nerlove.dta,clear
2、 reg intc inq inpl inpk inpf(进行回归) 3、
Source SS df MS Number of obs = 145 F( 4, 140) = 437.90 Model 269.524728 4 67.3811819 Prob > F = 0.0000 Residual 21.5420958 140 .153872113 R-squared = 0.9260 Adj R-squared = 0.9239 Total 291.066823 144 2.02129738 Root MSE = .39227 intc Coef. Std. Err. t P>|t| [95% Conf. Interval] inq .7209135 .0174337 41.35 0.000 .6864462 .7553808 inpl .4559645 .299802 1.52 0.131 -.1367602 1.048689 inpk -.2151476 .3398295 -0.63 0.528 -.8870089 .4567136 inpf .4258137 .1003218 4.24 0.000 .2274721 .6241554 _cons -3.566513 1.779383 -2.00 0.047 -7.084448 -.0485779 4、 画残差图:rvfplot
2Residuals-101-20Fitted values24
上图可以发现当拟合值较小时,扰动项方差较大,继续考察残差与解释变量inq的散点图:rvpplot inq,结果与上图几乎一致,可能存在异方差,即扰动项的方差随着观测值而变。
5、 完成回归后,进行怀特检验:estat imtest,white