一文读懂时间序列专题学习手册

vlambda
2020-01-10

一文读懂时间序列专题学习手册

来源：综合整理自：http://dss.princeton.edu/training/

转载请注明来源

本文主要包括数据类型转换、自相关图、平稳性、协整、格兰杰检验等内容

From daily/monthly date variable to quarterly

1、Quarterly date from daily date

导入数据，查看数据

use date.dtadesced

一文读懂时间序列专题学习手册

可以发现Date2 is a string date variable

然后进行转换

gen datevar=date(date2,"MDY", 2099) format datevar %td gen quarterly = qofd(datevar) format quarterly %tq

一文读懂时间序列专题学习手册

2、Quarterly date from monthly date

gen month = month(datevar) gen day=day(datevar) gen year=year(datevar) gen monthly = ym(year,month) format monthly %tm

结果为：

一文读懂时间序列专题学习手册

From daily to weekly and getting yearly

gen datevar = date(date2, "MDY", 2099) format datevar %td gen year= year(datevar) gen w = week(datevar) gen weekly = yw(year,w) format weekly %tw 
browse

结果为：

一文读懂时间序列专题学习手册

From daily to yearly

gen year1 = year(datevar)

From quarterly to yearly

gen year2 = yofd(dofq(quarterly))

From weekly to yearly

gen year3 = yofd(dofw(weekly))

一文读懂时间序列专题学习手册

时间序列设定

tsset timevar

例如

一文读懂时间序列专题学习手册

使用命令tsfill可以填补时间序列的空白。使用tsfill 你需要 tset, tsset 或 xtset 的数据。

tset quarters tsfill

一文读懂时间序列专题学习手册

Lag operators (lag)滞后期计算生成

To generate values with past values use the “L” operator

generate unemp L1=L1.unemp generate unemp L2=L2.unemp list datevar unemp  unemp L1 unemp L2 in 1/5

To generate forward or lead values use the “F” operator

generate unemp F1=F1.unemp generate unemp F2=F2.unemp list datevar unemp  unemp F1 unemp F2 in 1/5

To generate the difference between current a previous values use the “D” operator

generate unemp D1=D1.unemp  generate unemp D2=D2.unemp list datevar unemp  unemp D1 unemp D2 in 1/5

D1 = y t – yt-1

D2 = (y t – y t-1 ) – (y t-1 – y t-2 )

To generate seasonal differences use the “S” operator

generate unemp S1=S1.unemp  generate unemp S2=S2.unemp

S1 = y t – y t-1

S2 = (y t – y t-2 )

Correlograms: autocorrelation

要探索自相关，即变量与其前一个值之间的相关性，可以使用命令corrgram。滞后的数量取决于理论、AIC/BIC过程或经验。输出包括用于指定ARIMA模型的自相关系数和偏相关系数。

corrgram unemp, lags(12)

一文读懂时间序列专题学习手册

单位根检验

line unemp datevar

一文读懂时间序列专题学习手册

Dickey-Fuller检验是最常用的平稳性检验之一。零假设这个级数有一个单位根。检验统计数据表明，失业率系列有一个单位根，它位于接受区域内。

处理随机趋势(单位根)的一种方法是取变量的一阶差分。

dfuller  unemp, lag(5)dfuller d.unemp1, lag(5)

一文读懂时间序列专题学习手册

协整检验

Cointegration refers to the fact that two or more series share an stochastic trend (Stock & Watson). Engle and Granger (1987) suggested a two step process to test for cointegration (an OLS regression and a unit root test), the EG-ADF test.

regress unemp gdp predict e, resid dfuller e, lags(10)

一文读懂时间序列专题学习手册

格兰杰因果汇总

本部分来源：http://dss.princeton.edu/training/，部分资源整理自：百度文库、CDA数据分析师、社会科学中的数据可视化

在实证分析中，我们经常需要确定因果关系是x导致y，还是y导致x。对此，Granger提出了一种解决方法:如果x是y的原因，且不存在反向因果，则x过去值可以预测y未来值，反之则不然。具体来说，我们建立时间序列模型如下，并提出假设H0：βm=0，m=1,2…p。如果接受该假设，则意味着x过去值不能够预测y未来值；如果拒绝该假设，则可以，即x是y的格兰杰因（Granger cause）。

格兰杰因果关系检验假设了有关y和x每一变量的预测的信息全部包含在这些变量的时间序列之中。检验要求估计以下的两个回归模型：

一文读懂时间序列专题学习手册

模型1

一文读懂时间序列专题学习手册

模型2

模型1是为了检验X对Y的影响，模型二是为了检验Y对X的影响。（其中白噪音u1t 和u2t假定为不相关的）

基本逻辑：

模型一中，如果模型α1，α2 , ... , αq 中只要存在一个系数显著为不零，那就认为X对Y有格兰杰因果关系，模型二类似；

格兰杰因果检验方法总结

格兰杰因果检验相关的stata命令可以有三种。

方法一：

reg y L.y L.x （滞后1 期）estat ic （显示AIC 与BIC 取值，以便选择最佳滞后期）reg y L.y L.x L2.y L2.xestat ic （显示AIC 与BIC 取值，以便选择最佳滞后期）……

根据信息准则确定p, q 后，检验；所用的命令就是test

特别说明，此处p和q的取值完全可以不同，而且应该不同，这样才能获得最有说服力的结果，这也是该方法与其他两个方法相比的最大优点，该方法缺点是命令过于繁琐。

方法二：

ssc install gcause （下载格兰杰因果检验程序gcause）gcause y x,lags(1) （滞后1 期）estat ic （显示AIC 与BIC 取值，以便选择最佳滞后期）
gcause y x,lags(2) （滞后2 期）estat ic （显示AIC 与BIC 取值，以便选择最佳滞后期）

特别说明，在选定滞后期后，对于因果关系检验，该方法提供F检验和卡方检验。如果两个检验结论不一致，原则上用F检验更好些。因为卡方检验是一个大样本检验，而实证检验所能获得的样本容量通常并不大，如果采用的是大样本，则以卡方检验结果为准。不过，通常情况下，大样本下两个检验结论一致，所以不用担心。综上，F检验适用范围更广。

方法三：

var y x （向量自回归）vargranger

注意：1、如果实际检验过程中AIC和BIC越来越小，直到不能再滞后（时间序列长度所限）。这样的话，可能数据确实存在高阶自相关。在这种情况下，可以限制p的取值，比如取最大的或，。2、回归结果中各期系数显著性不同，有的不显著有的显著，如实汇报就可以。最好全部汇报。不显著的期数可能意味着那一期的自相关很弱。

格兰杰因果检验应用案例

1、导入数据

use http: //www.stata-press.com/data/imeus/ukrates, clear

2、安装外部命令（安装gcause格兰杰因果检验程序）

ssc install gcause

一文读懂时间序列专题学习手册

3、格兰杰检验

gcause r20 rs, lags(1)estat icgcause r20 rs, lags(2)estat ic

一文读懂时间序列专题学习手册

依次对滞后一期、滞后两期等变量进行回归，根据AIC及BIC的取值确定最佳的滞后期。在本例中，我们发现p=q=3时AIC及BIC的值最小，因此我们将p和q都赋值为3。滞后三期回归结果如图所示：

gcause r20 rs, lags(3)estat ic

一文读懂时间序列专题学习手册

我们发现F检验和卡方检验得出一致结论，接受原假设，即rs不是r20的格兰杰因。

格兰杰因果检验应用案例

1、导入数据

use "C:\Users\admin\Desktop\tsdata.dta"

2、Granger causality: using OLS

If you regress ‘y’ on lagged values of ‘y’ and ‘x’ and the coefficients of the lag of ‘x’ are statistically significantly different from 0, then you can argue that ‘x’ Granger-cause ‘y’, this is, ‘x’ can be used to predict ‘y’ (see Stock & Watson -2007-, Green -2008).

regress unemp L(1/4).unemp L(1/4).gdp

一文读懂时间序列专题学习手册

regress unemp L(1/4).unemp L(1/4).gdp

一文读懂时间序列专题学习手册

我们不能拒绝原假设，因此 gdp不是 unemp的格兰杰原因。

格兰杰因果检验应用案例

Granger causality: using VAR

quietly var unemp gdp, lags(1/4)vargranger

The null hypothesis is ‘var1 does not Granger-cause var2’. In both cases, we cannot reject the null that each variable does not Granger-cause the other

◆◆◆◆

精彩回顾