在时间序列分析中,数据点之间的时间依赖关系往往会带来两个重要挑战:序列相关性和异方差性。这些问题如果不加以处理,会严重影响我们对经济现象的理解和政策制定的准确性。

例如,当我们分析中国房价变化时,今年的房价往往与去年的房价存在密切关联;或者当我们研究股市波动时,前一天的市场情绪会影响第二天的交易行为。这种时间上的依赖关系正是序列相关性的核心特征。
在时间序列回归分析中,即使存在序列相关性,OLS(普通最小二乘法)估计量仍然具有无偏性和一致性。这个重要结论基于严格外生性假设,即解释变量与所有时期的误差项都不相关。
考虑一个简单的时间序列模型:
其中误差项 遵循AR(1)过程:
严格外生性假设确保了即使误差项之间存在相关性,OLS估计量的无偏性依然成立。这为我们在面对序列相关性时提供了理论基础。
虽然OLS估计量保持无偏性,但序列相关性会导致效率损失,使得估计量不再是最佳线性无偏估计量(BLUE)。更重要的是,传统的标准误、t统计量和F统计量都不再有效。
让我们通过一个具体例子来说明这个问题。假设我们研究中国GDP增长率与投资增长率的关系:
在AR(1)模型下,OLS估计量的方差包含两部分:标准方差项和序列相关性修正项。
当序列相关性系数 且解释变量也呈正相关时,传统的OLS方差公式会低估真实方差,导致t统计量虚高。这是因为序列相关性增加了估计量的不确定性,但传统公式没有考虑这一点。
一个常见误解是序列相关性会使 R² 和调整 R² 失效。实际上,在平稳且弱依赖的时间序列中,这些拟合优度指标仍然有效。它们依然能够一致地估计总体 R²,即误差方差与因变量方差的比例关系。
需要注意的是,当因变量为I(1)过程(单位根过程)时,传统的拟合优度概念失去意义,因为方差会随时间增长。
当模型包含滞后因变量时,序列相关性问题变得更加复杂。考虑以下模型:
其中 ,这确保了OLS估计量的一致性。
但是,如果我们错误地假设误差项遵循AR(1)过程:
那么这个模型实际上等价于AR(2)模型:
其中 ,。
在实践中,动态模型中的序列相关性往往表明模型的动态结构被错误设定。解决方案通常是增加更多滞后项,而不是简单地修正序列相关性。
对于严格外生的解释变量,检验AR(1)序列相关性的步骤如下:
让我们用中国CPI通胀率数据来演示这个检验:
假设我们对CPI通胀率进行回归分析后,得到残差的自回归系数估计值为0.573,t统计量为4.93,这提供了强有力的序列相关性证据。
Durbin-Watson统计量基于相邻残差的差分平方和与残差平方和的比值。
与t检验的关系近似为:DW ≈ 2(1 - ρ̂),其中ρ̂是序列相关系数的估计值。
当解释变量包含滞后因变量时,需要使用修正的检验方法:
进行辅助回归:将残差对所有解释变量和滞后残差进行回归
这种方法允许解释变量与滞后误差项相关,确保检验的有效性。
对于AR(q)序列相关性,使用联合显著性检验:
辅助回归:将残差对所有解释变量和q个滞后残差进行回归
使用F统计量或LM统计量检验所有滞后残差系数是否联合为零。LM统计量计算为(n-q)R²,在原假设下服从卡方分布。
当误差项遵循AR(1)过程时,可以通过拟差分变换消除序列相关性:
对于t≥2:使用拟差分变换,即当期值减去前期值乘以相关系数
对于t=1:使用加权变换,权重为根号下(1-ρ²)
变换后的模型满足高斯-马尔可夫假设,OLS估计量为BLUE。
GLS变换的核心思想是利用序列相关性的已知结构,通过适当的数据变换来恢复误差项的独立性。
由于序列相关系数ρ通常未知,实践中使用两步法:
让我们用中国房价数据来演示FGLS的应用:
FGLS的一致性需要更强的假设。除了 外,还需要:
这意味着 需要与 、 和 都不相关。如果违反此假设,FGLS可能不一致,而OLS仍然一致。

当序列相关性系数 接近1时,一阶差分往往能有效消除序列相关性。考虑模型:
其中 遵循随机游走:
对方程进行一阶差分:
差分后的误差项 是白噪声,消除了序列相关性。
让我们用中国三个月期国债利率数据来说明差分的效果:
水平方程的序列相关性系数:0.623 (高度显著) 差分方程的序列相关性系数:0.072 (不显著)
这表明差分有效地消除了序列相关性问题。
当怀疑解释变量的严格外生性或序列相关性的具体形式时,可以使用序列相关性稳健标准误。
对于系数 ,稳健标准误的计算涉及:
其中 , 是辅助回归的残差, 是选择的滞后阶数。
参数 的选择很重要:对于年度数据,通常选择 或 ;对于季度数据,可选择 或 ;对于月度数据,可选择 或 。
以研究最低工资对就业率的影响为例:
稳健标准误略大于传统标准误,但系数仍然显著,而FGLS估计的系数有所不同,可能暗示违反了严格外生性假设。
时间序列中的异方差性检验需要特别注意序列相关性的影响。Breusch-Pagan检验将残差的平方对所有解释变量进行回归。
该检验要求辅助回归的误差项是同方差且无序列相关的。如果原始残差存在序列相关性,会使异方差性检验失效。
自回归条件异方差性(ARCH)模型关注条件方差的时变特征:
这种模型在金融时间序列中特别常见。
让我们分析上证综指的周收益率数据:
ARCH检验结果:
对残差平方进行自回归:
滞后项系数的t统计量超过9,表明存在强烈的ARCH效应。这意味着前期的大幅波动会导致当期波动性增加。
在实际应用中,异方差性和序列相关性往往同时存在。一种可行的处理方法是:
这种方法结合了两种修正的优点,确保推断的有效性。
在实际应用中,应该将序列相关性和异方差性的处理视为诊断和改进模型设定的过程,而不仅仅是技术性的统计调整。
时间序列回归中的序列相关性和异方差性是经济学实证研究中的常见问题。正确理解和处理这些问题对于得出可靠的统计推断和政策建议至关重要。
主要要点包括:
序列相关性不影响OLS估计量的无偏性和一致性,但会导致效率损失和推断失效。检验方法包括t检验、Durbin-Watson检验和高阶序列相关性的LM检验。修正方法包括可行GLS、差分变换和稳健标准误。
异方差性在时间序列中有其特殊形式,如ARCH效应。处理时需要注意与序列相关性的相互作用。
在实际应用中,应该综合考虑数据特征、模型设定和研究目的来选择appropriate的方法,确保得出robust和可靠的研究结论。