
当我们构建经济计量模型时,常常会遇到一个重要的问题:误差项的方差并不总是恒定的。这种现象被称为异方差性(Heteroskedasticity),它会对我们的统计推断产生重要影响。
考虑我们熟悉的多元线性回归模型:
在经典线性模型的假设中,我们要求误差项具有同方差性,即对于所有观测值,误差项的条件方差都相等:。
然而,在实际的经济数据中,这个假设经常被违背。比如,当我们研究中国不同地区的居民收入与消费支出关系时,我们可能发现高收入地区的消费支出变异性远大于低收入地区,这就是典型的异方差现象。
异方差性并不会导致OLS估计量产生偏误或不一致性,但它会使标准误差的计算变得不准确,从而影响我们的假设检验和置信区间构建。
异方差性的存在会带来以下几个重要问题:
统计检验失效:传统的t统计量不再服从t分布,F统计量也不再服从F分布。这意味着我们基于这些统计量进行的假设检验结果可能不可靠。
效率损失:虽然OLS估计量依然是无偏和一致的,但它不再是最优线性无偏估计量(BLUE)。存在更有效的估计方法可以获得更小的方差。
R平方解释不变:值得注意的是,异方差性并不影响和调整的解释,因为它们都是基于无条件方差的概念。
让我们通过一个具体的中国案例来理解这些概念。
面对异方差性问题,经济学家开发了一套稳健的统计推断方法。这些方法的核心思想是:既然我们无法确定异方差的具体形式,就让我们的统计量在任何形式的异方差下都保持有效。
对于简单回归模型 ,当存在异方差时,斜率估计量的方差不再是常数,而是依赖于每个观测的具体情况。
具体来说,方差公式变为各个观测点方差的加权和,其中权重由解释变量的偏差决定。
White (1980) 提出了一个巧妙的解决方案:使用OLS残差来估计未知的方差,得到异方差稳健的方差估计量。这个估计量通过用残差平方替代理论方差,提供了在任何异方差形式下都有效的方差估计。
让我们用一个中国的实际案例来说明异方差稳健推断的重要性。假设我们想研究城镇居民收入对住房支出的影响,使用2023年中国城市统计数据。
在这个例子中,我们可能会发现异方差现象:高收入家庭的住房支出变异性更大,而低收入家庭的支出相对集中。
假设我们的回归结果如下(数值为演示目的):
从这个表格我们可以看出,稳健标准误与传统标准误存在差异。收入变量的稳健标准误(0.035)比传统标准误(0.028)大约25%,这说明传统方法可能低估了参数估计的不确定性。
在实际应用中,稳健标准误有时会比传统标准误更大,有时也会更小。我们无法提前预知这种差异的方向,但使用稳健方法可以确保统计推断的可靠性。
除了t检验,我们还可以计算异方差稳健的F统计量来进行联合显著性检验。例如,要检验教育年限和城市规模是否对住房支出有联合影响,我们可以设定:
使用传统F检验得到的统计量值为2.35,而稳健F检验的结果为2.68。虽然差异不大,但在其他情况下,这种差异可能会影响我们的结论。
识别异方差性的存在是正确处理这个问题的第一步。经济学家开发了多种检验方法来诊断异方差性。
Breusch-Pagan(BP)检验是最常用的异方差检验方法之一。其基本思想是检验误差项的平方是否与解释变量相关。
检验步骤:
在零假设(同方差性)下,LM统计量服从 分布,其中k是解释变量的个数。

让我们用中国房地产市场数据来演示BP检验。假设我们建立了如下的房价模型:
使用2023年某一线城市的88个样本数据,我们得到:
BP检验结果显示:,因此:
两种统计量都强烈拒绝同方差性假设,表明存在显著的异方差性。
当使用对数形式的因变量时,异方差问题往往会得到缓解。这是因为对数变换具有“压缩”大数值变异性的特性。
White检验是另一种重要的异方差检验方法,它不仅包含解释变量本身,还包含它们的平方项和交叉项。
对于包含3个解释变量的模型,White检验的辅助回归为:
White检验的简化形式
由于完整的White检验使用了大量自由度,实践中常用其简化形式:
其中 是拟合值。这种方法特别适合检验方差是否随期望值水平而变化。
当我们确认存在异方差性后,可以使用更有效的估计方法来改善参数估计的精度。加权最小二乘法(WLS)就是这样一种方法。
假设我们知道异方差的具体形式:,其中 是已知的权重函数。
WLS的核心思想是给予方差较小的观测更高的权重,给予方差较大的观测更低的权重。通过将原始模型中的每个变量都除以异方差函数的平方根进行变换,我们可以得到一个满足同方差性假设的新模型,然后使用OLS获得有效估计。

让我们用一个关于中国城市环保投入的例子来说明WLS的应用。假设我们研究人均GDP对环保投入的影响,发现异方差性与城市人口规模相关。
从比较结果可以看出,WLS估计值与OLS估计值存在一定差异,但符号和显著性基本一致,这说明模型设定相对合理。
在实践中,我们通常不知道异方差函数的确切形式,需要先估计它。一种常用的方法是假设:
FGLS实施步骤:
使用中国家庭收入与支出调查数据,我们建立香烟消费需求模型:
从结果可以看出,WLS估计提供了更精确的标准误差,特别是对收入变量的估计更为准确。
WLS方法在处理已知异方差形式时非常有效,但如果异方差函数设定错误,虽然估计量仍然是一致的,但标准误差可能不准确。因此,建议在WLS后使用异方差稳健标准误差。
当因变量是二元变量时,我们经常使用线性概率模型(LPM)。这种模型天生具有异方差性。
对于模型 ,当y是二元变量时:
其中 是成功概率。
这意味着异方差是内在的,不可避免的。
方法1:使用异方差稳健标准误
这是最简单且最常用的方法。我们继续使用OLS估计,但计算稳健标准误来进行统计推断。
方法2:加权最小二乘法
如果所有拟合值都在[0,1]区间内,可以使用权重 进行WLS估计。

让我们研究影响已婚女性劳动力市场参与的因素:
从这个例子可以看出,对于LPM,稳健标准误与传统标准误的差异通常不大,说明异方差问题虽然存在,但在实践中的影响相对有限。
异方差性是经济计量分析中的常见问题,但它并不会导致参数估计的偏误。关键在于采用适当的方法来确保统计推断的有效性。
实践中的建议:
现代经济计量软件都提供了异方差稳健统计量的计算功能。在报告结果时,同时提供传统标准误和稳健标准误是一个良好的实践习惯。
异方差性的处理体现了经济计量学理论与实践相结合的特点。通过理解其本质和掌握相应的处理方法,我们可以获得更可靠的经济学结论,为政策制定和商业决策提供更坚实的支撑。