
在统计学和计量经济学中,当我们处理现实世界的数据时,样本大小往往是有限的。但如果我们能够不断增加样本数量,会发生什么有趣的现象呢?这就涉及到渐近性质——描述估计量在样本容量趋于无穷大时的表现。
对于最小二乘法(OLS)估计,我们需要了解三个关键的渐近性质:一致性、渐近正态性和渐近效率。这些性质不仅在理论上重要,在实际应用中也为我们提供了强有力的工具。
例如,你正在估计中国某个城市的平均房价。如果你只调查了10套房子,得到的平均价格可能与真实的市场平均价格相差很大。但如果你调查了1000套、10000套甚至更多房子,你的估计就会越来越接近真实值。这种随着样本增大而逐渐接近真实参数的性质,就是一致性。
一致性是估计量最基本的要求。著名计量经济学家Clive Granger曾说:“如果在样本趋于无穷大时都得不到正确结果,那就不应该从事这个行业。”
从技术角度来看,一致性意味着当样本容量n趋向无穷大时,估计量的概率分布会收敛到真实参数值。这可以通过下面的图形来理解:
在多元回归模型中:
OLS估计量具有一致性,这基于前四个高斯-马尔科夫假设。让我们用一个实际例子来说明。
例子:影响北京房价的因素分析
假设我们想研究北京房价的决定因素,建立如下模型:
其中:
从图中可以看出,随着样本量增加,面积系数的估计值逐渐收敛到真实值0.1,这正体现了一致性的含义。
对于简单回归情况,我们可以证明OLS估计量的一致性。考虑斜率估计量的表达式,它可以写成真实参数加上一个由样本数据决定的随机项。当样本量趋于无穷时,根据大数定律,这个随机项的分子收敛到,分母收敛到。
因此,估计量的概率极限等于真实参数加上一个由解释变量与误差项相关性决定的项。
如果解释变量与误差项零相关,则估计量具有一致性,即当样本量趋于无穷时,估计量收敛到真实参数值。
一致性要求解释变量与误差项零相关。如果这个假设被违反,OLS估计量将是不一致的,且这种不一致性不会随样本量增加而消失。
当解释变量与误差项相关时,会导致估计的不一致性。在房价例子中,如果我们遗漏了"房屋装修质量"这个重要变量,它既影响房价又与面积相关(大房子往往装修更好),那么:
让我们用表格来展示不同情况下的偏误方向:
不一致性的问题在于,即使我们收集更多数据,偏误也不会消失。实际上,随着样本量增加,估计值会更加精确地收敛到错误的值。
这就完成了一致性部分的内容。接下来我们将探讨渐近正态性和大样本推断的相关内容。
在传统的经典线性模型中,我们需要假设误差项服从正态分布才能进行准确的统计推断。但现实中,这个假设经常被违反。

考虑一个研究中国大学生创业意愿的调查。创业意愿通常用0-10的量表衡量,其分布往往是左偏的(大多数学生创业意愿较低)。类似地,企业违规次数、专利申请数量等变量也很难满足正态分布假设。
好消息是,即使误差项不服从正态分布,我们仍然可以进行有效的统计推断,这要归功于中心极限定理。
中心极限定理告诉我们,当样本量足够大时,无论原始数据的分布如何,样本均值的分布都会趋向正态分布。这个神奇的定理同样适用于OLS估计量。
渐近正态性定理:在高斯-马尔科夫假设MLR.1到MLR.5下,对于任意系数估计量,其标准化后的分布渐近收敛到标准正态分布。
这意味着我们可以继续使用t统计量进行假设检验和构造置信区间,即使不满足正态性假设。
渐近正态性的关键优势是:它只要求误差项具有有限方差,而不需要任何特定的分布形状。这大大拓展了OLS方法的适用范围。
让我们通过一个实际例子来展示大样本推断的应用。假设我们研究电商平台对中小企业销售额的影响:
其中平台入驻是一个二元变量(0表示未入驻,1表示已入驻)。
使用不同样本量的数据,我们得到以下结果:
从图中可以看出,标准误确实按照的速率下降,这与理论预测完全一致。
这是一个实际工作中经常遇到的问题。虽然没有绝对的标准,但我们可以提供一些经验法则:
一般经验:对于大多数应用,当样本量超过30-50时,渐近正态性的近似就相当不错了。但如果误差项的分布严重偏离正态,可能需要更大的样本量。
不同分布下的样本量要求:
除了传统的t检验和F检验,大样本理论还为我们提供了其他检验方法,如拉格朗日乘数(LM)检验。
LM检验的优势在于只需要估计受限制的模型,这在某些情况下能显著节省计算成本。
LM检验步骤:
假设我们要检验
实际例子:检验企业创新能力的影响因素
我们研究企业R&D投入的决定因素:
想要检验政府补贴和行业竞争是否对R&D投入有显著影响:
从图中可以看出,随着样本量增加,LM检验和F检验给出了基本一致的结论,都拒绝了原假设,说明政府补贴和行业竞争确实对企业R&D投入有显著影响。
需要注意的是,渐近正态性仍然要求同方差假设。如果存在异方差,常规的t统计量和置信区间将失效,无论样本量多大。这就是为什么我们需要专门研究异方差问题的原因。
在大样本情况下,可能存在多种一致估计量。那么,在这些一致估计量中,哪一个是“最好的”呢?这就涉及到渐近效率的概念。
渐近效率要求估计量不仅一致,而且在所有一致估计量中具有最小的渐近方差。这类似于有限样本情况下的“最佳线性无偏估计量”概念,但适用于大样本情形。
为了理解OLS的渐近效率,我们需要考虑更广泛的估计量类别。考虑简单回归模型:
除了OLS估计量,我们还可以构造其他形式的估计量。例如,对任何与x相关但与u不相关的变量z,都可以构造一个一致的工具变量估计量。这类估计量被称为工具变量(IV)估计量,其中z被称为x的工具变量。
实际例子:教育收益率的估计

假设我们想估计教育对收入的影响:
由于教育程度可能与个人能力相关(聪明的人既获得更多教育也有更高工资),直接用OLS可能高估教育的收益。我们可以使用“父母教育水平”作为工具变量来获得一致估计。
让我们比较不同估计方法的表现:
从图中可以看出,当工具变量与解释变量的相关性不强时,IV估计量的方差会显著大于OLS估计量。只有当相关系数接近1时,两者的效率才相近。
OLS估计量的渐近效率可以通过Cauchy-Schwarz不等式来证明。对于任何工具变量估计量,其渐近方差都不会小于OLS估计量的渐近方差。这是因为Cauchy-Schwarz不等式确保了协方差的平方不会超过方差的乘积。
因此,OLS估计量具有最小的渐近方差。
让我们通过一个实际例子来展示这个概念。假设我们研究影响中国制造业企业全要素生产率(TFP)的因素:
不同估计方法的比较结果:
从图中明显看出,OLS估计量的置信区间最窄,这反映了它的高效性。
OLS在满足高斯-马尔科夫假设时不仅是一致的,而且在所有线性一致估计量中渐近效率最高。这为OLS在实践中的广泛应用提供了理论基础。
需要注意的是,当同方差假设被违反时,OLS虽然仍然一致,但不再是渐近效率的。在这种情况下,加权最小二乘法(WLS)或广义最小二乘法(GLS)能够获得更高的效率。
异方差的实际影响:
假设我们研究不同规模企业的投资行为,大企业的投资波动性通常比小企业更大。这种异方差会导致:
虽然渐近理论基于“样本趋于无穷大”的假设,但在实践中,当样本量相对较大时(通常n > 30),这些渐近结果通常提供了很好的近似。
不同领域的典型样本量:
通过前面的分析,我们可以总结出以下要点:
OLS渐近性质的三大支柱:一致性确保估计量在大样本下收敛到真值;渐近正态性允许我们进行统计推断而无需假设误差项正态分布;渐近效率保证OLS在满足假设条件下具有最小方差。
实践指导原则:
在样本量考虑方面,尽可能获得更大的样本量,特别是当怀疑误差项分布偏离正态时。在假设检验方面,大样本情况下t检验和F检验仍然有效,即使不满足正态性假设。在模型诊断方面,一致性要求解释变量与误差项不相关,这需要谨慎的模型设定。在异方差处理方面,如果怀疑存在异方差,应该使用稳健标准误或其他校正方法。
OLS的渐近理论为更高级的计量经济学方法奠定了基础。理解这些概念有助于我们处理内生性问题时选择合适的工具变量,在面板数据分析中应用固定效应和随机效应模型,理解时间序列分析中的协整和误差校正模型,以及掌握非线性模型的估计方法。
渐近理论不仅是理论工具,更是解决实际问题的强大武器。掌握这些概念能够帮助我们在面对复杂的现实数据时,选择合适的分析方法并正确解释结果。
总的来说,OLS的渐近性质为我们提供了一个坚实的理论基础,让我们能够在更广泛的情况下应用线性回归方法,并对结果有充分的信心。这些性质的美妙之处在于,它们将有限样本的精确结果扩展到了大样本的近似结果,极大地拓展了统计推断的适用范围。