假如您被国家人力资源和社会保障部聘请,评估政府资助的职业技能培训项目的有效性。这个项目为制造业工人提供智能制造和数字化技能培训,为期20周,在业余时间进行。所有制造业小时工都可以参与,参加全部或部分培训完全自愿。您需要确定这个培训项目对每个工人后续小时工资是否有影响,影响有多大。

再设想一下,您在一家投资银行工作,需要研究涉及短期国债的不同投资策略回报,以确定这些策略是否符合经济理论的预测。
这样的问题乍看之下可能令人畏惧。此时,您可能只对需要收集什么样的数据有模糊的概念。通过学习计量经济学方法,您将学会如何正式评估职业培训项目或检验简单的经济理论。
计量经济学最常见的应用是预测重要的宏观经济变量,比如利率、通胀率和国内生产总值。虽然经济指标的预测备受关注且经常广泛发布,但计量经济学方法也可以用于与宏观经济预测无关的经济领域。例如,我们可以研究政治竞选支出对投票结果的影响,考虑教育支出对学生成绩的影响,或者学习如何使用计量经济学方法预测经济时间序列。
计量经济学作为一个独立学科从数理统计学中发展出来,因为它专注于收集和分析非实验经济数据中固有的问题。非实验数据不是通过对个人、企业或经济部门进行受控实验来积累的。在自然科学中,实验数据通常在实验室环境中收集,但在社会科学中获得实验数据要困难得多。虽然可以设计一些社会实验,但进行解决经济问题所需的受控实验通常是不可能的、代价过高的,或者在道德上令人反感的。
计量经济学方法几乎与应用经济学的每个分支都相关。当我们有经济理论需要检验时,或者当我们心中有对商业决策或政策分析具有重要意义的关系时,就会用到这些方法。实证分析使用数据来检验理论或估计关系。
如何构建实证经济分析呢?虽然看起来显而易见,但值得强调的是,任何实证分析的第一步都是仔细制定感兴趣的问题。问题可能涉及检验经济理论的某个方面,或者涉及检验政府政策的效果。原则上,计量经济学方法可以用来回答广泛的问题。
在某些情况下,特别是涉及经济理论检验的情况下,会构建正式的经济模型。经济模型由描述各种关系的数学方程组成。经济学家以构建模型来描述大量行为而闻名。例如,在中级微观经济学中,个人消费决策在预算约束下用数学模型描述。这些模型的基本前提是效用最大化。
个人在资源约束下做出选择以最大化其福利的假设,为我们创造可处理的经济模型和做出明确预测提供了非常强大的框架。
让我通过一个中国的例子来说明这个过程:
考虑研究影响网约车司机收入的因素。我们可以建立这样一个关系:
其中各变量的含义如下:
这个模型虽然基于直观推理得出,但捕捉了问题的本质。其他因素当然也会影响司机收入,但上述方程抓住了主要因素。
确定经济模型后,我们需要将其转化为计量经济模型。以上面的网约车司机收入为例,我们必须指定函数的具体形式。一个完整的计量经济模型可能是:
其中 包含了无法观察到的因素,如司机的"服务态度"、"道路熟悉度"、"运气"以及测量各种因素时的误差等。我们可以在模型中加入更多背景变量,比如年龄、教育程度等,但我们永远无法完全消除 。事实上,处理这个误差项或扰动项可能是任何计量经济分析中最重要的组成部分。
常数 是计量经济模型的参数,它们描述了收入与决定收入的各因素之间关系的方向和强度。
一旦指定了计量经济模型,就可以用未知参数来表述各种感兴趣的假设。例如,我们可能假设驾驶经验对司机收入没有影响,在这个特定计量经济模型的背景下,这个假设等同于 。

经济数据集有多种类型。虽然某些计量经济学方法可以在很少或无需修改的情况下应用于许多不同类型的数据集,但某些数据集的特殊特征必须得到考虑或应该加以利用。
横截面数据集包含在给定时间点上对个人、家庭、企业、城市、省份、国家或其他各种单位的样本。有时,并非所有单位的数据都对应于完全相同的时间段。例如,可能在一年中的不同周调查几个家庭。在纯横截面分析中,我们会忽略收集数据时的微小时间差异。
横截面数据的一个重要特征是,我们通常可以假设它们是从总体中随机抽样获得的。例如,如果我们从工作人口中随机抽取500人,获得关于工资、教育、经验和其他特征的信息,那么我们就有了所有工作人员总体的随机样本。
让我们看一个中国的例子:
这里的变量起薪表示月薪(元),教育年限表示受教育总年数,实习经验表示实习月数,性别和婚姻状况是二元(0-1)变量,用于表示个人的定性特征。
时间序列数据集包含一个或多个变量随时间的观测值。时间序列数据的例子包括股价、货币供应量、消费者价格指数、国内生产总值、年度犯罪率和汽车销售数据。由于过去事件可以影响未来事件,且在社会科学中行为滞后很普遍,时间是时间序列数据集的重要维度。
让我们看一个中国的实际例子:
这里的平均房价指全国70个大中城市新建商品住宅价格指数,政策指数反映房地产调控政策的紧松程度,贷款利率是5年期以上贷款市场报价利率,GDP增长率是当季同比增长率。
时间序列数据的一个关键特征是,经济观测值在时间上很少能够假设为相互独立的。大多数经济和其他时间序列都与其最近的历史相关,通常是强相关的。
有些数据集同时具有横截面和时间序列特征。例如,假设在中国进行了两次家庭调查,一次在2020年,一次在2023年。2020年,随机调查了一些家庭的收入、储蓄、家庭规模等变量。2023年,使用相同的调查问题对新的随机家庭样本进行调查。为了增加样本量,我们可以通过合并两年的数据形成混合横截面。
合并不同年份的横截面数据通常是分析新政府政策影响的有效方法。其思路是收集政策变化前后几年的数据。
面板数据(或纵向数据)集包含数据集中每个横截面成员的时间序列。例如,我们可能有一组个人在十年期间的工资、教育和就业历史数据,或者我们可能收集同一组企业在五年时间内的投资和财务数据。
面板数据与混合横截面数据的区别在于,面板数据在给定时间段内跟踪相同的横截面单位(前述例子中的个人、企业或县)。
让我们看一个中国企业的面板数据例子:
这里研发支出单位为万元,营业收入单位为万元,员工数为人数,专利申请为当年申请数量。
在大多数经济理论检验中,特别是在评估公共政策时,经济学家的目标是推断一个变量(如教育)对另一个变量(如工人生产力)具有因果效应。仅仅发现两个或更多变量之间的关联可能有启发性,但除非能够确立因果关系,否则很少具有说服力。
“其他条件不变”的概念——意思是“其他(相关)因素保持相等”——在因果分析中起着重要作用。您可能还记得,在经济学导论课程中,大多数经济问题本质上都是其他条件不变的。
让我通过几个中国的实际例子来说明因果推断的挑战:

假设我们想要研究在线教育对学生学习效果的影响。理想的实验可能是:选择几个学习能力相似的学生群体,随机分配一些学生接受传统课堂教育,另一些学生接受在线教育,然后测量他们的学习成果。
但是,在现实中进行这样的实验面临诸多困难:首先,学生的学习能力、家庭背景、学习动机等因素很难完全控制;其次,教育方式的选择往往不是随机的,而是基于学生和家长的主观偏好;最后,长期教育效果的观察需要很长时间,实验成本高昂。
考虑研究地铁开通对周边房价的影响。一个理想的实验是:在两个完全相同的区域中,随机选择一个区域建设地铁,另一个区域不建设,然后比较房价变化。
然而,地铁线路的规划并不是随机的,而是综合考虑了人口密度、商业发展、政府规划等多种因素。那些原本就具有发展潜力的区域更可能获得地铁建设,这使得我们很难将房价上涨完全归因于地铁的影响。
在非实验数据中推断因果关系的主要挑战是,我们感兴趣的变量往往与其他影响结果变量的重要因素相关联。
标准的供求分析表明,当最低工资提高到市场出清工资之上时,我们会沿着劳动需求曲线上移,总就业量会下降。为了量化这种效应,我们可以研究就业与最低工资之间随时间的关系。
但是,中国的最低工资并不是在真空中确定的。各种经济和政治力量都会影响某一年的最终最低工资水平。因此,最低工资水平很可能与其他影响就业水平的因素相关。
我们可以想象政府进行一个实验来确定最低工资对就业的影响:政府每年随机设定最低工资,然后统计就业结果。由此产生的实验时间序列数据可以用相对简单的计量经济方法进行分析。但这种情况显然不能描述最低工资的实际设定方式。
尽管在大多数情况下无法进行真正的实验,计量经济学家已经开发出许多巧妙的方法来从观察数据中识别因果效应。这些方法包括:
工具变量法:寻找只影响解释变量而不直接影响被解释变量的“工具”,比如利用地理距离作为教育获得的工具变量。
双重差分法:比较政策实施前后、实验组和对照组之间的差异,比如研究某地试点政策的效果。
断点回归法:利用政策实施的阈值特征,比如研究高考录取分数线对未来收入的影响。
自然实验:利用政策变化或外生事件,比如研究义务教育年限延长对收入的影响。
现代计量经济学的核心就是在无法进行理想实验的情况下,如何从观察数据中可信地识别因果效应。
计量经济学是现代经济学研究不可缺少的工具。它不仅帮助我们检验经济理论,更为政府制定政策、企业做出决策提供了科学依据。通过学习计量经济学,我们能够:
理解如何从复杂的经济现象中抽象出可以检验的模型,学会处理不同类型的经济数据,掌握在非实验环境下推断因果关系的方法。
在这个数据驱动的时代,计量经济学的重要性日益凸显。无论是分析电商平台的定价策略、评估扶贫政策的效果,还是预测宏观经济走势,都离不开计量经济学方法的支撑。随着大数据、人工智能等技术的发展,计量经济学也在不断演进,为我们理解和改善经济社会提供更加强有力的工具。