📊 计量经济学

应用统计和数学方法分析经济数据,识别因果关系

一、计量经济学概述

1.1 计量经济学研究流程

研究问题
理论模型构建
数据收集与清洗
选择计量方法
OLS 回归
工具变量
DID/RDD
模型估计与检验
稳健性检验
不通过:修正模型
通过
得出结论

1.2 计量经济学核心要素

要素 内容 重要性 2026 年新趋势
理论 经济理论指导模型设定 ⭐⭐⭐⭐⭐ 理论与数据驱动结合
数据 宏观、微观、实验、大数据 ⭐⭐⭐⭐⭐ 另类数据、实时数据
方法 回归、因果推断、机器学习 ⭐⭐⭐⭐⭐ ML 与传统计量融合
识别 因果识别策略 ⭐⭐⭐⭐⭐ 更严谨的识别设计

💡 计量经济学的三大支柱

1. 理论驱动:基于经济理论构建模型,避免数据挖掘
2. 因果识别:从相关性到因果性,识别策略是关键
3. 数据质量:垃圾进垃圾出,数据质量决定研究质量

2026 年新趋势:机器学习与传统计量融合、大数据应用、开放科学、预注册研究

二、回归分析方法

2.1 OLS 回归假设检验流程

建立回归模型
Y = β₀ + β₁X₁ + ... + ε
线性关系?
否:变换变量
是:继续
多重共线性?
VIF>10:处理
VIF<10:继续
异方差?
稳健标准误
OLS 标准误
解释结果

2.2 回归假设与检验方法

假设 含义 检验方法 违背后果 修正方法
线性关系 X 与 Y 线性相关 散点图、RESET 检验 估计有偏 变量变换、加入平方项
无多重共线性 自变量不高度相关 VIF 检验、相关系数 标准误增大 删除变量、主成分分析
同方差 误差方差恒定 Breusch-Pagan 检验 标准误有偏 稳健标准误、加权最小二乘
无自相关 误差项不相关 DW 检验、LM 检验 标准误有偏 Newey-West 标准误、GLS
正态分布 误差项正态分布 JB 检验、QQ 图 小样本推断失效 大样本、bootstrap
简单线性回归:Y = β₀ + β₁X + ε
β₁ = Cov(X,Y) / Var(X) = Σ(xᵢ-x̄)(yᵢ-ȳ) / Σ(xᵢ-x̄)²
含义:X 每增加 1 单位,Y 平均变化β₁单位

三、因果推断方法

3.1 因果识别策略选择流程

研究问题
可以随机实验?
是:RCT
否:准实验
有外生冲击?
DID
有政策断点?
RDD
工具变量
因果效应估计

3.2 因果推断方法对比

方法 核心思想 识别假设 适用场景 2026 年应用
RCT 随机分配处理 随机化保证可比性 政策试点、药物试验 在线 A/B 测试普及
DID 双重差分比较 平行趋势假设 政策评估、自然实验 多期 DID、异质性处理效应
RDD 断点附近比较 断点外生、连续性 资格门槛、政策 cutoff 模糊 RDD、多断点设计
IV 工具变量隔离外生变异 相关性、排他性 内生性处理 弱工具变量检验、多 IV
合成控制 构造反事实对照组 权重优化、预测能力 单一处理单元 多处理单元扩展

💡 因果推断的可信度革命

21 世纪计量经济学经历"可信度革命",核心是因果识别

1. 随机实验 (RCT):黄金标准,但外部有效性有限
2. 准实验设计:DID、RDD、IV 等利用自然实验
3. 识别假设检验:平行趋势、连续性等假设需验证
4. 稳健性检验:多种规格、多种方法交叉验证

2026 年新进展:机器学习辅助因果推断、异质性处理效应分析、预注册研究规范

四、时间序列分析

4.1 时间序列建模流程

获取时间序列数据
平稳性检验 (ADF)
非平稳:差分
平稳:继续
识别模型 (ACF/PACF)
选择 AR/MA/ARIMA
参数估计
残差检验
通过:预测
不通过:重新建模
模型应用

4.2 时间序列模型对比

模型 公式 适用场景 优点 局限
AR(p) Yₜ = c + ΣφᵢYₜ₋ᵢ + εₜ 自相关序列 简单、解释性强 仅考虑历史值
MA(q) Yₜ = μ + Σθᵢεₜ₋ᵢ + εₜ 冲击持久影响 捕捉冲击效应 参数解释困难
ARIMA AR+I+MA 组合 非平稳序列 灵活、应用广 参数选择复杂
VAR 多变量 AR 多变量互动 捕捉动态关系 参数多、需大样本
GARCH 波动率建模 金融时间序列 捕捉波动聚集 假设条件严格

⚠️ 时间序列分析注意事项

伪回归问题:非平稳变量回归可能产生显著但无意义的结果——先检验平稳性
结构突变:政策变化、危机事件可能导致模型参数变化——检验结构稳定性
样本外预测:模型拟合好不代表预测好——进行样本外预测检验
2026 年新方法:机器学习时间序列 (LSTM、Transformer)、高频数据分析、实时预测

五、机器学习与计量融合

5.1 传统计量 vs 机器学习

维度 传统计量经济学 机器学习 融合方向
目标 因果推断、参数解释 预测精度、模式识别 因果机器学习
模型 线性、参数模型 非线性、非参数 半参数、可解释 AI
数据 结构化、小样本 大样本、高维度 混合数据源
推断 统计显著性、置信区间 交叉验证、测试集 双重机器学习推断
2026 趋势 因果推断严谨化 可解释性增强 方法融合、优势互补

5.2 机器学习在计量中的应用

✅ 预测增强

  • 变量选择:LASSO、Ridge 筛选重要变量
  • 非线性拟合:随机森林、神经网络捕捉复杂关系
  • 高维数据:处理大量预测变量
  • 文本数据:NLP 处理政策文本、新闻情绪

✅ 因果推断

  • 双重机器学习:ML 控制混淆变量
  • 异质性效应:Causal Forest 估计处理效应异质性
  • 倾向得分:ML 估计更准确的倾向得分
  • 合成控制:优化权重构造

⚠️ 注意事项

  • 黑箱问题:模型解释性差
  • 过拟合风险:样本外预测可能失效
  • 因果识别:ML 本身不解决内生性
  • 数据质量:垃圾进垃圾出

💡 2026 年计量经济学前沿

1. 因果机器学习:将 ML 预测能力与因果推断结合
2. 高维推断:处理变量数超过样本量的情况
3. 异质性处理效应:估计不同子群体的不同处理效应
4. 文本即数据:NLP 分析政策、新闻、社交媒体
5. 开放科学:预注册、数据共享、代码公开、可复现研究
6. 实时计量:高频数据、实时预测、政策即时评估

六、实证研究设计

6.1 高质量研究 checklist

环节 关键问题 最佳实践 常见错误
研究问题 问题清晰吗?有贡献吗? 文献综述、预注册 问题模糊、重复研究
理论框架 有理论基础吗? 基于经济理论建模 数据挖掘、无理论指导
数据 数据可靠吗?代表性强吗? 多来源验证、描述统计 数据质量差、选择偏差
识别策略 因果识别可信吗? 准实验设计、稳健性检验 混淆相关与因果
结果解释 结论合理吗? 谨慎解释、讨论局限 过度解读、忽视异质性
可复现性 他人能复现吗? 公开代码数据、详细文档 代码不公开、细节缺失

6.2 2026 年研究规范

💡 开放科学最佳实践

预注册:在收集数据前注册研究设计、假设、分析方法
数据共享:在合规前提下公开研究数据
代码公开:GitHub 等平台公开分析代码
详细文档:数据字典、分析步骤、参数设置
稳健性检验:多种模型规格、多种方法交叉验证
报告规范:效应大小、置信区间、统计功效

平台推荐:OSF(开放科学框架)、GitHub、Zenodo、AER 数据代码库

✅ 好研究特征

  • 问题重要:回答有意义的经济学问题
  • 识别可信:因果识别策略严谨
  • 数据可靠:数据来源清晰、质量高
  • 结果稳健:多种检验支持结论
  • 透明可复现:代码数据公开

❌ 研究陷阱

  • P-hacking:尝试多种规格直到显著
  • HARKing:先有结果后编假设
  • 选择性报告:只报告有利结果
  • 因果过度解读:相关当因果
  • 外部有效性忽视:结论过度推广