Paper · 2024 论文班
最新版课纲 PDF | 课程主页: https://www.lianxh.cn
1. 课程概览
- 时间: 2024 年 5 月 2-4 日 (9:00-12:00; 14:30-17:30, 半小时答疑)
- 方式: 网络直播+20天回放
- 嘉宾: 杨海生(中山大学);王群勇 (南开大学);连玉君 (中山大学)
- 课件/计量软件: Stata,提供全套 Stata 实操程序、数据和 dofiles (开课前一周发送)。建议使用 Stata 16.0 或更高版本。(Note: 部分文章中会涉及少量 R 代码)
- 课程主页: https://www.lianxh.cn
- PDF 课程大纲 ;参考文献
- 报名链接: https://www.wjx.top/vm/exza19q.aspx#
- 助教招聘: https://www.wjx.top/vm/tUu2JT8.aspx#
1.1 授课嘉宾
杨海生,中山大学岭南学院经济学系副教授,主要研究领域为复杂网络、机器学习及因果推断。在 ACM COMPUTING SURVEYS、Emerging Markets Review、 Economic Geography、Ecological Economics、《经济研究》、《管理世界》、《经济学 (季刊) 》、《管理科学学报》、《金融研究》、《会计研究》、《世界经济》等学术刊物上发表多篇论文,主持和参与多项国家自然科学基金、广东省自然科学基金等课题研究。
王群勇,经济学教授、博士生导师,南开大学数量经济研究所所长,中国数量经济学会常务理事,中国统计学会常务理事。主持国家自科基金、国家社科基金、教育部人文社科、国家统计局重大等多项课题。获得首届国家统计科技进步三等奖、天津市科技进步二等奖等多项荣誉。成果见诸 China Economic Review、Stata Journal、Journal of Family and Economics Issues、《数量经济技术经济研究》、《统计研究》等期刊。编写了 xthreg
(平衡面板及非平衡面板固定效应面板门限模型)、cointreg
(协整回归)、sax12
(X12-ARIMA季节调整)、sax13
(X-13ARIMA-SEATS季节调整)、stregress
(平滑转换模型)、xtstregress
(面板平滑转换模型)、midasreg
(混频回归)、mixrereess
等 Stata 程序。
连玉君 ,中山大学岭南学院副教授,博士生导师。毕业于西安交通大学金禾经济研究中心,获经济学博士学位。研究方向为公司金融和金融计量,研究兴趣包括公司治理、现金持有、股权质押、投融资行为,成果见诸 Stata Journal、China Economic Review、《经济研究》、《管理世界》、《经济学(季刊)》、《金融研究》、《统计研究》、《世界经济》等期刊,主持国家自然科学基金 2 项。
1.2 课程导引
论文的价值在很大程度上取决于你解决了什么问题,与之相伴的是一系列逻辑严密分析和论证,或曰「研究设计」。研读已经发表的论文通常只能看到作者研究工作的最终成果,而具体的思考、分析和打磨过程,则不得而知,而这恰恰是多数人渴望学习的。
为此,本次专题课程中,三位嘉宾不仅仅是分享论文写作过程中「风光」的一面,也会倾诉「心酸」的体验。这次讲解的论文有近半数为嘉宾自己的论文,便源于这个考虑。
我们将通过精讲和重现 6 篇发表于 Top 期刊上的论文 (AER、QJE、AEJ、JoE、JFE 等),与大家分享提升研究设计和论文写作能力的经验。课程中涉及的多数论文都会详细讲解实证研究的各个环节,包括:选题、研究设计、数据处理、内生性问题、稳健性检验、结果的解读和可视化呈现,以及研究贡献的梳理等。在此基础上,进一步结合前期和后续文献,讨论其局限和可能的选题方向,以启发学员思考新的选题方向。
课程中涉及多种计量方法的综合应用,包括:
- 高维固定效应模型、长差分、IV 估计
- 多期倍分法 (DID)、双重稳健 DID 估计量
- 基于 Lasso 和随机森林的因果推断方法
- 迁移学习算法
- 分布滞后模型、事件研究法、多元 Logit
- 宏观变量的长期趋势、时变效应
- 生产网络+投入产出表:可视化、外部依赖性
- 稳健性检验、安慰剂检验、反事实模拟
- ……
涵盖的话题包括:
- 土地政策和经济增长
- 名刊工程的政策评价
- 环境污染和治理
- 气候变化的长期效应
- 税收与创新行为
- 社会关系与政府官员选任
- 国内国际双循环生产网络
研究设计方面的主题包括:
- 如何设计研究框架?
- 如何优化文档结构和代码?
- 如何实现「实证结果可视化」?
- 如何论证「研究贡献」?
- 如何进行短期效应和长期效应的分析?
- 如何综合使用多种方法应对「内生性」,确保「稳健性」?
这些主题与大家正在研究或关注的话题存在密切的关联,有助于结合或迁移。
1.3 专题介绍
三天的课程共精讲 6 篇论文,每篇论文均提供完整的重现数据和代码。授课顺序: - 杨海生,5 月 2 日,T1-T2 - 王群勇,5 月 3 日,T3-T4 - 连玉君,5 月 4 日,T5-T6
|> 浏览-下载-所有论文
Day1:基于机器学习的因果推断 + 迁移学习算法
目前多数文献在进行政策评价时主要集中于回答「政策是否有效?」这一问题。然而,更为有趣,也更具挑战性的是「迁移学习问题」。从横截面角度来看,我们需要回答的是“一个在 A 地区成功的政策能否复制到其他地区?”;从时间序列角度来看,我们需要进一步分析“如果某项政策被证实有效,那么在下一轮政策实施过程中,是否可以对现有政策优化?如何优化?”
若从反事实架构角度看待这个问题,其主要技术障碍依然是如何合理估计「反事实」。如果我们能估算出样本中每个个体的反事实,就可以在新一轮政策制定中将有限的资源分配给累积效用最大的那些个体,这是迁移学习和政策优化的决策基础和依据。 毫不夸张地说,现有多数文献中所讨论的政策效应都有必要进一步研究其「可迁移性」,应用面非常广泛。
本专题介绍两类前沿的政策方法:「双重稳健 DID 估计 (DRDID)」和「迁移学习算法」。主要涵盖如下主题:(1) 现行 DID 方法的缺陷以及双重稳健 DID 估计的应用场景、估计方法和结果解读;(2) 如何使用机器学习方法 (ML) 估计 Double-Robust Scores (即处理效应) ,重点集中于 Partial-linear 和 Interaction 两种设定的优势和实操;(3) 迁移学习算法——成功经验的可复制性及其如何在其他地区进行复制。
专题中将精讲 3-5 篇近三年的 Top 期刊论文 (附 R+Stata 代码和复现数据),以便大家了解模型在不同政策情景下的设定和解读方法。作为拓展,我们还将介绍基本模型及其变种在制度经济学、环境经济学、财政以及区域经济学等领域中的应用,以便大家将这些方法「迁移」到自己的研究中去。
各个专题的具体介绍如下:
T1a: 双重稳健 DID:DRDID 和 CSDID (2 小时)
概要: 本讲的重点是 DRDID 和 CSDID。首先,比较 DID 估计方法中的双重固定效应(TWFE)、结果回归法 (Outcome Regression,OR) 和逆倾向得分概率加权法 (Inverse Propesnity Weight Regression,IPW),进而讲解建立在 OR 和 IPW 基础上的双重稳健-双重差分估计 (DRDID, Sant & Zhao (2020)),以及有 Callaway & Sant (2021) 提出的 DRDID 的扩展模型:CSDID。其次,介绍基于「非平衡面板」和「混合截面数据」的 ATE 估计方法,讨论如何灵活地划分处理组,获得各个子样本在事后不同时点上的动态处理效应,帮助大家从多个角度展开分析。最后,以最低工资政策对青少年就业的数据为例,引导学员们如何利用 Stata 和 R 计算 CSDID 估计量。
- 回顾 1:TWFE、OR 以及 IPW 的区别和联系
- 回顾 2:多期 DID - Callaway & Sant (2021), Goodman-Bacon (2019), Athey & Imbens (2018), Sun & Abraham (2020) 估计量的对比和应用场景
- 双重稳健 DID 模型 (DRDID): Sant & Zhao (2020)
- 双重稳健 DID 扩展模型 (CSDID):Callaway & Sant (2021)
- 基于「非平衡面板」和「混合截面数据」的 ATE 和异质性效应
- 案例:Semenova et.al (2020) , Sant & Zhao (2020) ,Callaway & Sant (2021)
- 福利:CSDID 的扩展
T1b: 机器学习在双重稳健估计中的应用 (2 小时)
在 T5 的基础上,详细介绍 ChernoZhukov et al. (2018) 在 partial linear model/interaction model 设定下的双重稳健估计方法,分别简称为 PL-DRE 和 Int-DRE,并以两种常用的机器学习方法:Lasso 和随机森林 (RF) 为例,讲解如何利用 Neyman 正交和 K 折检验进行误差修正。最后以名刊工程的政策效果估计为例,通过 R 讲解 Lasso 的具体使用方法。
- partial-linear model 和 interaction model 中的双重稳健估计
- 误差修正:Neyman 正交和 K 折检验
- 机器学习:Lasso 和随机森林 (RF)
- 福利:“名刊工程”的政策效应 (工作论文)
T2: 迁移学习算法及实现 (2 小时)
针对学员们普遍面对的“政策建议过于空泛”这一问题,介绍 Tian & Feng (2022) 提出的基于广义线性模型的「迁移学习算法」。具体而言,为了更好地判断某地区是否应该实施 A 政策,我们可以充分利用“源数据” (实施过政策 A 的地区数据) ,在此基础上识别政策 A 的对于该地区的可移植性。本讲从广义线性模型入手,讲解如何使用 R 对目标模型由帮助的数据集进行筛选,及如何进行迁移估计。此外,还将帮助学员们可视化地获得各个政策或政策组合的适用范围,提出因地制宜的政策建议和组合方案。最后,将给出迁移学习在雾霾治理中的应用实例。 此外,本课程将结合三个专题的前沿研究分享一系列的福利,主要是关于双重稳健估计及迁移学习算法的应用场景及结果多元化、可视化。
- 迁移学习算法的由来
- 广义线性模型 (GLM)
- Two-Step Transfer Learning 算法理论及实现
- Transferable Source Detection 算法理论及实现
- 目标系数渐进置信区间 (CI) 的构造
- 案例:雾霾治理的政策组合效果及路径优化
参考文献:
- Athey, S., G. W. Imbens, 2022, Design-based analysis in difference-in-differences settings with staggered adoption, Journal of Econometrics, 226 (1): 62-79. -Link-, -PDF-, PDF2
- Callaway, B., P. H. C. Sant’Anna, 2021, Difference-in-differences with multiple time periods, Journal of Econometrics, 225 (2): 200-230. -Link-, -PDF-, PDF2
- Chernozhukov, V., D. Chetverikov, M. Demirer, E. Duflo, C. Hansen, W. Newey, J. Robins, 2018, Double/debiased machine learning for treatment and structural parameters, The Econometrics Journal, 21 (1): C1-C68. -Link-, -PDF-, Replication
- LaLonde, R. J., 1986, Evaluating the econometric evaluations of training programs with experimental data, The American Economic Review, 76 (4): 604-620. -Link-, [-PDF-], PDF2, -cited-
- Sant’Anna, P. H. C., J. Zhao, 2020, Doubly robust difference-in-differences estimators, Journal of Econometrics, 219 (1): 101-122. -Link-, -PDF-, PDF2,
- Sun, L., S. Abraham, 2021, Estimating dynamic treatment effects in event studies with heterogeneous treatment effects, Journal of Econometrics, 225 (2): 175-199. -Link-, -PDF-, PDF2
- Tian, Y., Y. Feng, 2022, Transfer learning under high-dimensional generalized linear models, Journal of the American Statistical Association: 1-14. -Link-, -PDF-, PDF2, Appendix, -cited-
Day2:长期趋势、时变效应与生产网络
T3:气候变化与长期经济增长 (3 小时)
Kahn, M. E., Mohaddes, K., Ng, R. N. C., Pesaran, M. H., Raissi, M., & Yang, J.-C. (2021). Long-term macroeconomic effects of climate change: A cross-country analysis. Energy Economics, 104, 105624. Link, PDF, -Appendix-, App2, -Replication-, -cited-
- 简介: 气候变化是经济学研究中日益受到关注的话题,这篇论文利用 174 个国家的面板数据研究了气候变化对经济增长的长期影响,并根据巴黎协定对不同情形进行了反事实模拟。实践中常见的不当做法是将宏观数据按照微观数据的方式进行建模,忽视了宏观数据的更关键的特征。通过这篇论文大家可以理解对宏观面板数据研究所需要关注的重点,以及模型的估计策略。
- 学习要点:
- 如何估计宏观变量(温度、降雨量等)与长期趋势的偏离
- 如何考察时变效应,计算长期效应和半衰期等
- 如何检验截面相关
- 允许截面相关情形下如何估计面板ARDL模型(Half-panel Jackknife)
- 如何进行反事实模拟
- 可能的扩展方向和思路
T4:生产网络、宏观冲击与投入产出分析 (3 小时)
王群勇, 李月, 薛彦. 国内国际双循环生产网络的冲击传播:特征与模拟[J]. 中国工业经济, 2023(7): 26-45. -Link-, -PDF-, -PDF2-
- 简介: 生产网络是研究政策冲击的有力工具,来自于一个行业或一个地区的冲击最终会蔓延到所有地区和所有行业,而生产网络的内在结构直接决定了冲击的传播特征。这篇论文首先构建了国内和国际投入产出表,基于此考察了各地区和各行业对外部的依赖性;利用贝叶斯方法估计了生产网络的幂律分布特征,并进一步利用假设抽取法进行了反事实模拟,考察了中美贸易断链对国内各地区行业的潜在影响。由于生产网络涉及到矩阵计算,因此论文采用了 Mathematica 完成,提供所有的数据和程序包。
- 学习要点:
- 如何构建生产网络(投入产出表)
- 如何对生产网络可视化、如何描述生产网络的统计特征
- 如何进行贝叶斯估计(幂律分布的参数估计)
- 如何基于生产网络计算地区或行业的外部依赖性
- 如何利用假设抽取法进行反事实模拟
- 可能的扩展方向和思路
Day3:研究设计专题
T5:税收与创新:多种方法的组合应用 (4 小时)
Akcigit, U., J. Grigsby, T. Nicholas, S. Stantcheva, 2022, Taxation and innovation in the twentieth century, The Quarterly Journal of Economics, 137 (1): 329-385. -Link-, -PDF-, -Appendix-, -cited-, -Replication-
简介: 文章研究了美国公司税和个人税对创新的影响。作者将发明人数据库、公司税率数据库,以及州级个人所得税和其他经济数据关联起来,从宏观和微观两个层面估计了税收对创新 (数量、质量、发生地等) 的影响。文中采用了多种识别策略,得到了非常一致的结论:(1) 高税率对创新的数量和发生地具有负面影响,但不会影响平均创新质量;(2) 州级层面的「税收-创新产出」弹性很大;(3) 公司税主要影响受雇发明者 (相对于自由职业者) 的创新产出和跨州流动性;而个人所得税则会对整体创新数量和发明人的流动性产生影响。
学习要点:
- 研究设计和写作。 该文涉及宏观和微观两个视角、各类创新行为的衡量方法、不同的税率指标、短期效应和长期效应估计等多个方面,但全文始终以产出弹性为主线,采用多种识别策略,从不同角度来论证结果的合理性及经济含义,严格遵守了「一个问题一次性说清楚」的原则。
- 研究贡献和结果解读。 这是论文中至关重要但却不容易写好的部分。作者的策略是「对标」——通过与前期 Top 期刊文献的细致对比来论述其贡献,通过与同类或相近文献对比来说明其估计结果的合理性。
- 实证研究方法的组合。 全文使用了近 10 种不同的计量方法,比如「高维固定效应模型」、「交互固定效应」、「长差分」、「事件研究法」、「合成控制+DID」、「分布滞后模型」、「固定效应多元 Logit」等。你能够感觉到作者是信手拈来,因为,每一种方法的应用都恰到好处,虽然难度不大,但能够很好地回答「产出弹性的时变性和异质性」、「政策的短期和长期效应」等比较棘手的问题。
- 文章的附录如何做? 作者提供了一份 70 多页的「Appendix」文档,基本上涵盖了我们所能想象到的各种 稳健性 检验方法,可以作为我们在投稿时制作附录文档的范本。
- 如何扩展? 该文的四位作者,尤其是第一作者做了一系列主题相近的论文,都有很高的引用率,这篇文章本身也被后续学者广泛引用,这为我们在此文基础上选择自己的切入视角提供了很多启发。
T6:社会关系与官员选任:讲好中国故事 (2 小时)
Fisman, R., J. Shi, Y. Wang, W. Wu, 2020, Social ties and the selection of China’s political elite, American Economic Review, 110 (6): 1752-1781. -Link-, -PDF1-, -cited-, -Replication-
- 简介: 直觉而言,与现任成员具有「同乡」或「大学校友」关系的候选人更容易入选。然而,这篇针对中央政治局成员选任的论文却发现了截然相反的结果:同乡或校友背景会导致候选人入选的概率下降 5-9 个百分点,并称之为「人脉惩罚」。文章在多种设定下证实了上述结果的稳健性,进而对三种「排他性解释」进行了检验,为上述结果提供了合理的经济解释。
该文一方面与前期的政治关联、社会网络、社会关系等主题的文献一脉相承,另一方面也为研究政府治理、官员选任以及地方政府业绩等话题提供了很好的视角,具有不少扩展方向。 - 学习要点:
- 如何论述和检验「排他性」解释?
- 高维固定效应的作用和解释
- 线性概率模型 v.s. Logit/Probit
- 如何采用异质性分析强化你的观点
- 顺藤摸瓜:结合该文的 引文,讨论可能的扩展方向
3. 报名和缴费信息
- 主办方: 太原君泉教育咨询有限公司
- 标准费用 (含报名费、材料费):2800 元/人 (全价)
- 优惠方案:
- 三人及以上团购/专题课老学员:9 折,2520 元/人
- 学生 (需提供学生证/卡照片):9 折,2520 元/人
- 充值 连享会会员:85 折 2380 元/人
- 温馨提示: 以上各项优惠不能叠加使用。
- 联系方式:
- 邮箱:wjx004@sina.com
- 电话 (微信同号): 王老师 18903405450 ; 李老师 18636102467
3.1 报名链接
或 长按/扫描二维码报名:
3.2 缴费方式
方式 1:对公转账
- 户名:太原君泉教育咨询有限公司
- 账号:35117530000023891 (晋商银行股份有限公司太原南中环支行)
- 温馨提示: 对公转账时,请务必提供「汇款人姓名-单位」信息,以便确认。
方式 2:扫码支付
温馨提示: 转账时,请务必在「添加备注」栏填写「汇款人姓名-单位」信息。