知方号

知方号

实证研究干货专题一:稳健性检验的思路及视角<聚类标准误是什么>

实证研究干货专题一:稳健性检验的思路及视角

稳健性检验是实证研究文章中的必要环节,相信诸多科研工作者因为稳健性检验的问题也苦恼过不少:缺少稳健性检验的思路,检验结果与预期结果不符。在当前极度内卷的科研环境下,一篇文章拥有多个方面的稳健性检验是必不可少的,但受限于研究问题、研究数据、研究样本、研究方法等方面诸多因素的限制,一些稳健性检验无法适用于自己的研究主题,这就需要打开研究思路,从各个方面探索能够采取的方式。社会科学研究不比自然科学,在没有详实的实验记录和实验数据的佐证下,社会科学研究更需要扎实的稳健性检验以验证文章研究的科学性,因此需要丰富稳健性检验的思路及视角,以此为广大科研人员提供一些借鉴。下面是笔者结合自身的科研经验总结的一些稳健性检验的研究视角和思路,供各位读者参考。

01

叙述式思路:分析问题的视角

社会科学研究的核心在于研究怎样一个问题,讲好怎样一个故事,因此讲故事的方式就是一篇文章的关键。我们通常在面临一个问题时所选取的方法是有多个依据的:模型与问题的适用性、方法的可行性、结果的合理性等。在这些决定因素下,我们需要运用的方法并不是独一无二的。大多数研究者选取方法的主导因素是基于结果的合理性和方法的可行性,但实际上只要模型与问题的适用性符合,规范性达到要求,我们采用的方法是有多种选择的。常规的因果识别方法诸如双重差分法、断点回归、事件研究法适用于研究政策效果评估或事件的影响,而在一些研究问题中,如果这些政策、事件可以采用间接的方式量化测度,则又可以选择面板数据模型、时间序列分析等方法进行稳健性检验。同样的,如果是研究两个因素之间的因果关系,作为解释变量的因素存在着相关的实施政策法规、发布的相关文件、发生的相关事件(如研究绿色信贷的影响可以考虑绿色信贷政策的影响;研究金融科技的影响可以考虑金融科技政策或金融科技行为的影响),则又可以将双重差分法、断点回归、事件研究法作为面板数据模型、时间序列分析的稳健性检验;作为被解释变量的因素如果也存在发生与否、是否存在等角度,又可采用离散选择模型作为常规面板数据模型的稳健性检验(如研究xx对ESG评级的影响可以考虑研究xx对是否进行了ESG评级的影响),甚至可以考虑从研究问题的反面即反证法进行稳健性检验。这也是通常意义上更换研究方法的思路,但笔者这里要说的是,更换研究方法的核心不在于仅仅替换了一个与基准研究不同的方法模型,而是在于打开研究问题的叙述思路,考虑如何换个角度讲述所研究的问题,换个视角描述所研究的故事,就好比用朗读的方式讲故事还是用唱歌、快板的形式讲故事。研究者有时候苦恼稳健性替换的方法检验结果不够好或模型不可行时,往往受限于自己所了解的方法模型,欠缺从讲故事的视角来阐述问题,当研究者采取更换方法进行稳健性检验时,考虑阐述故事的角度来更换表达方式,可能就会有更开阔的稳健性检验思路了。

02

度量式思路:变量的更替

如何从多个角度度量研究的主要变量是科研工作者通常采用的稳健性检验,这主要取决于对相关领域的研究深度,相关文献的掌握程度,从而熟悉研究的变量有哪些指标方式可以度量。度量式思路的两个主要视角是替换度量指标和替换计算指标的方法。

变量的计算方法替换如公司融资约束(FC)的计算方式可以采用SA指数、KZ指数、WW指数、Q指数等;全要素生产率(TFP)的计算方式可以采用OLS、FE、OP、LP、ACF等方法估计,又可以采用随机边界分析(SFA)计算产出效率、成本效率、议价能力、投资效率等方面,还可以采用数据包络分析(DEA)考虑到非期望产出和技术效率的TFP;一些需要多个指标合成的综合指数(如北京大学的数字普惠金融指数)计算的方法也可以替换,综合指数的计算方法主流的有主成分分析法、因子分析法、变异系数法、熵值法、层次分析法等,这都需要研究者掌握一定的基础后可以灵活运用变量计算方法的替换。替换度量指标则需要根据相关研究,从不同视角替换变量,如研究银行市场约束可采用价格型市场约束和数量型市场约束度量、研究银行风险承担则可以通过Z-score、不良贷款率(NPL)、风险加权资产占比(RWAR)、杠杆率等指标度量。也可以基于不同数据库、不同数据来源的指标进行变量替换的稳健性检验。

总之,度量式思路的稳健性检验需要研究者前期有一定的积累,从而根据研究问题的需要灵活替换变量进行稳健性检验。

03

对象式思路:研究样本的调整

在考虑了替换研究方法和研究变量的稳健性检验后,研究者应该考虑到研究对象的层面是否具有调整的空间。我们研究的样本通常是基于数据可得的方面选择的,但一些样本的调查数据不一定是准确的,有时候会表现出过多的异常值和极端值(0或负值),采用缩尾可以消除一些极端值,但不能消除样本数据中不符合实际的数值,而且一些样本在某些年份缺失较为严重,这就给调整研究样本的稳健性检验提供了选择。

剔除特殊样本与缺失样本:如研究中国省级层面的问题中,西藏的样本数据通常异常值较多,可以采用剔除西藏样本的数据进行稳健性检验;研究企业、银行、家庭等微观对象时,有些样本的数据在选择的时间范围内缺失较大,可以采用剔除数据连续不足三年(根据样本时间区间)的样本;在某些研究中,也可以在非平衡面板数据与平衡面板数据之间相互调整进行稳健性检验。

调整样本时间区间:一些研究问题的样本时间也可以调整,根据问题的需要调整起始或结束的时间;样本时间的频率也可以根据研究问题调整,可以将年度样本调至季度样本或月度样本,也可以将月度样本或季度样本调整至年度样本。

调整样本范围:样本调整的范围也是可以考虑的视角,当一个问题采用国内的样本数据不够时,可以考虑扩大样本至全球样本层面或欧盟、亚太等地区层面,国内研究的样本如果在省级、市级、县级层面也可以考虑从其他微观的方面调整样本进行稳健性检验,如研究企业的贷款总额也可以考虑企业所在地区的贷款总额等。研究样本的调整要适用于研究的问题,在合理的原则上进行样本调整的稳健性检验。

04

计量式思路:基于规范性考虑

基于文章规范性的考虑可以有多种计量层面的稳健性检验:

缩尾处理的选择:如之前所述的数据中如果存在异常值可采用缩尾处理,而缩尾处理也可以选择在1%-5%的范围内灵活调整,可以表述为:为避免在更大范围上的离群值对研究结论的干扰,

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至lizi9903@foxmail.com举报,一经查实,本站将立刻删除。