如何写实证经济学论文（科技论文也有很高的参考价值）

来源：互联网发布：淘客cms排行编辑：程序博客网时间：2024/06/06 02:20

原文：

http://bbs.pinggu.org/thread-888828-1-1.html

http://bbs.pinggu.org/thread-782298-1-1.html

1、前言

如果你要做一个事情，有想法，有数据，然后去进行论证，这是科学研究的一个过程。经济学论文如此，科技性论文也是，各大互联网公司面对的一些有难度的问题也是如此。如何验证自己的想法，如何给别人讲解清楚，非常重要。这二篇文章虽然讲的是经济学的实证分析，其实对互联网公司做有探索性研究的人来说，也有很高的参考价值。

以下为正文：

2、实证写作

这个题目很大，我分两个层面讲写作论文的问题。第一部分为整体写作，第二部分为细节与步骤。
其实，这里的很多观点并不是我想出来的，而是我的一位老师在平时课上和研讨会等场合反复强调的。
与中国实际情况结合的部分，一般是我自己的想法。无意批评任何个人和单本期刊。希望某些个人判断，不会伤害潜在读者的感情。
之所以写作本文，第一是为了感谢老师的教诲，第二是觉得他山之石可以攻玉，第三是论坛经常讨论实证论文的写作和发表问题。

一、整体写作

之所以叫“整体”是因为写经济学论文必须有通盘考虑，否则写出来的东西即使技术含量很高也难以发表。本文主要讨论发表型论文（非学位论文），并且仅以实证研究为例。本段的重点是写作，故而所有技术工作全部列入前奏部分。

0.前奏

实证的文章首先要有数据，没有数据一切都是扯淡。所以，先把数据处理好。处理数据分两个基本步骤，第一为数据清理；第二为数据计算。这里没有统一的标准应当如何处理数据，但有一个基本要求就是做好Identification。技巧是，要么你借用比较成熟的理论模型，由理论模型到计量模型。这样ID不会有太大的偏差。如果是自己构建计量模型，那么ID的工作要自己严格按照统计和计量要求做，对模型的假设前提与限制有全面准确的理解。国内的实证文章，包括刊发在《经济学（季刊）》、《经济研究》等“顶级”期刊的，普遍存在ID不清的问题。

1. 研究问题

假设所有模型构建、数据分析、稳健性检验都完成了，这个时候你要动笔写论文。在这个阶段，你要做的第一件事情是搞清楚自己在研究什么问题！！！

其实，确认研究问题应该在处理数据之前，否则你很难想象连问题都不知道，你如何处理庞大的原始数据。我之所以把数据处理放在确定问题之前，主要是基于现实的情况。如果我们确认了问题，但数据处理的结果不支持我们的预设问题，那么结果可能前功尽弃。所以，很多实证文章都是先做试验后确定论题的。

但是，一旦有了结果，你就必须严格界定自己的研究问题。第一，你要用简洁但准确的经济学规范用语表达自己的问题。第二，注意表述中问题的导向性，确保读者看到问题不会疑惑。第三，确认这个问题是新问题！！！

2. 方法论

当你有了实证结果又确认了自己的研究问题是不是就万事俱备了呢？不，至少，在这个阶段，你还不能动笔写论文。

你必须要明白，论文的成功不仅仅依靠“完美”的实证结果！！！任何实证结果都是大厨做出的菜，一位厨艺高超的师傅可以用普通原料烹制出美味佳肴。所以，“完美”的结果有时候只能蒙外行，却不能欺骗审稿人。这里，我强调逻辑推理与阐述问题时的语言流畅性。不要小看这两个问题，用什么样的叙事结构去组织文章很大程度上决定了文章的档次。

每个人有不同的方法论，但在这里应该大致上趋同。被普遍接受的方法无外乎是“提出问题，解释问题，阐述问题的重要性，提出解决问题的方法，突出你的贡献”。在论文主体部分，应当注意，问题的提出和解决必须严格按照逻辑顺序，要有写“小说”的心态，做好铺垫，突出重点，善于总结。时时刻刻注意论文的走向，并且确保读者（甚至是外行）可以通过你的引导轻松抓住文章的重点要点（即使他们未必理解所有经济学术语和计量方法）。

3. 提纲与计划

在解决了数据、论题、方法论之后，你可以开始制定计划。这种计划不是国内写的那种空而无物的标题式提纲，必须在每一个段落明确写作目的，明确所用模型（或其他方法）的假设与限制，明确写作的要点。

完成计划初稿后，不要动笔。

两天之后修改计划。

再两天之后交给其他人修改。

一周之后自己再修改，与导师（或者其他有经验的同行）商议定稿。

4.写作与发表

接下来，按照提纲扩充论文，具体步骤将在下一段中详细展开。论文完成之后，不要立刻修改。等两周，等自己把一些固有想法淡忘之后再复读论文进行第一次修稿。将第二稿给同事修改，返回后再次修改。这个过程中可以举行seminar或者workshop，一定要得到反馈意见。梳理和总结意见，进行第三（N）稿的写作。

严格地说，在大修改之后，应该再次做presentation以确认修改是成功有效的。

隔一段日子，对论文重新进行修改，定稿。一般论文从初稿写作完成到投递刊物应该有3-6个月。投递之后，如果通过初审那么一般会要求作者再次修改（一次就刊发的稿子很少很少），那么接下来就是漫长的修改与等待了。

二、细节与步骤

一般实证论文分为：“摘要、引言、理论框架、实证部分、总结”五大部分，其中实证部分可以分为“数据描述、实证模型、实证结果、稳健性检验”。
最后写作摘要和引言，这是惯例。一般应该先写作理论框架，随后可以确定ID的方法，然后解释模型的设定和数据情况，最后报告结果与稳健性结论。
这些问题一般国内谈得比较多，也不需要太多的赘述。我想着重谈谈引言部分。
引言部分应该包括（按顺序）：问题的提出、文献综述、方法选择、结果报告、文章结构安排
1、要提出问题，并且解释问题的重要性。

2、告诉读者现存文献研究到了什么程度，有什么局限，你的研究有何种贡献。
3、介绍方法，阐述清楚自己的研究思路。
4、简单明了地把结果或者结论告诉读者，如果他们有兴趣会认真去看论文的主体部分，否则。。。
5、例行公事，要把后文的结构安排预告

不要在论文中单独出现文献综述部分，除非是学位论文写作，不然没有必要。第一，没有人去看文献回顾，对于外行来说这就是天书，对内行而言这些都是废话。文献回顾的价值是突出自己研究的贡献，告诉读者你做了哪些前人没有做的工作。

如果我们仔细去看国内所谓顶级期刊的论文引言，有一些真的写得非常烂，根本不符合基本的写作规范，也达不到引言的作用。首先，读者不关心过于“宏观”的事情（比如，彩旗迎风、锣鼓齐鸣，xxxx发表讲话），这种政治性高调在论文中没有意义。其次，读者不关心学派之争，不要去批评某些和你不属于一个流派的作者。最后，读者关心论文的方法和结果，但很多作者在引言里只字不提。

三、尾声
实证性文章的结果是报告参数，但其实这些参数的具体值并不重要。这话也许很矛盾，既然我们的工作是围绕着参数进行的，为什么具体值又不要紧呢？
第一，这些参数解决不了实际问题。它们不是圆周率的pai值，也不是物理中的g值。就算你计算出了一个很重要的参数，又能如何呢？
第二，参数的解读可以帮助我们理解经济学问题或者现象。从这个角度说，解读比数字本身重要。
第三，由于国别（或者地区）差异，很多参数并不具备普遍性，也很难真正解释世界。不能夸大参数的作用，这一点国内研究做得非常不好。为了达到某种效果，无限夸大参数估计的力量，使得很多人迷失了方向。

小小的总结：
从结构看，摘要和引言最要紧。因为审稿人不看内容，单凭这两部分就可以拒搞。
从内容看，数据描述和模型设定最重要。因为这部分往往是错误最集中的地方

3、实例讲解

上次的文章（如何写实证经济学论文 http://www.pinggu.org/bbs/thread-782298-1-1.html）有朋友跟帖问如何把常见实证文章分类，我想了很久发现这个很难。所以，在本文中，我只是试图给实证文章分分类，但绝对不是什么标准分类。
本文的目的还是希望引起讨论，并把一些好的范例介绍给大家。欢迎跟帖，我会整理并添加新的意见。所引论文全部为外文资料，这样也省得涉及对国内作者和期刊的褒贬不一。（这不表明国内论文没有好的范例，请勿联想。）

在切入正题前，我想提一下经常做理论文章的Lucas（Robert Lucas）。也许本文的读者大部分对实证感兴趣，或者自己就是做实证研究的，但我还是想强调下理论论文对实证的重要性。大家知道很多人选择实证领域是因为自身数学、计量统计等专业能力所限，不得不转做实证，而真正理论过硬、数学过关的经济学家一般偏向做理论。你可以不同意这个观点，但这个潜规则客观存在于这个圈子。发生在我自己身上的故事，我的老师们（包括我提到过一年发一篇JME的那位）都希望我选择理论方向，但我自知水平有限选择了实证研究。他们同我说：“假如你认为做实证可以不学理论，或者说逃避过理论关，那么你的论文永远是中学生水平。事实上，实证论文比理论难得多！”

这段话，我最近才慢慢明白过来。类似的话，做纯计量理论的老师也同我和我的同学说过，当然，一开始我们都不信。随着自己的成长，我逐渐发现他们的话是对的，所以，我把故事写出来。希望真正想做出优秀实证论文的同仁们一起探讨。

回到Lucas的文章。之所以说他是因为我的老师曾经提起过，现役的经济学家中有两位的文章写得好。这个”好“与经济学无关，只和英文写作有关系。其中第一个是Lucas，第二个是Acemoglu。可能，他的总结主要局限于宏观领域，不过我们不妨学习下这两位的文章。

Lucas论文：

http://home.uchicago.edu/~sogrodow/homepage/papers.html

Acemoglu论文

http://econ-www.mit.edu/faculty/acemoglu/publication

他们都可以称为著作等身了，所以上面的链接无法穷尽他们的所有作品，有对宏观理论有兴趣的读者可以慢慢去查。
重点推荐两篇：

Lucas，2004的一篇JPE，论述收入和乡城移民的理论文章，http://www.pinggu.org/bbs/thread-886664-1-1.html

Acemoglu et al.，2001的一篇AER，用殖民地做IV研究制度与经济发展关系的实证论文 http://econ-www.mit.edu/files/4123

这完全是两种风格和类型的文章，但是它们有一个共同的特点——一针见血。无论是阐述理论模型还是讨论现实问题都言简意赅，不搞迷魂阵。Lucas的文章虽然是理论论文，但读起来不枯燥，他会尽量使用短句和浅显的词表达最直接的意思。这也是为什么我的老师很推崇Lucas，一个能复杂问题简单化的人是真正的大师。反之，大家懂的，倒过来操作的人在我们生活中比比皆是。Acemoglu也是理论大师，他的实证文章相对比例较低，上面推荐的一篇我个人认为是经典之作。对于研究制度与经济发展之间的关系，理论模型有，可如果没有实证研究来验证理论预计是不够的。而Acemoglu使用殖民地的情况做IV很好地解决（或者说尽最大可能解决）了内生性问题，这也是大部分实证研究所面临的难题。

小结：

理论文章要带着对现实的关注，比如Lucas（2004）。实证论文要回答理论问题，或者提出新的理论难题，比如Acemoglu et, al（2001）。

=============================================================

下面，正式地，我们讨论实证论文本身。

目前好的实证论文已经不能缺少Theoretical Framework（理论框架）部分了。当然了，那种为了拼凑一个理论框架而无病呻吟的做法不可取。

我想用一篇尚未发表的论文来做例子：

http://www.economie.uqam.ca/pages/docs/Manovskii_Iourii.pdf

Price of Experience

此文，通过一个简单的计量模型做引子，提出问题”为什么我们在数据发现人们的收入与工作经常成负相关？“。这是典型的实证做法，数据来自美国、丹麦和瑞典。有了这个疑问，读者被吸引住。

我当时看文章的时候有种读小说的感觉，很想知道后面写了什么。

然后是理论部分，这个部分并不难，如果读者有兴趣可以下载论文一看。他们其实就引入了经验指标，并通过简单的数学变形构造出可以用于计量模型的理论模型。这个套路也不是特别难的事情，但要做得严谨和巧妙还是需要花费一些脑筋。

随后的部分是计量模型，但读者理解了理论部分，计量就成为顺理成章的事情。但作者很小心地写了一节”识别“（Identification），这是国内实证论文最大的软肋，没有之一。因为我们不太注意识别问题，所以很多看似高深的计量论文其实就是糊弄人——有时候作者糊弄读者，更多的时候作者自己也被糊弄。简而言之，就是论文研究的主要问题在计量模型中没有体现，而计量模型中测量的是其他问题。也就是我们的经常讲的，驴唇不对马嘴。关于这个问题请参见：http://www.pinggu.org/bbs/thread-893428-1-1.html

随后，作者汇报计量结果，本文主要测量两个参数值（他们的做法有点像宏观的路子，尽管用的是微观数据），这里不展开。然后，使用几种替代性的Specification。最后总结。

纵观全文，构思巧妙，提出的问题很吸引人，理论模型直截了当与计量模型高度贴合，计量识别讨论充分，考虑诸多因素，并指出不同的specification。尽管这还是没有发表的working paper，但其水平已经很高。相信很快我们就可以在世界上30-40名的经济学期刊上看到，甚至可能进入前20名。

如果我们对照下自己的文章，不难发现差距是全面的。第一，问题提出的方式不如他们新颖。第二，理论模型构建不够巧妙。第三，实证部分识别难以自圆其说。

========================================================================
接下来，我用JDE上刚刚录取的一篇论文（Urban growth and uninsured rural risk： Booming towns in bust times）做例子：
http://www.pinggu.org/bbs/thread-885521-1-1.html

这是标准的发展经济学实证文章，使用是国别宏观数据，与上一篇微观数据略有不同。

基本调子很简明，要讨论城市化与经济增长的关系。如劳动经济学版块老大deltaatfr所言“嗯，好文章就是这样，简介几句话，把问题就说清楚了。这篇文章立意很好，提出城市化与经济增长也可以是双轨机制，这就跳出传统传导机制的束缚了。”

具体的模型推导等，这里从略，我想突出一点，关于本文最后部分的模型检验。实证论文最怕无法检验自身模型的正确性和适用性，而本文采用模拟值与数据值比较的办法（out of sample prediction），就是在所有国家中逐一去除一组国家（如亚太国家，撒哈拉国家、拉美国家等），然后用估计系数代入重新模拟出这组国家的城化率趋势图。这种检验直观而且有力，我们看图就知道模型的效果如何。当然，在宏观中有calibration一环，与此还有一些区别，这是题外话。

图中第一行是没有IV的结果，第二行是使用IV的结果，对比明显。

==========================================================

最后，算是一个小小的总结，回答到底实证文章分哪些类。

我只能说常见的：

第一，纯实证，没有理论部分。好的纯实证文章有两种用途，第一，检验某种理论是否符合现实；第二，为了提出新理论问题寻找现实数据支持。一个比较现成的例子是国际贸易中的引力模型。基于引力模型的实证文章很多，一般不需要再赘述引力模型的原始推导过程，可以直接做计量模型。

第二，实证加理论。这样的论文是从数据而来，发现问题，然后用理论解决问题。也就是说，现在计量在前，然后开始构建理论。这类文章其实并不多，因为太难了。

第三，理论加实证。现在大部分外文期刊的实证论文多是这个模式，有一个历史文献中有的框架（当然有所改变，看要解决什么问题），然后从理论到计量模型。

如果还要细分，第三类可以再拆开：

1、引用经典理论模型，稍加修改，符合特定实证问题的要求。

2、基于基本经济学理论，构建自己的理论模型，然后过渡到计量模型。

1 0