如何写实证经济学论文(科技论文也有很高的参考价值)

来源:互联网 发布:淘客cms排行 编辑:程序博客网 时间:2024/06/06 02:20

原文:

http://bbs.pinggu.org/thread-888828-1-1.html

http://bbs.pinggu.org/thread-782298-1-1.html


1、前言

如果你要做一个事情,有想法,有数据,然后去进行论证,这是科学研究的一个过程。经济学论文如此,科技性论文也是,各大互联网公司面对的一些有难度的问题也是如此。如何验证自己的想法,如何给别人讲解清楚,非常重要。这二篇文章虽然讲的是经济学的实证分析,其实对互联网公司做有探索性研究的人来说,也有很高的参考价值。


以下为正文:

2、实证写作

这个题目很大,我分两个层面讲写作论文的问题。第一部分为整体写作,第二部分为细节与步骤。
其实,这里的很多观点并不是我想出来的,而是我的一位老师在平时课上和研讨会等场合反复强调的。
与中国实际情况结合的部分,一般是我自己的想法。无意批评任何个人和单本期刊。希望某些个人判断,不会伤害潜在读者的感情。
之所以写作本文,第一是为了感谢老师的教诲,第二是觉得他山之石可以攻玉,第三是论坛经常讨论实证论文的写作和发表问题。

一、整体写作


之所以叫“整体”是因为写经济学论文必须有通盘考虑,否则写出来的东西即使技术含量很高也难以发表。本文主要讨论发表型论文(非学位论文),并且仅以实证研究为例。本段的重点是写作,故而所有技术工作全部列入前奏部分。

0.前奏

实证的文章首先要有数据,没有数据一切都是扯淡。所以,先把数据处理好。处理数据分两个基本步骤,第一为数据清理;第二为数据计算。这里没有统一的标准应当如何处理数据,但有一个基本要求就是做好Identification。技巧是,要么你借用比较成熟的理论模型,由理论模型到计量模型。这样ID不会有太大的偏差。如果是自己构建计量模型,那么ID的工作要自己严格按照统计和计量要求做,对模型的假设前提与限制有全面准确的理解。国内的实证文章,包括刊发在《经济学(季刊)》、《经济研究》等“顶级”期刊的,普遍存在ID不清的问题。

1. 研究问题

假设所有模型构建、数据分析、稳健性检验都完成了,这个时候你要动笔写论文。在这个阶段,你要做的第一件事情是搞清楚自己在研究什么问题!!!

其实,确认研究问题应该在处理数据之前,否则你很难想象连问题都不知道,你如何处理庞大的原始数据。我之所以把数据处理放在确定问题之前,主要是基于现实的情况。如果我们确认了问题,但数据处理的结果不支持我们的预设问题,那么结果可能前功尽弃。所以,很多实证文章都是先做试验后确定论题的。

但是,一旦有了结果,你就必须严格界定自己的研究问题。第一,你要用简洁但准确的经济学规范用语表达自己的问题。第二,注意表述中问题的导向性,确保读者看到问题不会疑惑。第三,确认这个问题是新问题!!!

2. 方法论

当你有了实证结果又确认了自己的研究问题是不是就万事俱备了呢?不,至少,在这个阶段,你还不能动笔写论文。

你必须要明白,论文的成功不仅仅依靠“完美”的实证结果!!!任何实证结果都是大厨做出的菜,一位厨艺高超的师傅可以用普通原料烹制出美味佳肴。所以,“完美”的结果有时候只能蒙外行,却不能欺骗审稿人。这里,我强调逻辑推理与阐述问题时的语言流畅性。不要小看这两个问题,用什么样的叙事结构去组织文章很大程度上决定了文章的档次。

每个人有不同的方法论,但在这里应该大致上趋同。被普遍接受的方法无外乎是“提出问题,解释问题,阐述问题的重要性,提出解决问题的方法,突出你的贡献”。在论文主体部分,应当注意,问题的提出和解决必须严格按照逻辑顺序,要有写“小说”的心态,做好铺垫,突出重点,善于总结。时时刻刻注意论文的走向,并且确保读者(甚至是外行)可以通过你的引导轻松抓住文章的重点要点(即使他们未必理解所有经济学术语和计量方法)。

3. 提纲与计划

在解决了数据、论题、方法论之后,你可以开始制定计划。这种计划不是国内写的那种空而无物的标题式提纲,必须在每一个段落明确写作目的,明确所用模型(或其他方法)的假设与限制,明确写作的要点。

完成计划初稿后,不要动笔。

两天之后修改计划。

再两天之后交给其他人修改。

一周之后自己再修改,与导师(或者其他有经验的同行)商议定稿。

4.写作与发表

接下来,按照提纲扩充论文,具体步骤将在下一段中详细展开。论文完成之后,不要立刻修改。等两周,等自己把一些固有想法淡忘之后再复读论文进行第一次修稿。将第二稿给同事修改,返回后再次修改。这个过程中可以举行seminar或者workshop,一定要得到反馈意见。梳理和总结意见,进行第三(N)稿的写作。

严格地说,在大修改之后,应该再次做presentation以确认修改是成功有效的。

隔一段日子,对论文重新进行修改,定稿。一般论文从初稿写作完成到投递刊物应该有3-6个月。投递之后,如果通过初审那么一般会要求作者再次修改(一次就刊发的稿子很少很少),那么接下来就是漫长的修改与等待了。

二、细节与步骤


一般实证论文分为:“摘要、引言、理论框架、实证部分、总结”五大部分,其中实证部分可以分为“数据描述、实证模型、实证结果、稳健性检验”。
最后写作摘要和引言,这是惯例。一般应该先写作理论框架,随后可以确定ID的方法,然后解释模型的设定和数据情况,最后报告结果与稳健性结论。
这些问题一般国内谈得比较多,也不需要太多的赘述。我想着重谈谈引言部分。
引言部分应该包括(按顺序):问题的提出、文献综述、方法选择、结果报告、文章结构安排
1、要提出问题,并且解释问题的重要性。

2、告诉读者现存文献研究到了什么程度,有什么局限,你的研究有何种贡献。
3、介绍方法,阐述清楚自己的研究思路。
4、简单明了地把结果或者结论告诉读者,如果他们有兴趣会认真去看论文的主体部分,否则。。。
5、例行公事,要把后文的结构安排预告

不要在论文中单独出现文献综述部分,除非是学位论文写作,不然没有必要。第一,没有人去看文献回顾,对于外行来说这就是天书,对内行而言这些都是废话。文献回顾的价值是突出自己研究的贡献,告诉读者你做了哪些前人没有做的工作。

如果我们仔细去看国内所谓顶级期刊的论文引言,有一些真的写得非常烂,根本不符合基本的写作规范,也达不到引言的作用。首先,读者不关心过于“宏观”的事情(比如,彩旗迎风、锣鼓齐鸣,xxxx发表讲话),这种政治性高调在论文中没有意义。其次,读者不关心学派之争,不要去批评某些和你不属于一个流派的作者。最后,读者关心论文的方法和结果,但很多作者在引言里只字不提。

三、尾声
实证性文章的结果是报告参数,但其实这些参数的具体值并不重要。这话也许很矛盾,既然我们的工作是围绕着参数进行的,为什么具体值又不要紧呢?
第一,这些参数解决不了实际问题。它们不是圆周率的pai值,也不是物理中的g值。就算你计算出了一个很重要的参数,又能如何呢?
第二,参数的解读可以帮助我们理解经济学问题或者现象。从这个角度说,解读比数字本身重要。
第三,由于国别(或者地区)差异,很多参数并不具备普遍性,也很难真正解释世界。不能夸大参数的作用,这一点国内研究做得非常不好。为了达到某种效果,无限夸大参数估计的力量,使得很多人迷失了方向。

小小的总结:
从结构看,摘要和引言最要紧。因为审稿人不看内容,单凭这两部分就可以拒搞。
从内容看,数据描述和模型设定最重要。因为这部分往往是错误最集中的地方


3、实例讲解

上次的文章(如何写实证经济学论文 http://www.pinggu.org/bbs/thread-782298-1-1.html)有朋友跟帖问如何把常见实证文章分类,我想了很久发现这个很难。所以,在本文中,我只是试图给实证文章分分类,但绝对不是什么标准分类。
本文的目的还是希望引起讨论,并把一些好的范例介绍给大家。欢迎跟帖,我会整理并添加新的意见。所引论文全部为外文资料,这样也省得涉及对国内作者和期刊的褒贬不一。(这不表明国内论文没有好的范例,请勿联想。)

在切入正题前,我想提一下经常做理论文章的Lucas(Robert Lucas)。也许本文的读者大部分对实证感兴趣,或者自己就是做实证研究的,但我还是想强调下理论论文对实证的重要性。大家知道很多人选择实证领域是因为自身数学、计量统计等专业能力所限,不得不转做实证,而真正理论过硬、数学过关的经济学家一般偏向做理论。你可以不同意这个观点,但这个潜规则客观存在于这个圈子。发生在我自己身上的故事,我的老师们(包括我提到过一年发一篇JME的那位)都希望我选择理论方向,但我自知水平有限选择了实证研究。他们同我说:“假如你认为做实证可以不学理论,或者说逃避过理论关,那么你的论文永远是中学生水平。事实上,实证论文比理论难得多!”

这段话,我最近才慢慢明白过来。类似的话,做纯计量理论的老师也同我和我的同学说过,当然,一开始我们都不信。随着自己的成长,我逐渐发现他们的话是对的,所以,我把故事写出来。希望真正想做出优秀实证论文的同仁们一起探讨。

回到Lucas的文章。之所以说他是因为我的老师曾经提起过,现役的经济学家中有两位的文章写得好。这个”好“与经济学无关,只和英文写作有关系。其中第一个是Lucas,第二个是Acemoglu。可能,他的总结主要局限于宏观领域,不过我们不妨学习下这两位的文章。

Lucas论文:

http://home.uchicago.edu/~sogrodow/homepage/papers.html

Acemoglu论文

http://econ-www.mit.edu/faculty/acemoglu/publication

他们都可以称为著作等身了,所以上面的链接无法穷尽他们的所有作品,有对宏观理论有兴趣的读者可以慢慢去查。
重点推荐两篇:

Lucas,2004的一篇JPE,论述收入和乡城移民的理论文章,http://www.pinggu.org/bbs/thread-886664-1-1.html

Acemoglu et al.,2001的一篇AER,用殖民地做IV研究制度与经济发展关系的实证论文  http://econ-www.mit.edu/files/4123


这完全是两种风格和类型的文章,但是它们有一个共同的特点——一针见血。无论是阐述理论模型还是讨论现实问题都言简意赅,不搞迷魂阵。Lucas的文章虽然是理论论文,但读起来不枯燥,他会尽量使用短句和浅显的词表达最直接的意思。这也是为什么我的老师很推崇Lucas,一个能复杂问题简单化的人是真正的大师。反之,大家懂的,倒过来操作的人在我们生活中比比皆是。Acemoglu也是理论大师,他的实证文章相对比例较低,上面推荐的一篇我个人认为是经典之作。对于研究制度与经济发展之间的关系,理论模型有,可如果没有实证研究来验证理论预计是不够的。而Acemoglu使用殖民地的情况做IV很好地解决(或者说尽最大可能解决)了内生性问题,这也是大部分实证研究所面临的难题。

小结:

理论文章要带着对现实的关注,比如Lucas(2004)。实证论文要回答理论问题,或者提出新的理论难题,比如Acemoglu et, al(2001)。


=============================================================

下面,正式地,我们讨论实证论文本身。

目前好的实证论文已经不能缺少Theoretical Framework(理论框架)部分了。当然了,那种为了拼凑一个理论框架而无病呻吟的做法不可取。

我想用一篇尚未发表的论文来做例子:

http://www.economie.uqam.ca/pages/docs/Manovskii_Iourii.pdf


Price of Experience

此文,通过一个简单的计量模型做引子,提出问题”为什么我们在数据发现人们的收入与工作经常成负相关?“。这是典型的实证做法,数据来自美国、丹麦和瑞典。有了这个疑问,读者被吸引住。

我当时看文章的时候有种读小说的感觉,很想知道后面写了什么。

然后是理论部分,这个部分并不难,如果读者有兴趣可以下载论文一看。他们其实就引入了经验指标,并通过简单的数学变形构造出可以用于计量模型的理论模型。这个套路也不是特别难的事情,但要做得严谨和巧妙还是需要花费一些脑筋。

随后的部分是计量模型,但读者理解了理论部分,计量就成为顺理成章的事情。但作者很小心地写了一节”识别“(Identification),这是国内实证论文最大的软肋,没有之一。因为我们不太注意识别问题,所以很多看似高深的计量论文其实就是糊弄人——有时候作者糊弄读者,更多的时候作者自己也被糊弄。简而言之,就是论文研究的主要问题在计量模型中没有体现,而计量模型中测量的是其他问题。也就是我们的经常讲的,驴唇不对马嘴。关于这个问题请参见:http://www.pinggu.org/bbs/thread-893428-1-1.html

随后,作者汇报计量结果,本文主要测量两个参数值(他们的做法有点像宏观的路子,尽管用的是微观数据),这里不展开。然后,使用几种替代性的Specification。最后总结。

纵观全文,构思巧妙,提出的问题很吸引人,理论模型直截了当与计量模型高度贴合,计量识别讨论充分,考虑诸多因素,并指出不同的specification。尽管这还是没有发表的working paper,但其水平已经很高。相信很快我们就可以在世界上30-40名的经济学期刊上看到,甚至可能进入前20名。

如果我们对照下自己的文章,不难发现差距是全面的。第一,问题提出的方式不如他们新颖。第二,理论模型构建不够巧妙。第三,实证部分识别难以自圆其说。

========================================================================
接下来,我用JDE上刚刚录取的一篇论文(Urban growth and uninsured rural risk: Booming towns in bust times)做例子:
http://www.pinggu.org/bbs/thread-885521-1-1.html

这是标准的发展经济学实证文章,使用是国别宏观数据,与上一篇微观数据略有不同。

基本调子很简明,要讨论城市化与经济增长的关系。如劳动经济学版块老大deltaatfr所言“嗯,好文章就是这样,简介几句话,把问题就说清楚了。这篇文章立意很好,提出城市化与经济增长也可以是双轨机制,这就跳出传统传导机制的束缚了。”

具体的模型推导等,这里从略,我想突出一点,关于本文最后部分的模型检验。实证论文最怕无法检验自身模型的正确性和适用性,而本文采用模拟值与数据值比较的办法(out of sample prediction),就是在所有国家中逐一去除一组国家(如亚太国家,撒哈拉国家、拉美国家等),然后用估计系数代入重新模拟出这组国家的城化率趋势图。这种检验直观而且有力,我们看图就知道模型的效果如何。当然,在宏观中有calibration一环,与此还有一些区别,这是题外话。

 



图中第一行是没有IV的结果,第二行是使用IV的结果,对比明显。


==========================================================

最后,算是一个小小的总结,回答到底实证文章分哪些类。

我只能说常见的:

第一,纯实证,没有理论部分。好的纯实证文章有两种用途,第一,检验某种理论是否符合现实;第二,为了提出新理论问题寻找现实数据支持。一个比较现成的例子是国际贸易中的引力模型。基于引力模型的实证文章很多,一般不需要再赘述引力模型的原始推导过程,可以直接做计量模型。

第二,实证加理论。这样的论文是从数据而来,发现问题,然后用理论解决问题。也就是说,现在计量在前,然后开始构建理论。这类文章其实并不多,因为太难了。

第三,理论加实证。现在大部分外文期刊的实证论文多是这个模式,有一个历史文献中有的框架(当然有所改变,看要解决什么问题),然后从理论到计量模型。

如果还要细分,第三类可以再拆开:

1、引用经典理论模型,稍加修改,符合特定实证问题的要求。

2、基于基本经济学理论,构建自己的理论模型,然后过渡到计量模型。

1 0
原创粉丝点击