如何将实证研究进行到底?

发布于 2021-09-06 13:09

学术国际 :打破科研壁垒,带小白入门!立足于服务学术大众、帮助学术科研群体成长的科研教育公司,核心教研团队由来自海内外top名校教授、博士后、博士,以及顶尖实验室的学科专家组成。做科研,申名校,发paper!

来源:再谈“把实证研究进行到底”

作者:陆铭

经济学是研究社会与人的,这一点决定了经济学必须与现实有关。理论是帮助我们寻找躲藏在社会之中的种种规律的有力的方法,特别是数理逻辑。但是,离开了实证,理论就容易成为断了线的风筝。”陆铭教授在其2004年的一篇文章的开篇这样写道,该文章发表在《经济学家茶座》上,聚焦“实证研究”的论题,一度引起了很大的反响。 十多年后,陆铭在复旦的课堂再次深入探讨实证研究的话题,此时中国经济学的发展早已经历了从拍脑袋想问题到构建数理模型的阶段,中国的实证研究领域在经济学家的推动下兴起。陆铭教授指出,“对于理论经济学家,你可以片面而深刻,但对于实证经济学家来讲,必须全面,而且悉心洞察现实。”


今日,小编先推送陆铭教授《再谈“把实证研究进行到底”》一文的前半部分内容,厘清对经济学研究的“误解”,深入探寻实证经济学的意义,及理论与实践的关联,以期对在理论与实证间摇摆的你有所启发。

对经济学研究的“误解”

“把实证研究进行到底”是04年的时候我写过一篇文章,这文章发表在《经济学家茶座》上,引起了一定的反响,出乎我的意料,也说明实证研究在中国越来越受到重视。在这个时候,的确需要一些这样的文章来帮大家澄清一下对计量的一些认识。

今天,我特别想帮大家清除几个误解,这几个误解也恰恰是我在和同学接触的过程当中,从同学嘴里讲出来的误解,所以不是我生造出来的。

第一个误解是,实证研究就是应用性的,应用性的就不够学术,没什么价值,好像就是回答了一个现实中的问题,发现的结论好像是我们都知道的。

第二个就是大家都会经常讲的一句话,实证研究好做,比理论研究容易做,理论研究做不下去了就做实证研究。讲到这里,这个寒假刚刚迎来了我原来的一个学生,现在比利时鲁汶大学读博士,她最近做的工作和social economics有关系,做的是理论。我们在寒假碰到的时候就谈,我就问她,为什么你这个课题不做实证呢?她说实证太难做了。所以我想,在某些问题上,不是像大家所想的,理论做不了就做实证,可能正好是反过来,是实证做不了去做理论。我等会儿还会讲实证和理论的关系,我会告诉大家,理论和实证都非常重要,而且是互补的。

第三,同学们常常认为实证研究很简单,只要把数据往电脑里一放,结果就出来了,就可以写文章了。有一次,一位同事不无自嘲的地说了这样一句话:觉得很心虚,因为数据不是自己收集的,我们用的很多大样本数据都是别人收集的,idea也不算新,不是自己的,然后程序都是现成的,stata都是编好的。之后我们就把不是自己收集的数据,也不算太新的idea,往stata里一放,就出结果了,觉得很心虚。而我们的同学觉得经济学研究的高手应该是满纸数学符号加上自己编的程序,再画出非常fancy的图形,这就是水平高。

第四个误解是,很多同学认为现在我们研究中国问题,应该做理论,因为理论和国际接轨。特别是对于初学者来讲,考经济学的硕士和博士的时候,都是考的微观和宏观,然后一年级上课的时候上的大量都是微观和宏观的理论,所以你们就觉得那就是经济学的主流,只有做这个才上档次,哪怕做中国的研究,也应该把中国的问题写成数学,甚至干脆就不做与中国问题有关的研究。那是不是这样呢?是不是中国的经济学研究就应该首先做理论呢?

接下来我要讲的这几个问题就想尝试着去清除在大家脑子里面的几个误解。

为什么要做实证研究?

实证研究在现代经济学研究和发展过程中的功能我想有这么几个:

第一,实证研究是用来检验理论的。因为对经济学家来讲,我们有太多的理论,但是在现实中哪个理论正确与否,更重要或更不重要,其实离开了实践,我们是没有办法知道的,这是实证研究重要的第一个方面。而且从经济学的科学化的道路来讲,大家知道,第一届的诺贝尔经济学奖就是发给计量经济学家的,最近这几年也是连着发给计量经济学家。大家知道,对于科学来讲,一个重要的标准就是它可以被证伪,那我们怎么知道理论是正确还是错误的呢?经济学家实际上大量地依赖实证研究来使经济学成为一门可以被证伪或者证实的科学。

第二,to challenge the theory(挑战理论)。当一个理论产生以后,大家知道特别是数学建模的理论,一旦数理逻辑建立起来,它就有自恰性和逻辑的科学性,因为它依赖于数学,数学的逻辑是严密的,所以它在一定意义上是正确的,但是有时候,我们看一个理论会发现,当它得到的结论是x和y是正相关关系的时候,我们觉得现实生活中好像不是这样的。那么可能存在的问题就是,既有的理论没有正确地捕捉现实中的这个关系,或者说没有捕捉到x和y的关系中更重要的方面。那我们怎么知道呢?经济学就依赖实证的方法来看x和y到底正相关还是负相关?如果确实是这样,那么就说明既有的理论在很大程度上可能是正确的。在这个层面上,计量经济学、实证研究和理论研究的关系就像实验物理和理论物理一样。

第五,在现代经济学的前沿研究中,更为重要的是去identify这个机制,特别是在很多宏观的研究里面,我本人也做一些宏观的研究,比如做过不平等和增长的研究,有那么多的理论说这两者是负相关的,也有一些理论说是正相关的,我们现在的工作到了哪一步呢?实际上我们是看neteffect,在不同的理论机制下,我可以告诉你,二者总体上是负相关的。但是,还有一个很难的工作就是,这个负相关到底是因为什么导致的?实际上在我们的研究里我们是不知道的,但是计量经济学很难做的一个工作就是要告诉大家到底是什么机制在起作用?在理论上可能有好几个机制会告诉你这两者是负相关的,但到底是通过哪一个机制起作用的呢?这个机制的identification的重要性就在于,在做政策的时候,知道对什么样的机制去做政策?而这是非常困难的。

因为在收集数据的过程当中,很难区分出这样的机制。特别是在开始做计量还不是很有经验的时候,往往就想去看看x和y之间的关系。在做计量的时候,在收集数据的时候,只考虑x怎么度量,y怎么度量,然后把这数据往机器里一放就可以了,但我们可能很少会去想,x和y之间的中间变量是什么呢?我们可能就会忽略掉这些东西,那最后就没有办法去看到底这些中间机制是什么了,这样就使得研究的档次上不去。而这些工作需要在做实证研究之前,对x到y的各种各样的机制要有一个全面而清楚的了解,并且在做问卷的时候就需要知道,怎么利用一些方法把各种机制独立开,必须要非常清楚地,让大家可以确信地认为你所看到的这个机制是非常干净的。“干净”这个词是一个比较通俗的说法,它是指在我看到的x到y的关系里面,我可以让你确信,就是因为我说的这个机制,而不包含其他的东西,要达到这一点就有很多的方法。

第二个我要讲的问题是,我们处在经济学发展的历史当中的一个什么样的时点呢?我要跟大家讲的第一点就是,经济学整个理论分析的架构已经基本上完善了,这意味着在经济学理论的进展上已经很难有重大突破,这就使得实证研究成为全世界研究的潮流的一个重要原因。我这里要提到陈志俊,他是做产业组织理论的,学物理出身的。我想我刚才讲的这句话可能从我嘴里讲出来你们不太信,因为我现在很多工作是在做实证。他上学期来复旦,seminar完了之后我们在一起吃饭时他就讲,经济学的发展已经差不多了,所以大家现在就该用了,他说了这样一句话,“有的时候我觉得数学太好是害人的”。这句话特别值得数学好的同学去琢磨。

第二点,在有一些研究领域里面,我们有太多的理论,但是经验的证据不足,而这些研究领域里面,现在前沿的领域往往由实证研究所推动。那么有一些什么样的领域呢?我等会儿还会反复再讲到这几个,第一个比如说IO,经验的IO现在成为了IO研究的前沿领域。还有一个很有代表性的研究领域,就是personnel economics,人事管理经济学,现在也是经验的研究非常热。

第三个方面就是,应用的微观和政策的评估。现在在全世界范围之内,政府的公共部门都非常庞大,而且如果看政府的公共开支在GDP中的比重,它在发达国家中是上升的,那么大量的公共开支到哪些地方去了呢?到labormarket, health, education这几个领域里,在这些领域就碰到我刚讲的问题,一个政策下去到底有没有效果?哪个政策效果更大?政府也希望了解这个。

比如我刚讲到小班的例子,这是一个非常好的例子,我也很喜欢举这个例子,在美国,每年有巨额资金投入到缩小班级规模这件事情上。因为大家知道,班级规模缩小需要增加师资、教室、硬件,所以联邦政府州政府把大量的钱投在里面,但这件事情是不是真的像我们想象的那样会改进学生的成绩呢?这是不一定的,因为在一个有选择的社会里面,如果要是有一个班是小班,一个班是大班,大家马上就想到,谁会去选择读小班?往往就是富人,因为他有钱,还有就是父母的教育程度高的家庭也会觉得小班好,所以就会让孩子去读小班,于是就会看到小班的成绩好。但是小班的成绩好是不是因为父母有钱呢?是不是因为父母的学习成绩就比较好呢?还是因为班级规模缩小导致的呢?所以凭我们的肉眼观察到的,小班的同学成绩好,这不说明任何问题。如果这个政策没有效果,你要知道,给政府节省下来的钱,不知道可以造多少航空母舰了。那么在这样的研究里面,政策评估所起到的对于人类福利的改进,对于社会价值的创造就远远大于一个单纯的理论研究。

所以,为什么应用的研究和政策的评估如此之重要?很多人觉得文科好像没什么用,文科就是大家拍拍脑袋,想想idea就可以了。现在的实证研究已经可以为增进社会福利,提高资源的有效性,起到非常重要的作用。那么反过来看中国,我一直讲的一句话就是,有政策无评估,我们做了大量的政策,我们有没有评估?我们知道不知道这些政策有没有效果?我们不知道。

在经济学最近十年左右的时间里面,有一场新的热潮出现在三个领域,我也一直在讲,一个是比较经济学,一个是政治经济学,实际上是新的政治经济学,还有就是社会经济学。我这里特别要强调比较经济学和新政治经济学。新的政治经济学的一个新的研究方向,就是要去看各个国家的政治结构和政治制度对每一个国家的经济增长和绩效有什么样的影响,所以新的政治经济学的兴起,本身就带有比较的视角,那么这就马上带来一个问题,是不是不同国家的社会和政治结构对经济的绩效和增长有不同的影响?这个问题首先是一个实证问题。因为在理论发展之前,我们首先要确认的就是我刚才讲的这个事实,如果它不能被确认,那就不要去做理论了,就无所谓我们讲的comparative economics 或者new political economics了。

再接下来的两个人现在都大名鼎鼎了,我估计未来也可能是诺贝尔奖得主。Shleifer和Acemoglu,这两个人一个在哈佛,一个在MIT,而且这两个人都是研究理论出身的,Shleifer以前做corporate finance的,Acemoglu主要做labor economics的,尤其是human capital, 最近这几个人大量的工作在做实证,而且这两年他们最著名的一项实证研究,也是引起这两个人争论的一个研究,就是institutionand growth,制度与增长之间的关系。还有一个人还没有得到克拉克奖,但是我觉得他完全够格,他也是Becker 的学生,EdwardGlaeser,这人也在哈佛,他也做理论,但他最近大量的工作也在做实证,比如social economics,还有就是在institutionand growth方面他也做过,这人什么都做,城市经济学里也执一方牛耳。你们看看这些人的研究工作就知道国际的前沿在什么地方。

实证和理论有怎么样的关系?

我今天站在这里讲实证的课,我会跟大家鼓吹实证有多重要,但这并不意味着理论不重要。有一次上课,有一个同学听见我讲了这句话以后就问,陆老师,你实证重要,到底理论重要还是实证重要?我说,现在还有人问这样的问题啊?如果有个人告诉你,理论比实证重要,你就把他当疯子就可以了。理论和实证都重要,我今天讲实证重要,并不意味着理论就不重要了,相反,理论非常重要。那么理论和实证之间到底有什么样的关系呢?我先讲两句话给大家听听,这话都不是我的话,是别人说的,我来转述一下。

第一个是我的同学,现在在加拿大女王大学,丁维莉。她有一次讲到一句话,她说我为什么把实证研究来作为我职业的选择呢?因为有一次在开国际会议的时候,有两个搞理论的人争得不可开交,后来有一个实证经济学家说你们别吵了,我给你们看看证据,于是理论经济学家就不吵了。她说从那以后她就坚定了自己做实证经济学的信心。

还有一个就是我刚讲到的我的一个学生,现在在鲁汶大学,叫纪月梅。这次寒假的时候,我也跟她讲,面对很多来自于学生的困惑,就是学生不重视实证,觉得实证很简单,很好做,理论做不了再做实证。她现在做理论,但她在听我讲这句话时眼睛充满了惶惑,她心想复旦的学生怎么会这样,然后她就讲了这样一句话,“我觉得实证经济学家应该多看理论文章,而理论经济学家应该多看实证文章”。

为什么呢?大家想想看,什么叫经济学?我借用王永钦老师的一句话说,经济学理论不在于创造,而在于发现。经济学家有没有这样一个本事,说我们来创造一个理论?经济学家没有这样的本事,他们的本事在于发现现实生活当中存在的规律是什么?那么什么是规律呢?规律无非就是去解释,x为什么会导致y?那么在这之前,你首先要知道x导致了y,于是你才去解释为什么x导致了y。所以实证经济学对于理论来讲,就可以帮你提炼出在这个世界上所存在的事实。

就在这个礼拜二,在图卢兹读博士的李婷到我们学院来做seminar,她是做理论的,她说,“我这次回来,觉得在中国可以做的东西太多了,我每天看报纸看新闻,我就跟我妈讲,好多事情都可以做一篇文章。”她讲的是什么意思?其实理论经济学家的灵感是来自于对现实的观察。报纸是一种观察,电视也是一种观察。而实证经济学家可以做的是提供一种更加科学的,可以被大家确信的观察,如此而已。计量经济学家基于大样本的数据和科学的方法所得到的结论,更加可信,如此而已,所以他可以给理论经济学家提供事实基础。

我刚才讲了实证对于理论为什么重要,那接下来要讲的是实证也必须要基于理论。这里我就要反驳大家一种观点:你们看大量的计量文章的时候,看到的是计量经济学家把10几个变量往方程右边一摆,就出结果了,反正stata都会自动报,在写文章的时候就说x和y正相关,x和y负相关,就ok了,不是这样的。实证研究必须基于理论。当然我这里讲的基于理论并不一定是指基于那些已经发表的数学模型的理论,不是这个意思。你在做实证研究的时候,一开始,从变量的选取到变量的度量,再到模型的设置,都必须要基于理论,或者说得更通俗一点,必须要有理论基础,要能说出为什么,否则你要提高计量方程的非常容易,就一次项放了放二次项,二次项放了放三次项,三次项放了放四次项,……可是有什么意义?如果这样去做计量,没有意义。在放每一个高次项的时候,为什么变量间是这样一个关系,我们根本不知道,因为现在的经济学理论如果告诉我们变量之间有一个非线性的关系,通常在二次项的时候就停止了,很少有人告诉你还有三次项的关系。

第二个方面,就是避免datamining。你们以后在作实证的时候会发现,经常会碰到这样的情况,一个结果出来以后发现跟事前预期不对,有的时候是不显著,有的时候是你以为是正的,结果出来是负的。有一种做法称之为datamining,就是试,不断的试,不断的加变量减变量,不断的增加二次项三次项,或者减掉二次项三次项,再加个log项,然后再加个交互项,然后把数据的度量从FDI变成trade。从这个意义上来讲,做计量的人都知道,计量可以帮你得到你想得到的任何结果,这就是datamining。

如果计量都这么做,那太可怕了,那我们就不要去做计量了,事先就已经知道结论了。那么怎么来避免datamining呢?在具体做计量之前,你已经有一个理论的判断,然后再去做一个计量,一时发现得到的结果跟理论判断不一样,这个时候你要小心,你首先要去想为什么?是什么地方出了问题?之后再把问题找到,根据你找到的为什么会出现问题的原因再去调整你的模型和数据,这就不是datamining。在实际操作的过程中,data mining和我讲的根据理论判断去调整数据和模型之间的界限是很模糊的,但只有严格按照理论的指引得到的结果才是经得起检验的。在现在的学术制度下,你如果只是凑结果,而犯一些非常明显的错误,是不可能发表成果。

第三,可能这话稍微有点过分,对于理论经济学家,你可以片面而深刻,但对于实证经济学家来讲,必须全面,而且悉心洞察现实。大家知道做理论, x和y之间的关系或者相关性,有很多种可能。对于做理论的人来讲,其实他们的工作就是讲一种可能的机制就行了。如果你希望自己的模型复杂一点,丰富一点,可以多讲几种机制,但不需要把x和y之间所有的机制在一个模型里全讲清楚。所以从某种意义上来讲,理论经济学家可以片面的深刻,但做计量经济学就不能这样了,因为当你遗漏掉一个重要的机制或者重要的变量的时候,首先就会出现系数估计的偏误。所以对于计量经济学家来讲,在想到要做一个问题,接下来要去选数据、建模型的时候,必须事先对文献非常熟悉,就是理论经济学大概做过什么,有一些什么理论?前人在做类似的工作的时候怎么设模型,怎么选数据的?之后再做自己的工作。这个时候,遗漏掉任何重要的变量和文献都是非常危险的。

接下来要讲的问题就是,数理的模型和计量之间的关系。现在有一种看法是说,计量之前要先写一个数学模型,这样才上档次,不是这样的。如果你的计量模型可以建立在数学模型的基础上,我只能说这更好,至少是好于或等于没有数学模型。但有的时候它不是一个必需的东西,而且我特别要反对的是,大家为了追求计量模型前面要有一个数学模型,就硬摆一个数学模型在那里。我碰到很多文章,前面的数学模型跟后面的计量模型根本对不起来。那么,什么时候数学的工作在计量之前不是必需的呢?我列举这样几种情况:

第一,理论已经有了,可以直接去检验,这个时候你的创新就是提供证据。比如说,在理论上,在美国教育经济学界,大家都认为学校间的竞争有利于提高学校的效率,于是会对学生的表现有正面的影响,理论上大家都认为是这样,但事实上是不是这样呢?你不需要有数学模型的,只需要直接去检验就行了。而且现在在做的这方面的工作都没有数学模型,这也成为教育经济学研究的前沿问题。

第二,我们已经有足够的互相竞争的理论,我们就去检验一下到底哪个理论更重要?比如我刚才讲的,我们自己也做的,不平等和增长之间的关系。有人讲是正的,有人讲是负的,那我们把它们放在一起,看看到底是正是负。有人讲短期是正的,长期是负的,那我们也把它们放在一起,看看短期和长期是不是有这样的差别。

第三,如果机制已经非常清楚,并不需要什么东西都写成数学模型,数学模型是帮助我们看人脑可能看不清楚的机制的。如果人脑的思路已经够清楚了,就不需要数学模型了。比如说,在social economics 或者教育经济学里面有这样一些课题非常热,第一个是peer effects(同群效应),说的是你的成绩受到你同学的影响。比如在同学中会看到喜欢学术的往往是同一个寝室的,大家相互影响就都喜欢学术了,喜欢打电脑游戏的也住在一起,这就是peer effects。那么这个东西我们是不是要用一个数学模型去写,为什么喜欢游戏的人会影响到周围的同学呢?对于做实证经济学的人来讲,大家都觉得这件事情可能是存在的,我只不过是去identify到底是因为人们住在一起以后才受到了peer effects,还是相同类型的人事前就选择住在一起。对于实证研究来讲,更重要的是这个问题。

第二个例子,大家知道在现实世界中有所谓居住区的分割,就是穷人和穷人住在一起,富人和富人住在一起,然后有人就说,当存在social interaction的时候,由于穷人和穷人在一起,大家都相互有负面的影响,富人和富人在一起互相也有负面的影响。于是穷人的人力资本的积累就减慢了,他们的失业概率就提高了。可是这里面就碰到实证上一个很大的问题,你观察到的这种现象到底真的是因为social interaction导致的,还是事先对人力资本都不偏好的穷人选择住在了一起?这也是我们不知道的。这个东西需不需要数学模型呢?对于实证经济学家来讲也可以不写,因为更重要的是去identify到底是哪种情况导致的?人和人住在一起就会相互受影响对于实证经济学家来讲不需要去写数学模型。

第三个我要举的例子就是social multiplier。大家知道在经济学很喜欢乘数,比如凯恩斯乘数,就是一点点货币政策、财政政策可以通过凯恩斯乘数放大。现在社会经济学的发展里面就提出这样一个新的概念叫social multiplier。就是说如果人和人之间的相互影响是存在的话,那么一点点政策的效果就可以通过人和人之间的相互影响而不断放大。比如上海市有一个项目叫“百万人学礼仪”,就是政府投入一笔钱来让大家提高礼仪修养。大家想,你学了这些礼仪之后回到你的社区或者同事里面,你可能就会影响到他们,大家会觉得怎么这个人穿得好了或者吃饭的样子好了,他就会来学你。那么这种效应不需要通过政府的政策实施就会存在,所以你在去评估整个政策效果的时候,你看到的是最终效果,这个最终效果除以政策直接作用的那个人的效果就是这个social multiplier的大小。在实证上这个social multiplier到底存在还是不存在?到底有多大?这个也成为实证研究上非常前沿的课题,这个也不需要数学,因为我们都知道这个事情要么存在要么不存在,就通过人和人之间的互动就产生了。

在有一些研究课题里面,实际上经济学家已经出现理论经济学家和实证经济学家的分工,就象物理学家已经分工为理论物理学家和实验物理学家。这个时候如果你的比较优势是在实证方面,你不需要去做理论经济学家应该做的那些工作。因为在某些研究领域里面,理论经济学家所用到的那些工具和实证经济学家所用到的工具相互的进入成本是非常高的。我举个非常简单的例子,social network。社会网络的计量有一套方法,但是对于社会网络的形成的数理建模用到的数学工具是图论。我不知道什么是图论,我只知道这个词。在我做的工作里面,我也会去做social network的形成和影响。但我要去做social network是如何形成的理论工作,对我来讲就是找死了。所以像这样的领域里面,你进入的时候就应该清楚你想做什么样的经济学家,这并不意味着那些会用图论的就比那些不会用图论的更加高明和聪明。因为对于那些做理论的人来讲,他也不知道这些东西到底在现实里有没有。这时候你要定位自己是一个实证经济学家,你就大胆去做就好了。

学术国际
提供学术论文、课题、研究方法、学科理论等科研辅导,国内外学术科研领域前沿动态,致力于为本、硕、博及从事学术科学研究群体实现学术交流与科研互助自由!
1篇原创内容

本文来自网络或网友投稿,如有侵犯您的权益,请发邮件至:aisoutu@outlook.com 我们将第一时间删除。

相关素材