超越公共行政案例研究中的“定量范式”——与于文轩教授商榷

发布于 2021-10-10 09:13

摘要

案例研究因适用于分析中国转型期间的各类实质性政治社会问题而为公共行政学界所广泛认可和运用。围绕着立足本土经验的案例研究能否科学识别问题、对已有理论作出贡献等议题,学者们在近年来展开了一系列论争。最新关于如何推进中国公共行政案例研究的相关论述,存在着遵循量化研究随机抽样原则和沿用强势学科信效度评判指标的危险。针对这一趋势,有必要在重新审视案例研究重视实质性问题这一比较优势的基础上,就中国公共行政研究者如何开展案例研究进行再思考。一般而言,为超越“定量范式”,公共行政案例研究者可以从数据收集的“结构化”和分析过程的“可比较”出发,在避免忽略竞争性假设的同时,着力于提出具有一般化意义的发现,进而形成自身特有的研究风格。

作者简介

宋程成,华东师范大学公共管理学院、社会组织与社会治理创新研究中心讲师

文章结构

一、公共行政案例研究的起点:实质的而非随机的

二、案例研究的分析与操作:结构化而非形式化

三、确立与拓展案例研究的发现:一般性而非特殊性

四、结论与讨论

近年来,随着大量优秀案例研究作品被发表,国内公共行政学界对于其基本特点和应用状况进行了一系列回顾,并在某种程度上展开了较为激烈的论争。仔细分析会发现,当前的大部分文献多是从方法论要素以及中国独特环境对案例研究应用前景的影响等角度来分析并形成辩论的。可惜的是,大部分上述文章都是从静态标准角度来论述何为“好”的案例研究,却未能清晰地呈现研究者应该如何在案例分析动态实践中遵循相应的标准与原则。特别地,针对于文轩教授最新发表在《中国行政管理》上的《中国公共行政学案例研究:问题与挑战》一文(下称“于文”)中提及的一系列看法和建议,本文试图在理解和把握其观点背后相关学理依据的基础上,开展一定程度的对话。

具体而言,本文原则上同意于文对案例研究作用以及其与量化研究间关系的讨论,并且无意就案例研究背后的哲学基础或数理逻辑基础进行论争,亦无意反驳于文强调的案例研究信效度方面的各类经典看法,而是试图重申和讨论案例研究的“非量化”特点以及这一特点对研究起点、实证操作和相关发现的可能影响。进一步地,本文试图围绕中国公共行政学的学科特征,就于文部分观点进行商榷,并且希望能够澄清关于案例研究的可能误会,进而从研究开展实操性角度,提出何为“好”的公共行政案例研究的评判标准。

围绕着上述目标,下文主要分为四个部分:首先,从大部分案例研究重视实质性问题、侧重依因变量选择样本的事实出发,讨论在公共行政案例分析中引入量化研究的抽样原则和因果识别机制的可能困境,以及这类做法对于案例研究在公共行政领域独特比较优势的潜在损害;其次,结合案例研究在操作上存在的“易学难精”问题,强调研究者必须特别重视数据的“三角测量”和数据呈现的“结构化”,并且在此基础上有效地开展叙事性分析和尽量排除竞争性假设;第三,就案例研究探索和发现新概念的功能和价值进行了回顾,并提出了公共行政案例研究的概念创新应以机制发现为主要目标,同时,据此强调案例研究的结论也具备一般化的潜力;最后,尝试在引证兄弟学科案例研究发展过程中的经验教训基础上,就开展本土化公共行政案例研究提出可能的“理想方案”。



一、公共行政案例研究的起点:实质的而非随机的


首先,于文使用大量篇幅讨论了从因果机制识别出发来进行案例研究不仅具有必要性,亦具有可能性,并且重点提出了案例研究要尽可能地避免选择性偏差,以及在研究中遵循量化分析控制内生性问题的程序。于文偏重强调因果机制或因果效应识别的论点,虽有一定的借鉴意义,却忽视了公共行政案例研究的重要基础和起点——实质性问题及其非随机分布性

不少研究者由受到社会科学方法论重要参考书目,即加里·金(Gary King)、罗伯特·基欧汉(Robert Keohane)和悉尼·维巴(Sidney Verba)(“KKV”)的《社会科学中的研究设计:定性研究中的科学推理》(Designing Social Inquiry:Scientific Inference in Qualitative Research)一书的影响,趋于认为量化研究和质性研究本质上都是为了识别因果机制,其差别只是在材料意义上;而且,这两种研究(方法)都是系统的乃至科学的。遵循上述看法,于文提出了不应该过分强调案例研究是质性研究,以及案例研究也可以混合的或定量的相应判断,这一思路就社会科学方法论发展的趋势看,基本是合理的。例如,近年来,类似看法甚至在重视情境建构和叙事的人类学领域也开始有所影响。必须指出的是,识别因果关系并且揭示其背后的机制,是社会科学家的基本共识之一。但是,如果太过强调特定强势学科所规定的“因果机制”识别方案,会导致一部分既有现实意义又具备理论价值的案例研究被忽视掉或放弃。这是由于:

第一,从研究起点角度看,案例研究很难遵从严格的统计逻辑。从统计学逻辑看,为了合理识别特定的因果关系,抽样必须是覆盖“自变量”而非“因变量”。而按照我们一般意义的理解,案例研究往往源于有趣、特殊或者反常的社会现象,也即所谓的实质性问题(如中西“大分流”等)。因此,尽管于文强调的量化乃至混合研究的取向,与近年来其他学科中兴起的研究范式有着相互呼应,但是在常识意义上,案例研究仍然被学术界认为是围绕着小样本(即Small N)的一种研究方法(论),这意味着基于事件时间线的基本叙事是案例分析的关键,而量化工具则可以被视为是一种更加精确地控制-比较手段。故而,本文以为,不应该过分强调案例研究的“非质性”或“亲量化”属性。需要指出的是,并不是说量化研究不需要有趣和重要的问题,而是说在研究设计过程中的样本选择阶段,“因变量”和“自变量”在两种方法(论)中存在着显著的“优先序列”差异。例如,于文引证的殷(R. K. Yin)在其书中反复强调案例研究与一般定量分析的核心差异并不是在量化方法的运用,两者的关键区别是案例研究的展开逻辑本质上是“复制逻辑”而非“抽样逻辑”。

第二,进一步地,尽管有着比较案例以及过程追踪(Process-tracing)等分析方法和手段,但由于社会科学研究的对象本身的不可控因素过多和在因果机制上存在着的“多对一”难题,所以在很大程度上,案例研究的因果机制是需要研究者围绕着时间轴来进行勾勒的。当然,有学者可以辩称,尽量寻找可能的案例并且进行控制实验,是合格的学术研究所必须重视的,而且随着相应技术的进步和数据的完备,越来越多的比较案例是可以识别出单一、特定的重要因果机制的。就这一乐观估计,学者们或许可以从赵鼎新对彭慕兰(K. Pomeranz)关于中国和欧洲在17世纪走上不同道路的“大分流”观点的批判中获得某些启示:通过极其详实的历史数据整理后,彭慕兰发现当时的中国江南地区和英格兰地区,几乎在所有的经济、社会甚至技术指标上都十分类似,但是其结局却截然不同——他据此认为,英国的铁矿分布以及海外殖民地获得等意外因素是导致中西分流的关键,而赵鼎新则指出,中英在那个时期的相似性,仅是一种表象,两个社会背后呈现的动力机制完全不同——即政治、经济、军事以及意识形态的组合形态才是决定“大分流”的关键,这一看法甚至为彭慕兰所部分承认。当然,对于赵的上述论断,很快就有学者基于自己的理论取向提出了不同的看法。因此,刻意去寻找自变量随机分布的条件,往往会忽视案例研究自身独有的优秀传统。又如,前一阶段在国内引起热烈讨论的新科诺贝尔经济学奖得主相关研究的价值大小问题,也可以部分佐证这一点:尽管其在印度和非洲有着很多扶贫实验,但是实际收效其实不大,而真正意义上解决了扶贫问题的却是中国这个独特案例。需要指出的是,笔者无意贬低或者忽视各类实地实验/自然实验研究在因果识别等领域的突破性进展和方法论优势,而只是有针对性地想论述案例研究起点选择的重要性。可见,如果仅看到强势学科的量化工具在方法论上的优势,会导致案例研究出现一系列潜在的技术“模仿”风险而丧失其对现实的敏感性

第三,在很多时候,案例研究并不具备开展一系列严格符合“政策效应评估”检验的条件,或者更通俗地说,案例研究本来就很难提供“纯”的数据。多数时候,单案例研究只能沿着时间性这一单一维度上构建出差异,因此深入情境的叙事和尽可能多地思考不同类型的因果机制在案例现象中起到的作用,是必不可少的。就已经发生的事件而言,试图借助自然实验等思路来实现对潜在影响因素的控制,会变得相当困难和不现实。但是,在现实公共生活中,我们可以观察到大量的改变整个行政体系或者行政行为的单一案例,这些情况却又总是值得讨论的,这是因为公共行政这个专业自身的学术取向,迫使我们去深入探讨这些案例。因此,必须重视案例研究的“因变量”自身或者“依因变量选择”(Selecting on Dependent Variables)的基本属性和特点(关于如何破解这一问题带来的困境,可见下文第三点)。我们固然要在分析案例的过程中努力避免对于材料的选择性使用(Cherry-picking),但是在研究最开始的起点选择上,却必须遵循案例研究那些经典作品所秉持的“因变量抽样”原则。更重要的,公共行政这一学科本身独有的问题意识和学科取向,亦迫使学者必须在案例研究起点上偏重问题的重大性、实质性而不是原因本身。



二、案例研究的分析与操作:结构化而非形式化


其次,于文重点指出了基于欧洲传统的批判式和建构主义案例分析缺乏进一步重复和实证的可能性,也提出了一些典型的信效度指标来规避“洞见大于检验”的风险,但是于文所列举的案例分析却并不是传统意义的单案例研究,而是以量化分析为主体的一些经典文献。然而,一味在形式和程序上遵循定量研究在数据分析时的信效度原则,并且有选择地忽视案例研究在数据分析和收集时的差异性,则可能会真正导致案例分析“严谨性”的丧失和研究结论的平庸,甚至在一定程度上阻碍案例研究的可行性。

因此,尽管我们在原则上认同于文提及的大部分数据操作建议,但是当学者们特别是初学者遵照于文建议去着手相应的案例研究时,必然会感到困惑且无从下手。这是由于:一方面,初出茅庐的研究者难以形成有效的问题意识,即提出的问题存在现实意义不足等缺陷;另一方面,则是源于初学者不会很好地整合案例材料和理论之间的关系。这也是为什么大量从事案例研究的学者,要么早期多从事量化研究,要么是在其他科学领域已经有非常强的方法论训练,又或者是在自身领域付出极大努力才成为了资深学者。更重要的是,不同于量化分析有着非常严格的数理逻辑和软件操作手册,案例和质性研究虽然也有很优秀的指导作品或软件——例如,迈尔斯(M. Miles)和哈伯曼(M. Huberman)的《质性数据分析》(Qualitative Data Analysis)、艾森哈特的重要学术论文等,但初学者在模仿和利用教材过程中的“获得感”和“熟练度”往往是差异巨大的。这也是在普遍意义上,偏重定性的博士生比定量学生更难毕业的一个关键因素。

可见,于文在乐观地提及案例研究与定量研究的一致性时,忽略了案例研究或质性研究的关键特点——“易学难精”:比如采访的本质就是聊天,这是人人具备的一项基本技能,但是通过半结构式手段采取的访谈,是一项极为枯燥和有针对性的工作——在部分管理类顶级英文刊物上,有着一条不成文的“潜规则”,如果是案例或质性研究,一般会要求一个学者针对其研究对象至少采访40(人)次,单是这一工作量,就需要研究者有极强的耐性,并且具有很好的沟通和社交能力。从这个角度看,研究者必须在研究设计阶段就充分意识到困难,而不是觉得案例研究的数据收集工作相对比较简单。例如,如果要对中国政府部门或其工作人员进行研究,学者们不仅需要跨越“研究技巧”上的鸿沟,更需要跨越材料收集上的系统性难题。诚如于文所言,案例研究的材料应该足够多,甚至在一定程度上必须是具有“三角验证”(Triangulation)的特点,这不仅有助于学者建构案例故事的完整性和整体性,更有助于我们从不同角度判断学者所提出的分析框架的内在一致性和其对因果机制的论述是否完备。

特别地,数据的三角验证在一定程度上排除了研究者让受访者自身“溯因”(Abduction)的风险。当问及为何需要从事某类实践时,受访者回答的“原因”(其实是“理由”)往往由于自我归因或刻意隐瞒而不可信的。这也是一些社会科学家极端排斥访谈信息的“客观性”并且重视行为数据的原因所在。上述情况又主要体现为两类:一是受访者是“不真诚的”。即因为利益、恐惧或者其他方面原因,受访者不会给出正确的回答。值得注意的是,此类问题不仅出现在案例分析涉及到的访谈中,也大量出现在问卷调查中;所不同的是,问卷调查过程中,研究者可以通过一系列较为巧妙的设置,在一定程度上克服受访者的“隐瞒”倾向,但是在案例分析中,为了确保访谈的持续性,学者们即使怀疑了某些受访者回答的问题,却又不得不继续访谈。上述状况在一些特别问题的研究中,是很难克服的——这也是为什么一些管理学家在研究一部分丑闻事件时,主要依靠新闻报道等各类二手数据,而非访谈来分析。二是受访者是“真诚的”,但是由于天然的“归因”倾向和个体经验的局限性,其对于原因的把握多是片面和扭曲的。众所周知,由于各类因素限制,公共行政研究者面对的受访者,可能多是有着丰富临场经验和应变能力的老练人物,其对于学者访谈目标的识别以及对问题政治敏感度的把控,都相对较强,而这就会加大信息“失真”的可能性。因此,每一个严谨的公共行政案例研究者都不能够把建构因果机制或者“分析叙事”(Analytical Narrative)的权力让渡给研究对象,这既是一种方法上的“不达标”,更是智识上的“偷懒”。

因此,在这个意义上,案例研究得以成功的关键是要有一定的“家法”或标准。例如,工商管理学界近年来兴起了两个优秀的案例研究学术传统:一是以艾森哈特为代表的比较案例方案,二是以乔亚(D. Gioia)为代表的分析性叙述方案。这两个学者有一个共同特点,那就是特别强调数据的“结构化”。近年来,较为优秀的工商管理案例论坛获奖作品,多是通过整理“结构化”数据,建立起多个概念图谱的方式,来形成分析框架,并据此发现相关的因果机制。但笔者以为,要重“结构化”但不能唯“结构化”,真正优秀的案例研究“重意不重形”,只要能够将数据合理呈现并开展有效的比较分析,是否有相应的“一级概念”、“二级概念”甚至“三级概念”并不重要。例如,国内研究自主创新的不少佳作均出自路风教授之手,但是他的论文大部分时候都只有平白的叙述,甚至在理论框架的建构上都尽量追求“简约”。无独有偶,组织战略领域的重要学者伯格曼(R. Burgelman)教授的论文,也是以精炼简约见长,尽管他研究的现象包括了复杂环境下的战略决策和组织演进等充满多样性的问题,但是其作品却往往是在平铺直叙中尽显分析魅力。因此,不同类型的案例研究者应该有自己的分析策略偏好,不要太拘泥于形式上的“相似度”。正如量化研究中名言所云:“Garbage in garbage out”(“垃圾进垃圾出”),类似地,数据分析的“结构化”,不能够替代学术的敏感性和数据收集、获取以及分析的严谨,炫酷的框架和看似复杂的概念,并不能帮助一些作品掩盖其学术思想的苍白和理论建构的无力。



三、确立与拓展案例研究的发现:一般性而非特殊性


再次,于文提及了案例研究中“分析性一般化”的作用和价值,并且重点论述了如何通过单案例分析来确立和拓展相应的结论。不过,于文在强调案例分析可推广价值时,未能系统阐述案例研究“一般化”的产物,即学术概念以及其如何与现有理论间进行合理对话等问题。换言之,由于倾向从定量研究统计法则角度来思考研究结论的“普适性”,于文未能就案例分析结论的一般性与特殊性之间的张力进行有效论述。

第一,一般而言,理想的案例研究,其结论往往会得出一个让人感觉意料之外又在情理之中的“概念”。但是,在现实中,案例研究的新创概念往往最为人诟病,这尤其以“概念拉升”(Conceptual Stretching)现象最为普遍。例如,学界当前最为流行的某些“定语+核心名词”概念,在不少案例研究中已经完全失去了其本来的分析功能,甚至沦为了纯粹的“标签”。当然,这一问题几乎是社会科学研究中的通病,不过,由于案例研究特别适合做探索性研究,这就更容易使学者有“新创概念”的冲动。简单来说,不少概念创新都是偏重于思考案例的独特性而忽视了其形成原因的普遍性。这一问题在过去几年的中国工商管理研究中已经有所展示,甚至有愈演愈烈之嫌。有分析认为,这是由于随着国内学界逐步强调与海外学术界的理论对话,建构基于中国情境的概念以凸显自身文章的理论洞见,成为了学者们最大的动力。随着中国公共行政学者逐步立足中国、走向海外,对上述冲动的抑制会变得越来越重要。

就公共行政领域而言,大量基于案例的概念创新,多发生在现象(或者因变量)层面,即案例本身有趣、吸引人是研究者去分析其的重要原因。但这就会导致一种可能性,就是那些本来可能是同一个概念连续光谱上不同取值的点,被学者们强行通过概念建构而成为不同的类型。从这个角度看,于文提及的Hofstede文化指数模型的确存在着过分简化和不符合一些地区实际等不足,但是这一概念又确实在一定可比较的维度上,告诉国人“中国情境”到底特殊在何处,这与历史学家们关于中国文化到底有多少特殊的分析思路有着“异曲同工”之妙。

针对上述难题,本文尝试提出一个可能的折中方案。事实上,在社会科学中还存在着机制或者原因的概念创新,例如“弱关系的力量”、“集体行动的逻辑”等概念,本身对应着一个或几个具体的机制,而且在现实社会中往往具有一定的普适性。因此,一个好的案例研究,或许应该尝试从因变量出发思考问题,最后找到一个合适、独特的因果机制,并对其进行命名,例如,边燕杰就针对“弱关系”提出了著名的“强关系”理论;在研究中,他是将中国社会作为比较案例,来思考和剖析“强关系”具体运用的独特性。

第二,关于案例研究相关发现理论价值大小的判断,笔者非常同意赵鼎新教授在其新著中提及的标准,即一个优秀案例研究(或质性研究)的解释理论,应该是一个相对其他分析框架而言,可以解释更多(因变量)的理论。这就意味着,即使一项案例研究具有较好的信度和效度,但是如果其不能够避免或者排除其他的分析框架,那么在很大程度上,这个案例研究是成立的,但是其理论价值却是不完美的。而且,由于每一个学者都会在一定程度上受到其自身价值取向和理论偏好的影响,倾向在案例发现中证实而非证伪自己的理论观点——在公共行政这样特别强调实践导向的学科中,学者过分强调理论贡献的结果可能会引起政策和制度上的巨大偏差。在这方面,研究者可以从国际政治学同行的教训中吸取一二,冷战后新自由主义的意识形态及其对应的各类民主化理论盛行学界,由于其核心结论是在比较分析西方和苏东国家的政治经济制度差异基础上得出的,故而在很大程度上忽视了文化、传统和价值观等因素的影响。这一误判最终导致了美国自身对内和对外政策的双重失误,并影响到其长远的国家竞争优势,这一教训在新冠流行肆虐的今天,可谓是殷鉴不远。正是如此,本文特别且充分认同于文强调的混合研究乃至量化研究在案例分析中应用的建议,因为通过使用相对客观的统计法则,经由个案归纳和演绎出的分析框架和理论观点,才有机会在比较中确立起自身真正的解释力大小

第三,案例研究的结论,在何种意义上可以概述或者一般化?这在本质上与案例材料丰富性之间存在着矛盾。这是由于,随着研究者掌握的案例材料越多,其解释就越来越趋于一种特殊理论(Ad hoc Theory),由于社会机制的多样性,到最后研究者会发现案例分析的结果是以复杂解释复杂,而非一般经验科学所希望的“简约性”解释。这一点,正如于文所提及的,在单案例研究中存在着巨大的争议。不过,也正是单案例研究,提供给学者展示其研究水准的最佳机遇,例如,在殷看来,一个好的单案例就像是医学中的极端病例一样,是可遇不可求的。同时,深入地梳理出案例演进的各类要素,在可以“复制”和“比较”的维度上,归纳特殊个案可能呈现的“一般性”标准,是案例研究一般化的前提。因此,并不是只有大样本研究才可以形成是一般化理论,奥斯特罗姆(E. Ostrom)的名著,选取的都是存续时间多年的公共池塘案例,样本量并不特别多,但是其归纳总结的一系列自我组织的制度原则,被认为可以广泛适用和推广到其他领域中,她的工作甚至获得了诺贝尔奖得主阿罗(K. Arrow)的高度赞赏和认可。从现实的角度看,国内公共行政领域早期的比较案例分析,大量地选取了海外新公共管理运动的典型案例,以作“他山之石”之用,而其中归纳出的一系列行政管理经验,的确为中国公共行政改革提供了借鉴。例如,政府购买服务模式的推广,就助推了中国社会组织的发展和国家、社会之间的有效互动。



四、结论与讨论


文章主要围绕着案例研究因变量(现象)导向的基本属性,以公共行政学科本身“实践与理论并重”的基本取向出发,就一个研究者面临相应案例时如何动态地选择其逻辑起点、开展相应分析以及论述相应发现的角度,分别进行了梳理与讨论。其中,通过强调案例研究的“非量化”特征,提出过分遵循定量范式中选择自变量的“概率抽样”原则,会导致案例研究丧失其最重要的“问题意识”优势。同时,从具体操作的角度看,案例研究也并不特别需要刻意沿用量化研究的“信效度”判断标准,而需要在论证和假设检验上,重视数据的“结构化”以及对于竞争性解释的把握;当然,在确保案例研究分析性叙事这一核心策略被遵循的前提下,量化研究或者混合研究设计的很多准则,可以在案例研究中被参考和采纳。第三,在支持于文关于案例研究一般化方面一系列辩护的基础上,本文进一步强调,案例研究的一般化问题,并不直接和样本量或案例数挂钩,而与学者自身的理论演绎和材料归纳能力有关;需要指出的是,在研究开展的过程中,可以把从量化研究那里借鉴的信效度检验原则和数据“结构化”策略,作为整理和简化材料的手段,以助推结论的一般化。

综合上述,相比以往研究偏重分析公共行政领域案例研究需要遵循的一系列方法论要求而言,本文更加重视从研究者的视角来开展分析,以期弥合“静态标准”和“动态运用”之间存在着的实践鸿沟,进而化解案例研究从起点到发现的一系列操作难题。换言之,公共行政学者必须要在研究实践中保证和坚持案例研究的“叙述逻辑”与“理论建构”等真正的比较优势,避免呈现出对于强势学科量化研究的“方法崇拜”而导致的自我矮化,进而失去了评判何为好的案例研究的学科“话语权”,这甚至最终会导致学科认同的一系列危机。在这个过程中,公共行政学者应该有意识地学习和借鉴同为专业学科但发展更早且共同体意识更加浓厚的工商管理学科的一系列经验教训。

最后,笔者特别同意于文认为的案例研究类似侦探小说的“隐喻”(Metaphor),亦认同其关于公开相关案例材料的倡议,这意味着案例研究也需要有一定的“可重复性”。有鉴于此,本文并不希望提供给读者所谓的优秀案例研究操作“菜单”,而是试图提出一种案例分析的可能“理想方案”:即在研究过程中,合格的案例研究者应当像是“本格派”推理小说中的侦探一样,在掌握与其他人相同的证据和信息的基础上,最终通过完备的推理和合理的分析叙事将凶手定位出来(“解释案例现象”)。例如,前文提及的伯格曼教授就认为,我们应该重视和借鉴扎根理论的基本洞见:即仅仅依靠已有文献,很容易导致学者分析思维被限制,真正好的案例研究,必须要及时地立足数据本身,然后再回过头检视现有的理论视角,从而获得更有价值的发现。在这个意义上,公共行政案例研究不仅需要一系列严格的科学判断标准,更需要一个有着很高学术品味和操作手艺的观察者。

本期来源:《中国行政管理》2020年第8期

编辑:蔡龚涛

校对:牛坤在

审核:光涵

往期推荐

政务微博高绩效实施何以实现——基于注意力视角的定性比较分析

中国“放管服”改革研究的进展与前瞻

中国地方政府如何执行模糊性政策?——基于A市“厕所革命”政策执行过程的个案研究

本文来自网络或网友投稿,如有侵犯您的权益,请发邮件至:aisoutu@outlook.com 我们将第一时间删除。

相关素材