大陆社会学人类学门户
社会与人口学院网站
南京大学社会学系
清华大学社会学系
北京大学社会学系
复旦大学社会学系
中山大学人类学系
社科院社会学研究所
厦门大学社会学系
社会学学科导航
社会学文摘库
社会学研究
中国社会工作
大陆学术网络资源
社会学人类学中国网
中国社会学网
社会学吧
清华社会学社区
中国人民大学性社会学研究所
三农中国
哲学在线
人民网
人类学在线
三校社会学论坛
中国社会文化人类学网
黄宗智个人主页
中国农村研究网
香港中文大学中国研究中心
中国城市社区网
天益
青年文化评论
学说连线
学术中国
中国改革论坛
马克思主义研究网
思想帝国
乡村中国观察
乌有之乡
中国心理学网
中国政治学网
中国法理网
正来学堂
中国选举与治理网
中国学术论坛
中国文化论坛
国务院发展研究中心
制度分析与公共政策
洪范法律与经济研究网
光明网
新华网
早报网
二十一世纪
二十一世纪网
学术批评网
中国改革论坛
社科文献出版社
大陆以外地区、国家资源
哈佛大学社会学系
芝加哥大学社会学系
加洲大学伯克利分校社会学系
普林斯顿大学社会学系
哥伦比亚大学社会学系
华盛顿大学社会学系
牛津大学社会学系
耶鲁大学社会学系
杜克大学社会学系
剑桥大学社会学系
台湾大学社会系
政治大学社会系
台湾社会学会
香港城市大学应用社会科学系
香港理工大学应用社会科学系
香港中文大学社会工作系
港大社会工作及社会行政学系
社会学理论连接
美国社会学季刊
annual reviews of sociology
国际社会学会
社会学方法与研究
美国社会学会
美国社会学案例数据库
sociology research online
王天夫 社会研究中的因果分析
作者:王天夫 发布时间:2008-01-27 信息来源:社会学视野网
社会研究中的因果分析
王天夫 / 清华大学社会学系
原载《社会学研究》 2006 年第 4 期 提要:因果分析是科学研究的基础,也是科学知识积累和学科建设的核心。然而,当前社会研究方法中存在着一系列问题。在某种程度上,这些问题可以被归结为对于因果分析的忽视或理解不清。本文试图提供一个清晰的因果关系的概念,提醒因果分析对于社会研究而言的重要性和相关性,并结合当前社会研究中的某些不足,给出应用因果分析的一些基本原则和技术。文章强调定性和定量研究方法在使用因果分析以达成具有普遍性和解释力的结论上是一致而没有区隔的。 关键词:因果分析;因果关系;社会研究方法 一、引言 人们在探求和认识世界的时候,总是希望能够回答 “ 为什么 ” 的问题,即想要解释他们所接触到的现象是在哪些因素的影响下产生和形成的。正是对于这样的现象背后相对恒定的因果机制的挖掘,才构成了我们知识积累的可能。 毫无例外,社会科学的各种分支学科对于社会现象的研究也(应该)以寻求因果关系为中心。其原因显而易见:它是我们理解社会现象的基础;只有这样,才能累积知识,进而建立具有解释性特征的学科理论。用更加通俗的叙述方式就是,社会科学研究总是围绕 “ 发现问题 ” 、 “ 理解问题 ” 和 “ 解决问题 ” 而展开的。(注 1 )我们知道,仅仅发现问题对于我们改造社会、促成进步是远远不够的,对于社会现象 “ 为什么 ” 会发生的解释正是我们解决问题的出发点。给定因果分析的有效性,从因果分析的结论可以预测事件将来在什么条件下可能发生并得出干预措施中的控制手段,从而为我们制定对策、改良社会提供依据。因此,因果分析是社会科学研究中的关键。 (一)存在的问题 从理论上讲,因果分析理应在社会科学的研究中占据中心位置。但是,在当前的社会科学中,有大量的研究延续了人文学科的传统,承接了政策研究的风格,采用了新闻写作的手法,并不以因果分析为核心。由于对因果关系的理解以及对于因果分析在知识积累中的作用并无深刻和准确的认识,即使在某些使用了因果分析术语的研究中也没有显示出系统的分析方法。因而,在实际的研究中无法得出具有解释力的结论。这些问题的存在凸显了在社会研究中对方法的研究和使用上的某些欠缺。 翻开某些社会科学的学术刊物,我们可以发现大量的兼具新闻报道、政策分析、甚至是故事讲述性质的 “ 学术 ” 论文。通常,这样的文章讲解的论点既没有清晰的理论脉络,也不是建立在有效的研究样本上,更未能尝试回答 “ 为什么 ” 的问题。换言之,这样的研究在其设计阶段就存在着重大缺陷。其根本原因是,在思考研究问题时,研究者并没有有效地运用因果分析的原则来解剖其研究对象。这样的研究既不能帮助我们正确地理解研究对象,也无助于学科理论建设中的积累、创造和发展。 在研究中,一个非常普遍的现象是,我们经常听到初学者说对某一社会现象很感兴趣,并且很想了解这一社会现象是 “ 怎么样 ” 的。但是,他们通常拿不出一个完整的研究计划。我们知道,在研究设计的阶段,这样的兴趣是远远不够的。有效的研究设计一定要建立在有效的研究假设之上。缺乏理论背景知识是可能的原因之一;而没有去探究这一社会现象背后的因果关系则可能是另一个原因。因此,在一项社会研究的开始,我们通常要问为什么的问题。尝试着回答这一问题才能引导我们得到一个完整的、富有潜力的研究计划。因而,对于因果分析原则的运用,可以直接帮助我们寻求有效的研究假设和勾勒合理的研究设计。 (二)需要区别的几个概念 在理解和运用因果分析的过程中,往往存在着一些人为的偏差和误区。一个最常见的现象就是混淆联系( association )与因果关系( causal relationship ) . 两个现象之间的联系是构成因果关系的必要条件,但并不是所有的联系都构成因果关系。(注 2 )一个例子是,某地区汽车防冻液的销售量与高速公路上的汽车追尾数量成正比关系。但我们知道,其实汽车防冻液的销售量与高速公路上的追尾数之间没有逻辑关系,因而也就不能互为因果。它们之间的联系仅仅是因为冬天气温太低,所以汽车防冻液销售量大;同时,由于冬天气温太低,高速公路路面结冰使得汽车容易打滑失控,因而追尾的数量就多。因此,虽然汽车防冻液的销售量与高速公路上的追尾数有着一种共变性的关系,但并不是因果关系。这是因为,汽车防冻液的销售与高速公路上的追尾并不存在谁决定谁的问题。在这里,冬天的天气 —— 气温低和路面结冰 —— 才是造成它们的原因。所以,区分联系与因果关系的标准在于因果关系中的 “ 因 ” 是导致其 “ 果 ” 产生的原因;而这一逻辑过程在联系中是缺损的。 另外,一些社会研究者通常把事件的过程描述( explanatory description )等同于因果分析。这两者间的区别其实是一个研究策略的问题。过程描述只意在发现和描述普通的带有规律性的模式;而因果分析则是要找出某一现象特定的 “ 因 ” 。比方说,在社会分层研究中,流动表格( mobility table )曾经风行一时。这种统计工具描述了父辈与子辈间的职业变动过程 —— 儿子的职业以什么样的形式承接了父亲的职业,但是,我们不能把这样的过程部分或完全等同于一个因果过程。这样做的危险不仅在于它约束了我们挖掘其他解释的可能,而且直接断绝了我们寻求真正的因果关系的努力。因为,把过程描述简单地等同于因果分析,忽略了 “ 因 ” 和 “ 果 ” 的真正涵义,并且很容易让我们走上职业的 “ 社会遗传 ” 的偏轨上。我们现在知道,在父子职业的关系之间有一系列的介入变量( intervening variables ),父亲职业对儿子职业选择的作用在很大程度上为诸如经济资本(家庭收入)、文化资本、人力资本以及社会资本等所吸纳。这些结论正是在我们不把上述过程描述等同于因果解释,进而挖掘这一表象之后的因果机制( causal mechanism )而得出的。因此,区分过程描述和因果分析有助于我们对因果关系进一步的清晰化和细致化。 这又引出另一常见的误区:把回归统计分析等同于因果分析。虽然我们看到的对于回归系数的解释通常是,自变量的一个单位的变化引起或造成了因变量多少单位的变化。在一定程度上讲,回归统计分析中的因变量和自变量之间的关系是对称的。即, Y =α+βX +εi 与 X=γ+θY +εj 中的回归系数之间存在着由数据所确定的数量关系。换言之,回归统计分析本身并没有内在确定的因果关系。(注 3 )上述模型中的 Y 与 X 之间的关系事实上是在模型之外决定的。回到上面提到的汽车防冻液和高速公路上追尾的例子。虽然这两者之间没有因果关系,但是两者之间的回归分析一定会得出一个非常显著的回归系数。但由于这样的回归分析是没有理论支撑的,而是强迫性的数字游戏,因而,所得到的回归系数在因果推论的层面上就毫无意义。一定程度上讲,回归统计分析仅仅是我们理论模型的数字式反映。(注 4 )统计变量之间因果关系的确立,取决于代表这些社会现象的变量所处的场景,根据理论常识和对以往理论的推导而得出。事实上,在 20 世纪 40 、 50 年代的社会学研究中,因果分析是在定性分析中得以强调的;当时快速发展的统计分析方法更注重变量间的联系,对于通过数量化的统计分析而得出的因果关系的结论持有一定的怀疑态度( Abbott , 1998 ) . 只是在回归分析日益泛滥的今天,才会出现把因果分析和回归模型简单捆绑在一起的情形。虽然回归统计分析可以帮助我们通过控制其他变量的手段理清因果分析中的特定逻辑关系,但是,其本身与因果关系是没有直接关联的。 (三)本文的内容 本文的目的是给读者提供一个清晰的因果关系概念,强调因果分析对于社会研究的重要性和相关性,并结合当前社会研究中的某些不足,给出应用因果分析的一些基本原则和技术。 首先,我们将讨论因果关系的确立。从休谟的经典阐述开始,这一概念到现在已经在几个方面得到了扩展。一个从行为( action )来理解起因的角度引出了操控的概念( manipulability ),对于社会研究有着积极的借鉴作用。随后,我们将发现因果分析的类型与社会研究的几个领域是相对应的。而通常只有外来因素才可能构成导致结果的起因。其次,我们将讨论社会研究中的时间和层次问题。在某些情况下,社会现象中的起因和结果将难以分清。另外,社会研究所关注的是社会群体、制度以及结构上的起因。再次,在对定性和定量研究的讨论中,我们认为它们有着相同的需要 —— 应用因果分析的逻辑。这样的结论也提醒当前以定性研究为主体的社会研究更应关注因果分析。 接下来,我们给出确定因果顺序的一些启示性的原则和具有帮助性的技巧。路径图可以使得复杂的因果过程显得清晰和简洁。 最后,在总结全文的基础上,我们指出因果关系是具有一定的情境背景的。描述这样的背景对于我们理解因果机制有着重要意义。定性和定量研究方法在这里可以找到共同的空间。 二、怎样确定因果关系 讨论了因果分析的重要性之后,一个显然而又直接的问题是,两个社会现象之间究竟有什么样的关系才能构成因果关系?换一种提问的方式:确立因果关系的标准到底是什么?对于这一问题的回答有着悠长的历史。这是因为人们有着寻找因果规律的倾向。亚里士多德很早就提出了关于因果关系的体系(参见下面因果关系类型的叙述) . 即使在日常生活中,我们也时常做出含有因果关系的推断。 (一)休谟的因果分析标准 休谟通常被认为是近现代对于因果关系有着重要贡献的哲学家(休谟, 1980/1739 ) . 大体来讲,休谟关于因果关系的论述包含时间上的先后、经验上的相邻以及恒常的关联( constantconjunction ) . 这构成了因果关系的要素。 当我们给出一个因果判断时,如 “ 现象 A 导致了现象 Z ” ,这两个现象在时间上, A 先 Z 后;在经验的时间和空间维度上, A 和 Z 是相互邻近的;另外, A 和 Z 总是同时出现的。虽然休谟对于因果关系的论述是建立在台球撞击的单一的例子之上的( Sobel , 1995 : 5 ),但是后来者认为,其关于台球运动的因果关系的判断是相对于一系列类似的例子的。因此,这样的个别例子是蕴含于更多的某一类型的观察的经验之中的。这就是所谓 “ 规律 ” 的由来。 休谟最早的论述认为因果关系的两个现象之间的必要性( necessity )并不存在于经验当中,而仅仅存在于观察者的思想当中。这样的形式构成了一种 “A 现象导致 Z 现象 ” 的主观的必然性( inevitability ),而投射到经验世界当中,就形成了一种 “ 必要关联 ” 。不论后来者对于这样的论述赞同与否,他们都认为因果关系的两个现象之间存在着关联它们的规律。 (二)批判、相关讨论及概念的扩展 继休谟之后,许多学者对于因果关系的哲学讨论拓宽了这一概念。一方面,这些讨论动摇了休谟的经典论述;另一方面,它们也使因果分析可以涵盖更多的经验研究实例。这些讨论中,有的是在修正和修补休谟原有的论述,有的则是直接了当地给出了批判。 1. 时间上的先后 在作出因果判断的时候,时间上的先后秩序并不一定是必须的。这是因为,起因和结果在很多时候可能是同时出现而无法区分先后的。 康德给出了一个经典的反例。当放置一个铅球在软垫上的时候,这一动作在软垫上制造了一个窝样的形状,放置的动作与窝状的形成是没有时间上的先后的。社会研究中的类似例子也很常见。例如,某些人的高消费能够满足他们对于自已身份的认同和表达,两者其实是同一行为的两个方面而已,没有时间上的先后之分。另一观点则认为,起因和结果的发生必然是同时的,一旦它们之间有着距离,那么切入其间的其他因素可能成为影响结果产生的原因(其他的观点,请参见后面有关因果关系秩序的分析) . 对于这样的批判,一种调和的观点是,在时间维度上,我们要区分因果关系在概念上与物理上的时间先后秩序,概念上的先后秩序是与物理上的时间无关的。以上面放置铅球的动作为例。虽然放置的动作与软垫上的窝状没有物理时间上的先后,但是,在概念上,放置的动作显然要 “ 先于 ” 窝状的产生。另一方面,因与果之间有着距离(物理时间意义上)时,这样的因果关系就存在着时间上的先后。 2. 起因的复杂性 虽然,休谟最早对于因果关系的论述建立在一个单独的事例之上,但是,一个单独的现象要导致另一个现象的产生,几乎是不可能的。导致一个现象出现的起因往往有很多,这些起因间的组合往往又是多种多样的。当一系列起因同时出现才会导致结果现象的产生时,这样的起因被称为 “ 联合起因 ” ( conjunctive plurality of causes );当一系列起因中的任意一个出现都能导致结果现象的产生时,这样的起因被称为 “ 选择起因 ” ( disjunctiveplurality of causes ) . (注 5 )联合起因中的某一起因的出现并不能导致结果现象;与此相反,选择起因中单独起因的出现均能够引出结果现象,这一过程并不会因为有多个起因的同时出现而有所改变。后者亦即我们通常讲的 “ 多元起因 ” 。 实际中的起因往往是联合起因与选择起因的复合。例如,寻求一份好的工作需要有很好的教育背景或者是很强的关系网;同时,决定教育的因素包括天资聪慧和后天努力,而决定关系网的因素包括父母因素和人际交往能力。那么,我们有( [ 天资 ∩ 努力 ] ∪ [ 父辈关系 ∩ 交际能力 ] ) => 一份好工作。第一级起因包含教育背景(第二级)和关系网(第二级)的合集,它是找到一份好工作的充分必要条件;独立的第二级起因分别是第三级起因 —— 天资与努力、父辈关系与交际能力 —— 各自的交集,它们是找到工作的充分但非必要条件。而单个的第三级起因,如个人交际能力,既不是结果的充分条件也不是其必要的条件。这就是麦基所讲的 “ 充分但非必要条件中的非充分但不多余的部分 ” ( an insufficient but nonredundentpart of an unnecessary but sufficient condition ;其简写形式为 inus ,可音译为英纳斯)(参见 Marini Singer , 1988 : 355 ) . (注 6 )通常,在探求多元起因时,我们就是指上述的英纳斯起因。在社会研究中,理论往往涵盖了一系列相关的结果。因此,我们探求的往往是结构性起因。与休谟最初所论述的相对简单的因果关系相比,这种结构性的起因对于结果的产生有着更加复杂的内部机制和关联(参见下面第三小节因果之间的概率关系) . 3. 虚拟情形以及操控的概念 如上所述,休谟认为因果关系中是不存在必要性的。后来学者对这一论述的讨论和扩展构成了定义因果关系的核心。 显示必要性是因果关系条件之一的经典例子是,白天之后是黑夜(同时,黑夜之后又是白天)的时间上的循环,并不构成白天与黑夜或黑夜与白天之间的因果关系。因此,我们要区隔因果关系与不包含因果关系的 “ 规律性 ” 的恒常的关联,而区分这两者的标准就是必要性是否存在于提及的两个现象的关系之中。其方法则是构建一个虚拟( counterfactual )情形( King et al . , 1994 ) . 之所以称之为虚拟情形是因为,我们无法在现实中观察到这样的情形。给定已经观察到结果(如 A=>Z ,即 A 的出现导致 Z 的发生),在假想中,若结果的不出现必然意味着起因的缺失(即,若 Z 没有发生,则必然有 A 的缺失),那么,这样的关系就是因果关系(即, A 是 Z 发生的起因);相反,若结果的不出现并不一定意味着起因的缺失(即,若 Z 没有发生, A 可能缺失或可能出现),则表示这样的关系是不包含因果关系的恒常现象( A 并不是 Z 的起因) . 以上虚拟的概念引出了另一概念 —— 操控( manipulability ) . 在一定的条件下,人们可以通过操控给出特定的起因(特定的变量值),从而得出特定的结果。因此,发现因果关系的过程变成了一种行为的过程:通过控制一个因素来观察是否能够导致另一个结果,我们就可以区分因果关系与不含因果关系的联系。对于起因 A 和 B 以及结果 Z ,它们的取值有( a , a* , b , b* , z , z* );(注 7 )同时,当已有的观察结果显示,( a∩b ) =>z 发生(即, A 与 B 的同时出现导致了 Z 的产生),我们可以通过操控 A 与 B 的取值的不同组合( a*∩b ; a∩b* ; a*∩b* )来观察 Z 是否产生( z 或是 z* ) . 这样的结果可以帮助我们进一步分辨结果 Z 的起因到底是 A ,还是 B ,或者是 A 和 B . 这样的做法与上面讨论的虚拟的概念是一致的。当然,在很多情况下,操控是无法达到的。这种时候,操控就是被假定的了(见下面第四小节关于社会科学中操控的讨论) . 操控的概念也解决了时间顺序上的先后问题。即使起因和结果同时出现,由于对结果变量的测量是在控制之后,因此分清起因和结果以及确立它们之间的因果关系就变得容易了。 (三)因果关系的概然性 一系列的因素使得现实中的因果关系并非决定性的( non-deterministic ),而是概然性的( probabilistic ) . (注 8 )这样的因素至少包括以下几个方面: ( 1 )对于复杂规律的认识通常是无法达到彻底的。而且,对于现象起因的讨论却往往是以英纳斯( inus )起因为对象的。因此,关于规律的结论通常并不能使用决定性的假设命题。由于社会现象发生和出现背后的机制往往并非显而易见(参见下面第四小节的讨论),因此,这一点对于社会研究而言极为相关。 ( 2 )随着物理学中量子力学理论的推广,人们逐渐认识到,至少某些现象其本身就不是决定性而是随机性的。 ( 3 )即使我们所面对的现象从理论上说是决定性的,但在实际研究中的操作上不可避免地存在着测量的误差。这样的误差包含系统和非系统(随机)两个部分。随机误差必然导致结果中的随机性质。 因此,无论起因对于结果的影响机制是否必然具有概然性,我们所能观察到的往往是起因对于结果的非确定性作用。相应的,我们的表述形式也是非决定性的。与 “ 若 A 出现, Z 则必然发生 ” 的论断相比,更为常见的却是, “ 若 A 出现, Z 发生的概率增加了 ” 。(注 9 )对于因果关系的机制为决定性,但我们又无法认识清楚的情况,我们使用的归纳具有随机性,例如,起因 A 的出现在某种程度上可能导致结果 Z 的产生。当然,这样的非决定性的推断掩盖了起因在理论上对于结果决定性的作用。对于因果关系的机制本身就是随机性的,起因对于结果的作用直接被表述为随机或是统计性的规律。例如,起因 A 的出现导致结果 Z 的概率为 p ,或者,在百分之 n 的情况中,起因 A 导致结果 Z . 需要特别指出的是,统计性的论述所表达的因果关系其本质也是一种恒常性,只不过这种恒常性是起因与结果间关系在显现程度上具有随机的性质。 (四)自然现象研究与社会研究的差异 相对于上面所讨论的因果关系的确立,社会现象有着其特殊性。这样的特殊性值得我们作进一步的强调。 首先,相对于物理现象中的因果关系而言,社会现象中的因果关系通常表现在相对宏观的层次上。自然科学研究关注的现象分布在微观层次上的微粒之间;同时,时间间隔通常是细微而可以忽略不计的;在起因与结果之间通常没有中介因素;即使有,也是可以被忽略不计的。与此相反,由于社会现象具有历史性,其起因与结果之间通常有着时间上的滞后;就在这段滞后的时间内,形成了一个顺着时间推进的因果链接。因此,在社会研究中,滞后时间的存在使得起因和结果在时间上并不相互对称,其先后顺序也变得容易分辨。(注 10 )同时,由于因果关系链接的延长,使得社会研究中的因果分析通常是探寻多元起因,甚至是联合起因与选择起因交叉组合的复杂结构。这种复杂性也是概然性的因果关系占据重要地位的原因之一。 其次,前面提到过,在构建虚拟情形时,一个可行的方法是通过操控来实现。这对于自然科学来讲是容易的,因为其研究对象中的起因和结果均是在相对而言较易控制的微观层次上;同时,起因和结果间的时间滞后几乎没有,因而没有其他因素的干扰;其因果链接也相对简单。很多情形下,这样的操控是在实验室里通过实验完成的。对于社会研究的对象而言,操控通常是无法完成的。在这种情况下,思想上的操控 —— 假想 —— 成为一个推断因果机制的重要手段。当然,这样的假想必须符合一定的逻辑过程。它与实验室里的研究是可以相比拟的。在社会研究中,这样的假想中的操控,往往变成了我们研究设计中的常识和技巧。例如,给定各种职业的未来回报是不尽相同的,同一批毕业生中:( a )他们自由地选择职业(给定他们对于职业的了解是随机的,并不存在某些特定的毕业生已知某些职业的未来回报更高);( b )按照实验的原理来分配这些毕业生到各个职业当中。很显然,( b )种研究设计得出的关于职业与未来回报的关系是实验意义上的因果关系;而( a )种情形所揭示的也应该是因果关系(当然,在数据的分析过程中,我们还要控制其他相关的背景变量) . 虽然它来源于社会现实,而非实验得来;但是,不同的毕业生进入不同的职业正好满足我们假想中的操控所要求的要素。 在谈到当代中国社会所面临的巨大变革的时候,我们往往希望从中能够发现在社会结构层次上的带有规律性的理论。显然,这场社会变革与实验室意义上的操控是不可比拟的。(注 11 )但是,比较变革前后的情形,我们可以得出某些特定的结论。在这样的比较分析中,我们就运用了 “ 假想中的操控 ” 这样的研究手段。一个恰当的例子就是对于社会分层机制的分析。 “ 市场转型 ” 理论认为改革开放以来,再分配时期影响个人收入的权力资源的重要地位,在市场体制下逐渐让位于人力资本(即教育) . (注 12 )在分析讨论这两种资源的时候,人们对于自身权力地位或教育水平的选择并非事先由 “ 实验者 ” 所控制的(与上面毕业生的例子相类似),但是,它所揭示的这两种资源与收入之间的关系是符合因果机制的要求的。在此意义上,这场社会变革常常被社会研究者称为一场难得的 “ 自然实验 ” ;同时,也为作为社会研究者的我们提供了一个绝佳的观察社会的机会。 三、因果分析的类型 最早对因果关系的系统分类来自亚里士多德。在他的论述中,确定了能够导致结果产生的四种起因:形式起因( formal causes )、物质起因( material causes )、动力起因( efficient causes )和终极起因( final causes )(转引自 Marini