|
重新思考量化社会研究的模式
——读莱茵·塔格培拉《让社会科学更加科学化》
吴肃然
在涂尔干出版《自杀论》以后的100多年中,统计学和计算机技术迅速发展,社会科学的定量研究技术也相应得到了不断的发展与革新。尽管社会科学尚没有取得像自然科学一样的显著成就,但是在许多研究者看来,社会科学在方法上已逐渐向自然科学靠拢。作为具有象征意义的知识规范,主流期刊的学术标准已体现出人们对于科学方法的重视以及学科建设中明确的科学化导向。以量化研究技术为核心的社会科学正走在一条正确的道路上,它只是还未到达自然科学那样的成熟阶段。
然而上述观点并不被所有的量化研究者所认可。莱茵·塔格培拉(Rein Taagepera)是国际知名的政治学家,早年从事物理学的学习和研究,在获得物理学博士学位并于工业界工作数年之后,他转向了社会科学领域。2008年,塔格培拉出版了《让社会科学更加科学化》(Making Social Sciences More Scientific)一书,在书中他结合自己在自然科学与社会科学两方面的研究经验,指出当代量化社会科学已身患“癌症”,而症结恰恰在于被许多研究者视为科学规范的统计回归与假设检验。他认为,社会科学家必须认识到上述问题,并大力改进目前通用的量化分析模式,才有可能真正实现社会科学的科学化,才能清除当代社会科学统计研究的“垃圾场”(Taagepera,2008:78)。
一、对社会科学家的测试
量化取向的社会科学研究者常常认为,社会科学之所以难以发现如同自然科学一样的客观规律,难以为社会现象建立普适的数学模型,一方面是因为社会科学中的测量较为困难,研究者无法获得实验室标准的精确数据;另一方面是因为社会科学涉及的变量太多,研究者很难对某一社会现象进行全面考察。塔格培拉(Taagepera,2008:4)完全反对这种说法,他认为当代社会科学的困境根本不是变量多或测量精度低所导致的,而是因为社会科学家们的量化研究走错了方向。
为了论证自己的观点,塔氏设计了一个测试。他首先选取了一个较为简单的物理公式,也就是著名的万有引力定律
然而,在所有接受测试的社会科学家中,没有任何一个人通过上述数据推出万有引力公式,他们中的绝大部分人只是报告了显著性和判定系数,认为自变量与因变量之间存在相关性,有的研究者进一步提供了量化研究中的常见输出(见表1)。
社会科学研究往往以表1中的输出作为研究结论,研究者在得到了较高的
塔格培拉(Taagepera,2008:viii)评价道:“如果当真存在着如同物理学定律一样的社会规律,那么即使是在数据没有误差的情况下,我们也别指望这些统计社会科学家能够发现它们。”其原因在于,当代社会科学家们普遍缺少自然科学研究的实践经验,他们所使用的科学方法往往只是对于自然科学的机械模仿,违背了在科学研究中使用量化方法时所必须遵循的一些基本原则。
二、问题出在哪里?
(一)建模的目的
塔格培拉(Taagepera,2008:7、8、11、44、88)指出,之所以出现上述现象,一个最重要的原因是社会科学研究者普遍误解了“模型”的意义。在处理手头已有数据时,他们往往用各种回归对其进行拟合,此时所得到的最佳拟合模型便成为研究输出。可是在塔氏看来,这种拟合即使再完美,也只是一种“事后解释”或“后见之明”(postdiction)。科学模型的真正效力在于它的预测功能(prediction),尽管已知数据为研究提供了经验基础,但是模型的“科学性”必须由外部和未知数据而非内部和已知数据来决定。如果科学家们没有对原始数据集(initial set)之外的数据进行考察,他们的研究根本不能算作完成。然而在当代社会科学研究中,研究者们常常只去寻找满足手头数据的模型,绝大多数模型在发表完论文之后便成了毫无用处的摆设,并没有人去阅读乃至参考这些模型中的具体数字与公式。量化研究者们常常受到一种朴素实证主义的束缚,认为自己在建构了具有显著性的回归模型后就发现了客观事实,验证了主观命题,实现了科学价值。他们不了解科学研究中已知与未知的关系,没有领会自然科学公式的“科学性”意义。从统计学上来讲,如果人们仅局限于对已知数据进行考察,那么我们在蒙古乌兰巴托的天气与美国证券市场上某种股票的走势之间都能发现百分百的相关(Taleb,2005:135)。在这个意义上,仅仅关注事后解释的量化研究和伪科学甚至有着相同的特征。近年来,越来越多的社会学家之所以强调理论的重要性,正是因为他们都看到了一个不同于传统实证主义叙事的知识现象:社会学经验研究中的变量和因果关系只有在经验数据之外才能建立自己的合法性。
从以上分析能够看到,在社会科学家对所考察的现象进行量化建模后,一定要继续从事复制研究(Taagepera,2008:9),科学模型的价值是在复制研究中体现出来的。正如陈云松、吴晓刚(2012:1)所说:“社会科学定量分析亟待建立一个透明和开源的学术机制……这个学术机制的核心就是倡导‘复制性研究’。”只有通过复制性研究,才能实现真正的“经验检验”,当某个回归模型在复制性研究中得到了预测性的证实,模型才获得了超越于事后解释的科学意义。
(二)建模的原则
社会科学家常常认为,自然科学与日常思维差别较大,而社会科学则距离自然科学较近,因此,社会科学是从科学角度解释和解决日常社会问题的一把钥匙。科尔曼(S. Coleman)则认为这种理解是错误的,恰恰相反,自然科学与日常思维比较接近,社会科学的思维模式反而距离二者较远(Taagepera,2008:29、30、83)。在日常生活中,人们常常倾向于给某一现象最简单的解释,在自然科学中也一样:“简洁”是物理学家们在建模时的最重要标准。可是这一标准在社会科学研究中并没有体现出来,社会科学家总习惯于把一大堆变量扔到模型中去,许多期刊的审稿人也常常对文章作者提出此类要求。塔格培拉(Taagepera,2008:115)认为,物理学家在建模时的工作逻辑看似不够仔细和不够负责(不考虑太多变量),其实这恰恰是科学研究的精髓所在。社会科学家往往受一种搭积木式的世界观影响,仿佛世界是由一块一块的变量累加起来的,而模型就是要模拟这个世界的形态。这种误识让社会科学陷入变量的无底洞中。虽然有关目的论与机械论的争论滥觞于古典社会学的讨论中,可是显然,当代社会科学研究者并没有继承那些古典讨论所产出的知识遗产。
为提高模型的��学意义,社会科学家需要提高的是想象力而非增加变量或者进一步依赖计算机。在科学研究中,人们理应从理论角度提出数学模型,然后由统计学家提供检验模型的工具,可是在当代社会科学研究中,模型大都是由统计学家提供的,社会科学研究者只是使用这些统计模型来对自己所考察的具体社会现象进行解释。这种做法颠倒了数学与科学的关系,使得“人类的思想和洞见”这一自然科学研究的原动力在社会科学研究中瘫痪。
(三)建模的方法
社会科学研究常常使用线性回归,其通用模型为
与上述现象相联系,塔格培拉(Taagepera,2008:55-56)还特别指出了一个很奇怪的现象,即社会科学界鲜有使用除法的模型,即没有研究者会把变量放到分母当中。当假设中的自变量与因变量负相关时,研究者都想当然地用减法来处理,可是从物理学来看,绝大多数负相关的变量都在模型的分母中出现。除此之外,社会科学界还常常把交互效应狭隘化。当两个变量存在交互效应时,它们完全可能以相乘、相除、指数等繁多的数学形式相联系,可是社会科学家在处理交互效应时将其全部等同于两个变量之间的乘法关系,很少有研究者意识到其中的问题。塔氏认为,这种受方法局限而将研究对象削足适履的做法,就好比“假如手里唯一的工具是一把锤子,那么你就把所有的东西都当成钉子了”(Taagepera,2008:5)。
塔格培拉(Taagepera,2008:154-175)也详细分析且批评了许多社会科学家偏爱的最小二乘法(OLS)。他指出,普通最小二乘法所做出的回归方程是偏移的,其原因在于,在
另外,物理学方程的一个重要特性是可逆(reversible),而社会科学的线性回归方程只有在
(四)模型中的系数
由于每一个自变量都有其对应的回归系数,因此社会科学家所给出的回归方程常常带有很多系数,然而由于他们只关注模型的P值和
由于社会科学家的关注点在于模型与已知数据的拟合度,因而他们非常在乎判定系数
(五)对假设检验的认识
塔氏(Taagepera,2008:9、10)指出,虽然在物理学中存在着假设,但这些假设在研究中都是隐藏起来的。由于物理学家对未知因素持开放态度,所以他们不会事先做出非常具体的刻板假设,物理学家们很少去证伪,物理学的研究目的也不是去证伪。相比较而言,由于社会科学研究受到后实证主义方法论的深远影响,许多研究者都循规蹈矩地开展假设检验研究。他们在研究中所设定的零假设往往都是研究者自己根据数据和结论反推而得的,这种零假设不具有科学价值,它更加类似于一种仪式(Gigerenzer,et al.,2004),最糟糕的是,连许多期刊的审稿专家都没有理解这个问题(Taagepera,2008:71-74)。
齐格伦泽等人(Gigerenzer,et al.,2004)对从事假设检验研究的社会科学家们进行过一个测试。他先选取了一个p=0.01的假设检验,随后解释道:“这个结果说明,如果该实验重复很多次,那么你将在99%的实验中观察到显著性。”这一解释显然是错误的。然而,在接受测试的德国社会科学研究者中,那些教过社会统计课程的学者有37%的人答错,未教过社会统计课程的人则有49%答错;在英国的研究者中,错误率达到了60%。由此可见,许多使用假设检验的研究者并不明白该方法的原理,因而也就很难认识到该方法的局限了。
科尔曼认为,“研究者们常常只报告哪些变量是显著的(通常采用p值小于0.05的标准),这种做法令人不解,它并不是一个有益的习惯,而更像是统计学史上的一个事故。我更倾向于知道具体的p值,这样我才能自己做出判断”(转引自Taagepera,2008:209-210)。科尔曼的说法与目前社会科学界通用的假设检验思路完全不同,可是我们不妨反思一下,当社会科学家们一次次地根据0.05的p值对命题做出接受或拒绝的结论时,他们究竟如何理解0.05这个数值规定呢?他们做出了何种意义上的有关“确定性”的判断?这是摆在假设检验研究者面前的严肃问题(吴肃然,2013)。对于社会科学研究者误用假设检验的现象,在2014年初的《自然》(Nature)杂志上已有学者发表了专文进行剖析与批评(Nuzzo,2014)。
(六)数据与模型的关系
受实证主义的影响,社会科学研究者常常把自己操作化后所得到的变量、指标、数据当成抽象命题背后的自证性的、不容侵犯的客观事实,并以此做出顺理成章的论证。然而塔氏(Taagepera,2008:48、78、176、187)指出,即使在物理学中,数据本身也并不是神圣的。在科学研究当中,模型(model)和数据(data)始终处于一种互动关系中,实证主义的单向理解却把经验研究的具体过程过度简单化了。指标并不是那些完全客观的纯粹事实,它是帮助人们进行预测的,如果研究者忽视了这一点,而将自己所发现的那些数据当作不可错的神圣物来对待,那么他就完全有可能陷入自说自话的境地,他所获得的结论也往往很有可能只是运气带来的。
(七)其他误区
社会科学的量化研究不仅犯有上述观念性和原则性的错误,而且还常常出现一些比较低级的疏漏(Taagepera,2008:52-65)。
在自然科学研究中,一个小数需要保留到几位,这是由误差要求所决定的,而社会科学研究中某数值小数点后一长串的数字往往是没有意义的,人们很难理解
为了让变量名有较好的提示作用,研究者在给变量命名时常常选用多字母符号,例如用ENP代表“effective number of parties”。但是,这种标记方法是很不科学的,因为它在模型里意味着连乘,很容易让研究者产生混淆。
社会科学研究者为了将定类变量纳入回归模型,常常将其转化为虚拟变量处理。与此不同,在遇到这种情况时,物理学家会建立不同的模型,而不是为了满足回归的要求对变量进行转换。在目前涉及虚拟变量的社会科学研究中,有相当一部分都是成问题的。
三、从描述型模型到预测型模型
塔格培拉认为,要让社会科学真正实现科学化,社会科学家们必须改变目前的建模思路,人们不应当把大量时间用于寻找最完美的事后解释,而应当学会发挥想象力,在理论意义的基础上建构预测型模型。
他以自己所从事的一个政治学研究为例,说明了建构预测模型时的几个重要概念和基本原则(Taagepera,2008:34-42)。假定V代表在两次连续选举时更换了自己所选党派的选民比例,N代表参加竞选的党派数量,作者认为,后者对前者有影响,用数学方式表达出来,即dV/dN>0。
在测量党派数量时,由于党派的大小有时差别很大,故可以做以下处理:假定第i个党派在选举中所获得的选票比例为v[,i],党派数就可以用下面的式子表达:
在建立起方向性模型dV/dN>0之后,许多社会科学家便会收集数据,建立一个线性回归,如V=a+bN,随后看b是否大于零,观察一下该回归的显著性以及决定系数,此后便可以发表文章,结束研究。塔格培拉问道,为什么社会科学家都不去关心a和b的实际大小呢?可以想象,如果物理学家也不关心这些系数的实际值,那么繁多的物理学公式还有什么意义?
塔氏认为,社会科学家所建立的量化模型之所以没有真正起到“量化”作用,是因为他们走错了路。在确立起dV/dN>0这个方向性模型后,人们还有许多逻辑上的信息可以利用,然而这些信息都被社会科学家忽视了。在V=a+bN这个模型中,V和N两个变量并没有取值范围的限制,可是,当我们从所研究的问题入手时便能看到:V的取值只能在0到100之间,而N的取值则不能小于1。于是,我们就得到了关于变量取值的理论禁区(conceptually forbidden areas),这对我们选择何种模型会产生重要影响。进一步思考可以发现,当N=1时,V只能等于0,也就是说(N=1,V=0)这个点必然是方程的一个解,于是我们就为该模型找到了一个锚点(anchor point)。
在这里,作者指出了社会科学家们的第二条思维定势。由于社会科学研究者关注整体的社会现象,使用大规模的数据,试图发现其中的普遍规律,这就导致他们容易忽视数据或理论中的极端值,而这些极端值在自然科学家的眼中往往正构成建构逻辑模型的重要基石。从前面的分析可以得到,在N=1时,V=0,把这一对取值代入V=a+bN这个模型,便可得到0=a+b,即a=-b。这样的话,模型V=a+bN便可以简化为V=-b+bN=b(N-1)。这样的简化使模型减少了一个未知量,是对模型简洁性的很大贡献。
紧接着,作者根据自己的研究经验选取了N=6这样一个极少出现的很大的取值。根据人们的常识,即使在这样的情况下,V也不可能达到100。也就是说,根据(N=6,V=100)与(N=1,V=0)所画出的直线构成了回归方程在逻辑上的一个边界,在此边界以外便是研究的奇异区(surprise zone)(见图1)。
资料来源:Taagepera,2008:37。
图1:预测型模型分析示例
可以看到,回归方程位于期望域(expected zone)中。作者指出,此时我们已利用理论信息将范围圈定,在这样一个区域中我们不妨就直接取均值进行预测,所谓的“大胆猜测,小心检验”从此时便可以开始。在V=0和V=20(N-1)的范围内取均值,我们可以得到V≈10(N-1),这样一个方程就是有预测性的。比如当N=4时,我们可以预测更换党派的选民比例为30%,这便体现出模型的意义。相比较来看,社会科学家们却早早地就停步了。
获得了V≈10(N-1)这个模型,我们便可以用调查数据进行检验和矫正。将其他学者在印度调查获得的数据代入V=b(N-1)这个方程,可以得到b=11.9,这与前面的估计差距不大,于是我们便可以将方程修正为V=-11.9+11.9N。
塔格培拉指出,上述例子只是为了说明预测型模型的基本概念,其实我们从一开始就犯了一个错误。对于V=-11.9+11.9N这个回归模型来说,当N>9.34时,V的值便超过了100,这是不符合理论逻辑的。这种情况说明,我们从一开始所建立的线性回归模型就是不对的,要解决该问题就需要建立指数方程。一个常规的指数方程可以按如下方式表示:
四、对量化研究的方法论思考
不得不说,塔格培拉在《让社会科学更加科学化》一书中的观点很有新意且极富见地。不管社会科学最终能否达到如物理学那种“硬科学”的层次,但只要研究者声称自己在学习自然科学,就应该掌握科学研究的真实逻辑。在当代海量的社会科学研究中,绝大多数的量化研究都依靠统计学工具来校验一个“方向性结论”,这种做法没有体现出量化研究的优势,它们只是在定性思考的基础上做了一些点缀。同时,由于局限于已有的数据,许多“严谨”的社会科学家们的预测能力还比不上历史学家和新闻记者(Taagepera,2008:205、225、236)。
塔格培拉(Taagepera,2008:237)提醒人们,必须戒除“经验模型”(empirical model)这个概念。模型是用来预测的,预测模型才是已知世界与未知世界之间的桥梁,研究者必须克服那种原子论、决定论、积木式的世界观和方法论。更加值得谨记的一点是,量化研究的“量”不能仅仅体现在论证形式上,更应该体现在结论的“量”中,只有让结论中的“量”进入人们的知识系统,量化研究的优势和意义才能得到体现。放眼当代中国的社会学量化研究,我们可以看到,尽管许多研究使用了很大规模的数据和颇为复杂的统计技术,可他们最终所能提供的仅是一个“方向性判断”。很少有人反思建模的目的,也很少有人关注三线表中那密密麻麻的回归系数的价值,更少有人思考p=0.05这样一个统计学史的偶然设定对于我们所研究的社会问题究竟意味着什么?因此,我们也就很难估量,在我们所见到的大量社会学量化研究中,到底有多少研究仅仅不过是塔格培拉所说的“后见之明”?
当然,塔格培拉对当代社会科学研究的批判也存在值得商榷之处。我们是否有充足的理由将社会科学与物理学并置在一起进行讨论?对于社会问题来说,“方向性判断”是否具有不同于自然科学的特殊价值?对于自身便是一种社会活动的社会科学来说,“预测性”能否成为衡量其“科学”水平的标准?这些未决问题的答案或多或少都会对塔格培拉的论证构成挑战。这也进一步提醒我们,无论社会研究者持何种方法来观察社会、理解社会,只要他们严肃对待自己所从事的事业,他们就无法回避这样一个问题:对于社会研究来说,什么才可以被称作“知识”?
感谢匿名评审人的修改建议。文责自负。
【参考文献】
[1]陈云松、吴晓刚.2012.走向开源的社会学——定量分析中的复制性研究[J].社会32(3):1-23.
[2]吴肃然.2013.证伪主义之后[J].自然辩证法研究29(11):3-8.
[3]Crease, Robert P. 2004. "The Greatest Equations Ever." Physics World 17(10): 14-15.
[4]McGregor, James P. 1993. "Procrustes and the Regression Model: On the Misuse of the Regression Model." Political Science & Politics 26(4): 801-804.
[5]Gigerenzer, Gerd, Stefan Krauss, and Oliver Vitouch. 2004. "The Null Ritual: What You Always Want to Know about Significance Testing but Were Afraid to Ask." In The Sage Handbook of Quantitative Methodology for the Social Sciences, edited by David Kaplan.
[6]Nuzzo,
[7]Taagepera, Rein. 2008. Making Social Sciences More Scientific: The Need for Predictive Models.
[8]Taleb, Nassim Nicholas. 2005. Fooled by Randomness.
【作者简介】吴肃然,哈尔滨工业大学社会学系