|
一、问题、思路与方法
尽管实证研究不是社会学的惟一任务,但毋庸置疑的是,实证研究是社会学不可或缺的部分。对于实证研究而言,其发现和结论的信度和效度在很大程度上取决于研究设计与方法。在这个意义上说,系统地呈现现有社会学研究成果所使用的研究设计和数据分析方法不仅可以从一个特定的面向反映社会学这个学科的现状,同时也为研究者反思学科发展提供一个经验基础,甚至有可能为今后的实证研究的设计和方法提供可资借鉴的方向。基于上述考虑,本文将试图回答如下问题:(1)近期的社会学研究成果使用了哪些研究设计和方法,不同研究设计和方法的分布呈现何种状态?(2)近期的社会学研究成果使用了哪些数据分析方法?
本文将采取内容分析方法回答上述问题。首先,本文将考察的对象设定为《社会学研究》在2011—2014年发表的所有文章,并以每篇文章为一个分析单位。该设定主要基于如下考虑:(1)由于资源的限制,本文无法考察所有社会学期刊相关的文章,而仅能考察部分研究成果;(2)《社会学研究》是国内最有影响力的社会学的专业期刊,中国知网的数据显示,该期刊的复合影响因子为5.424,综合影响因子为3.621。诚然,这一考察范围的设定在一定程度上忽视了其他专业期刊(如《社会》)上所发表的文章,读者在阅读本文时应该将这一局限考虑进来。
其次,笔者参考了学界关于研究设计和研究方法相关的争论,并归纳现有研究成果实际所使用的设计和方法,在此基础上设计了内容分析的编码规则。就包括社会学在内的社会科学研究的设计和方法而言,大致可以分为定量研究与定性研究(King et al.,1994;Brady & Collier,2010)。定量研究大致又可区分为描述分析与广义的回归分析,前者是通过统计描述来呈现社会变化趋势,而后者更多的是通过建模来解释特定的社会现象。就所谓的小样本研究设计而言,大致可以区分为案例内(单案例)分析和案例比较(多案例)分析(Bennett & Elman,2006)。考虑到案例内分析和案例比较分析遵循的是不完全相同的分析逻辑和技术,笔者将其区分开来。此外,对2011—2014年发表于《社会学研究》的257篇文章进行阅读可以发现,相当一部分论文使用了文献分析方法。值得一提的是,这里在宽泛意义上使用“文献分析方法”这一概念来指代如下几类文献——观点阐述性文章、对特定研究领域进行文献综述或评述、对现有文本进行重新解读,等等。最后,少量文章还使用了计算机模拟、实验设计、混合研究设计。
再次,如果一篇文章属于定量研究(回归分析),笔者将进一步分析该文章所使用的数据分析方法,包括多元线性回归、两分类logit/probit回归、多项logit回归、定序logit回归、计数变量回归(包括泊松回归与负二项回归)、多层次或面板数据模型、因果推断(工具变量、倾向值匹配、中介分析)、事件史分析、因子或主成分分析。尽管本文无法穷尽所有统计分析方法,但笔者将尽最大的努力呈现常见的分析方法,并在此基础上指出一些趋势。
本文结构如下:第一部分提出问题,介绍研究思路与方法。第二部分从三个角度呈现社会学研究中的研究设计与数据分析方法的现状。其中,第一个小节从整体上描述文献分析、案例研究和定量研究的分布和年度变化趋势,第二小节展示定量研究中的数据分析方法,第三小节则归纳出案例研究方法的进展和存在的问题。文章第三部分是简要的讨论。
二、研究发现
(一)文献分析、案例研究和定量研究三足鼎立
分析结果显示,76篇文章可归为文献分析,约占30.7%;46篇文章采取了单案例研究设计,约占18.6%;41篇文章采取了多案例(比较)研究设计,约占16.6%;19篇定量研究文章主要使用了描述分析,约占7.7%;75篇文章主要依赖广义的回归分析,约占30.4%。上述统计数据呈现出如下三个模式:
(1)如果将单案例研究和多案例(比较)研究均看作定性研究,则文献分析、定性研究和定量研究呈现三足鼎立的局面。
(2)在定性研究中,单案例研究的数量略大于多案例(比较)研究的数量,但两者的总量基本相当,差距并不大。
(3)在定量研究中,尽管多元回归分析占主导地位,但依然存在少量基于描述分析的研究。
除文献分析、案例研究和定量研究外,这一期间所发表的文章还使用或部分使用了计算机模拟、实验研究,或混合研究设计。尽管采取这些研究设计的文章数量不大,但它们同时表明,社会学研究者尝试超越传统的定性研究和定量研究,采取更多元化的研究设计来回答相关的问题。
接下来,笔者根据发表年份对数据进行汇总,来呈现研究设计在过去几年的变化趋势。对文献分析的统计结果显示(见图1),2011年有29.6%的文章属于文献研究,2012年、2013年和2014年分别有44.1%、19.2%和30.8%的文章属于文献研究。值得注意的是,2012年所发表的文章中采取了文献分析法的文章所占比例很高,2011年和2014年文献分析法所占的比例基本相当,而2013年所占的比例略低。
对单案例研究的汇总结果显示(见图2),2011年有18.5%的文章属于单案例研究,2012年和2013年使用单案例研究设计的文章所占的比例基本一致(分别是17.6%和17.8%),而2014年有21.2%的文章属于单案例研究。数据分析表明,单案例研究的比例在2011年和2012年略有减少,但在2014年有较大的提高。
有意思的是,多案例(比较)研究呈现出先升后降的趋势,该趋势与单案例研究的趋势相反。数据汇总结果表明(见图3),2011年只有9.3%的文章属于多案例(比较)研究,这一比例在接下来的两年间持续攀升,2013年的比例已高达27.4%,然而,该比例在2014年明显下降至11.5%,该比例仅略高于2011年对应的比例。
对定量研究(描述分析)的汇总结果显示(见图4),2011年有7.4%的文章属于描述性定量研究,2012年对应的比例上升为14.7%,然而这一比例在接下来两年内呈现明显的下降趋势,2013年和2014年对应的比例分别是5.5%和1.9%。
对定量研究(回归分析)的分析结果表明(见图5),2011年有31.5%的文章属于广义的回归分析研究,2012年对应的比例下降为22.1%,2013年则上升至37.0%,该比例略高于2011年对应的比例,然而2014年对应的比例下降至30.8%,大致与2011年对应的比例持平。总体而言,定量研究(回归分析)所占的比例在围绕一个相对稳定的比例波动,这也在一定程度上表明定量研究(回归分析)这一研究路径被学界广为接受,也是最为重要的方法。
综上,文献分析文章所占的比例波动最大,而多案例(比较)研究所占的比例也具有较为明显的波动。与之相对,单案例研究所占的比例呈现上升的趋势,但该趋势是否会继续持续下去则有待进一步观察。就定量研究而言,描述性研究所占的比例似乎呈现下降的趋势。虽然依赖于回归分析的定量研究的比例呈现波动性,但总体而言并未呈现明显的下降或上升趋势。
(二)定量研究数据分析方法:传统方法占主导,新兴方法崭露头角
笔者进一步分析了定量研究所使用的数据分析方法。这些方法大致可分为四类:第一类是截面数据模型,包括多元线性回归、两分类logit/probit回归、多项logit回归、定序logit回归、计数变量回归(包括泊松回归和负二项回归)、因果推断模型(实际使用的模型包括工具变量法、倾向值匹配、中介分析);第二类是多层次模型和面板数据模型;第三类是事件史分析;第四类是量表分析方法。值得一提的是,本文主要汇报常见的回归分析方法和量表分析方法,而部分回归模型因实际的使用次数少而未在此详细汇报。每篇文章可能使用一种或多种数据分析方法,因此相关百分比相加并不等于100%。
统计数据显示(表2),有35篇文章使用了多元线性回归模型,约占38.9%。该比例明显高于其他统计方法/模型所占的比例,表明多元线性回归模型依然是最重要、最基础的定量数据分析方法,并没有随着进阶统计方法出现而“死去”(Krueger & Lewis-Beck,2008)。
有24篇文章使用了两分类logit/probit回归模型,约占26.7%。进一步分析可发现,在处理两分类因变量时,绝大多数社会学研究者倾向于使用logit回归模型,仅有少量研究使用了probit回归模型。从表2的统计分析可知,两分类logit/probit回归是第二常用的统计分析模型,仅次于多元线性回归。就截面的类别型(categorical)数据的统计分析而言,两分类logit/probit回归是最常见的模型,其使用次数远高于其他类别型数据的统计分析模型。使用多项logit回归和定序logit回归的文章分别为14篇和12篇,使用泊松回归和负二项回归等计数变量回归模型的文章则有6篇。如果将所有类别型数据分析模型汇总,则共有44篇文章使用一种或多种类别型数据的统计分析模型,略高于多元线性回归模型的使用次数。考虑到定量研究主要使用调查数据,而绝大多数变量均属于类别型变量,这一结果并不让人感到意外。
就截面数据的分析方法而言,我们也可以发现一些新的进展。比如,与因果推断相关的方法和模型(工具变量、倾向值匹配和中介分析)逐渐被应用到经验研究中来。数据显示,在2011—2014年这4年有13篇文章使用了因果推断方法或模型,约占14.4%。进一步分析可知,使用中介分析的文章数略多于使用倾向值匹配的文章数,而使用工具变量的文章数则最少。一方面,社会学研究者对因果机制较为关注,越来越多的研究试图通过中介分析方法来检验可能存在的中介机制。另一方面,尽管近年来有一些研究者在方法论或分析技术上讨论因果推断(彭玉生,2011;王天夫,2006;胡安宁,2012;陈云松,2012),但社会学研究者对准确估计自变量的因果效应尚未有充分的关注。进一步考察因果推断模型或方法的使用趋势(图6)可以发现,2011—2014年使用因果推断技术���文章数量似乎呈现下降的趋势。该趋势也进一步表明因果推断方法和模型尚未被社会学研究者广泛接受。
除了常规的截面数据分析技术外,更多样化的数据分析技术也陆续被应用于经验研究。其中,多层次(面板)数据模型和事件史分析是最为明显的两类统计分析模型。统计分析显示,共有19篇文章使用了多层次(面板)数据模型,约占定量研究的21.1%。在这些文章中,约一半的文章在多层次模型的框架下进行分析,而另一半的文章则在面板数据的框架下进行分析。该分布在一定程度上反映了社会学研究的如下趋势:(1)越来越多的研究者意识到并自觉地处理数据非独立性问题;(2)越来越多的研究者对宏观社会特征与微观个人行为之间的关系感兴趣;(3)随着调查数据的增多、积累,研究者可以通过纵贯数据来更好地回答或新或旧的研究问题。约有15篇文章使用了事件史分析方法,这表明相当一部分研究者对事件发生的时机感兴趣。考虑时序要素在因果推断中的重要角色(Blossfeld et al.,2007:21—34),事件史分析的广泛使用是一个值得肯定的变化。
很多社会学的概念(如社会资本、环境关心)需要通过量表才能够准确地测量。相应的,与量表分析相关的技术也得到较为广泛的应用。数据统计显示,有12篇文章使用了因子分析或主成分分析,约占13.3%。进一步分析表明,绝大多数使用因子或主成分分析的文章同时也使用回归分析模型,仅有个别以量表发展为研究目标的文章仅使用了因子或主成分分析。总体而言,因子或主成分分析的使用比例并不算很高,这在一定程度上说明变量测量问题尚未得到社会学研究者的充分重视。
同样重要的是,更新的分析方法也不断地被社会学研究者应用到经验研究中,其中包括潜类分析(李路路等,2012)、双差分模型(吴要武,2013)、贝叶斯统计方法(梁玉成,2011)、仿真模型研究(王广州、张丽萍,2012),等等。尽管这些新方法尚未得到广泛的应用,但这些应用可能会起到示范作用,从而间接地促进国内社会学的定量研究的进一步发展。
(三)案例研究的设计和方法:进展与问题并存
案例研究的设计和数据处理方法比定量研究更为复杂,也更不容易通过简单的统计分析来展示其现状。鉴于此,笔者试图通过归纳法来指出新的进展和可能值得改进的问题。在案例研究中存在若干新的发展趋势:(1)少量研究试图通过建构类型学来呈现多元化和异质性的社会现象(汪建华,2013;廖慧卿,2014)。(2)少量研究开始采用特定的定性研究方法指导具体的研究。比如,林晓珊(2013)在扎根理论的指导下考察了现代社会中人们使用身体的方式发生了怎样的变化。(3)在定性资料分析过程中,研究者更加自觉地遵循了相关的方法论建议和原则。比如,在计算机辅助的基础上进行系统的编码(林晓珊,2013;朱迪,2012),明确指出定性研究分析的推断原则在于“理论推广而非经验推广”(朱迪,2012),在案例选择原则的指导下选择研究对象(江华等,2013),等等。
同时,案例研究中也存在着一些可进一步改进的地方。第一,尽管越来越多的案例研究自觉地遵循相关的方法或方法论原则,但并不是所有案例研究都详细地呈现其研究设计、研究对象选择原则、资料收集方法、资料分析方法、结论推广范围、信度与效度等相关信息。第二,现有多案例(比较)研究主要集中在中观或微观单位的比较,对宏观社会单位的比较分析相对匮乏。第三,现有的案例间(比较)分析主要集中在少量案例的比较,在研究设计上更为接近多案例分析,基于定性比较分析(Ragin,2008)的系统的案例比较分析尚少。然而,通过知网进行文献检索可以发现,在2011—2014年定性比较分析已经被政治学、管理学和传播学应用于经验研究,而该方法也已经被国外的社会学家应用于一系列的经验研究。相比之下,国内社会学界对于该方法的应用显得相对滞后。第四,尽管因果机制分析在社会学研究中扮演着重要的角色,但现有的单案例研究尚未充分利用过程追踪等新方法(Beach & Pedersen,2013)。
三、结论与展望
对在2011—2014年发表于《社会学研究》的文章进行分析显示,文献分析、案例研究和定量研究呈现三足鼎立的局面。其中,文献分析和多案例(比较)研究所占的比例在不同年份间具有较为明显的波动,而依赖于回归分析的定量研究所占的比例相对稳定,尚未呈现出明显的变化趋势。在某种程度上,文献分析所占的比例比较高这一事实反映了社会学研究者对特定研究领域进行文献综述和评述的尝试,以及社会学研究者对中国重大现实问题(比如社会建设)的理论关怀。
对定量研究中的数据分析方法的梳理则发现了如下几个模式:(1)多元线性回归依然占据重要的位置。(2)类别型数据分析方法是社会学研究的主导性技术,其中两分logit/probit模型是最常见的类别型数据的统计分析方法。(3)研究者逐步将因果推断相关的方法和模型(包括因果效应的估计和因果机制的检验)应用到经验研究中去,这是一个值得肯定的新进展。然而可惜的是,这些分析技术尚未得到广泛的应用。(4)多层次模型、面板数据模型、事件史分析也得到了研究者的重视,这表明社会学研究者对宏观与微观之间的关联、事件发生的时机等议题的关注。(5)社会学研究者对潜类分析、双差分模型、贝叶斯统计方法、仿真模拟等方法均有所涉猎,但相关经验研究的数量非常少。总体来看,常规的数据分析技术依然占主导地位,新兴的方法尚未得到应有的重视。与之相关的是,社会学经验研究依然将绝大多数的注意力集中于“线性相加”的分析模式(Abbott,1988),对于因果效应的一致性和社会现象自身的异质性均缺乏足够的关注(比如网络用户在意识形态上呈现的差异,详见桂勇等,2015;Wu,2014),对社交媒体和大数据等发展所引发的方法论蕴意缺乏足够的关注与回应。
对案例研究方法的归纳既指出了新的进展,也发现了一些值得关注的议题。总体而言,越来越多的案例研究者自觉遵循相关的方法或方法论原则,包括类型学的建构、扎根理论的应用、系统的计算机辅助文本分析、遵循案例选择原则来选择研究对象,等等。混合研究也逐渐出现,在一定程度上有利于整合定量研究和定性研究之间的鸿沟。同时,今后的案例研究可以在如下三个方面作出更多的努力:第一,经验研究的可复制性原则(陈云松、吴晓刚,2012)不仅适用于定量研究,也在一定程度上适用于案例研究。如果研究者能更详细地呈现研究设计、资料收集和数据分析等信息,那么案例研究的过程将更具有透明性,也在更大程度上保证研究的程序性信度。第二,因果机制分析是社会学研究的重要任务,也是单案例研究的重要研究目标,希望今后的单案例研究可以更多采纳过程追踪等方法的指引,更深入地解释案例中所体现的因果机制。第三,希望今后能够出现更多基于定性比较分析的系统的多案例比较研究。
由于资源的限制,本文具有如下局限:首先,由于文章的设计和分析方法的归类并不是明确无误的过程,不同的研究者可能会对同一篇文章作出不同的归类。尽管编码员试图尽最大可能对文章进行准确归类,但最终的结果依然是编码员的一种解读。在这一个意义上,读者不应该将本文的结果看作一个绝对客观的社会事实。其次,本文尚未系统地评估不同研究设计和分析方法对文章影响力和引用率的影响,因此本部分对未来研究的展望更多地是基于笔者对社会科学方法的新进展的个人理解而提出的参考性意见。
责任编辑:wyx