|
内容提要:在社会学学科历史的不同阶段,社会学危机的理论话语围绕方法问题形成了不同的阐释。从20世纪中后期方法的异化到数理社会学和计算想象的发展,以及21世纪数据洪流带来的新挑战,对方法的理解和阐释伴随着社会变迁而变化。大数据分析在学术领域之外的高速发展,为当代学者拉响了学科危机的警报。在对数据和方法的工具主义阐释之外,形成了新的认识论和本体论,亦通过纳入历史与理论的视野,拓展和延伸了大数据社会学的讨论。不仅触及了学科的历史、当前境况与发展前景,也为在理论上重新思考方法和数据在当代社会以及日常生活中的实践提出了要求。
关键词:大数据/学科危机/经验社会学
作者简介:何祎金,北京工业大学文法学部社会学系。
信息通信技术与社会生活的深度融合,海量数据汇聚成的洪流,挑战了传统的数据存储、管理和分析方式。大数据进入了社会学的分析视野,成为学界近几年最受关注的研究热点之一。事实上,在大数据概念出现之前,已有学者注意到在日常生活实践中衍生出大量数据的现象,认为这种状况对社会学传统的研究方法形成了巨大冲击,继20世纪70年代阿尔文·古尔德纳(Alvin Gouldner)的《西方社会学将要到来的危机》之后,再次拉响了社会学危机的警报。
20世纪中后期的学科危机和21世纪大数据背景下的方法危机,并不是在封闭的社会学知识系统中发生。社会学作为一门“社会性”的学科,危机话语的出现是这门学科对社会变迁所做的反应。在学科发展脉络中考察方法问题,通过呈现方法问题在不同阶段的表现,有助于我们比较和理解方法在社会变迁过程中发生的流变,形成理论上的新认识。在近十年的讨论中,大数据相关的研究成果已经溢出了方法本身的范畴,涉及社会学的理论和历史,以及未来的学科走向。虽然社会学对大数据的关注引出了学科危机的担忧,尤其是方法危机的焦虑,但是后续学者们通过不同维度和主题的讨论所取得的学术进展,亦意味着学科转机时刻的到来。
一、方法的异化:学科危机中的方法问题
对学科危机的描述、诊断、反思和应对形成了社会学独特的理论话语,这门本为应对现代性危机而生的学科,在20世纪70年代被宣判进入危机的状态。古尔德纳对结构功能主义的批判,试图以“危机”的修辞来为这门学科示警。虽然社会学理论是古尔德纳考察的主要内容,但是对方法的讨论并没有缺席。在此之前,米尔斯的“社会学想象力”批判了经验研究中本末倒置的异化现象,研究问题与对象由研究方法所决定,研究者的问题意识和能动性被削弱。
“方法的异化”是米尔斯和古尔德纳共同反思的主题,但两者的阐释策略存在区别。米尔斯以对“抽象经验主义”的批判而闻名。古尔德纳并没有局限于对方法内在逻辑的解释,他还将外部情境变化对方法的挑战纳入了分析视野。古尔德纳的方法论工具强调在理论的建构过程中,在表面的叙述背后还隐藏着一套背景假设,它影响了理论的建构、传播和接受。范围假设是背景假设的有限应用,它针对一个领域的成员而言。前者需要对人是理性和非理性、社会问题可以自我修正还是需要干预之间做出判断和选择;后者则来自个人所处的文化和社会,伴随着人的社会化过程而产生及变化。它与库恩的范式概念存在相似之处,具有学术共同体的意涵。古尔德纳突出了外部的社会和文化,以及个人体验对范围假设的影响。
古尔德纳还在分析工具中加入了情感因素的考量,指出所有的社会理论都含有个人因素。范围假设和情感一起,构成了社会理论的基础结构,它处于一种由社会和文化塑造的次级理论水平。理论家对社会和世界的有限体验,决定了次级理论水平的差异和变化的可能,正是这种基础结构在理论书写时发挥了决定性作用。古尔德纳将这套分析框架应用到对方法论的分析。
首先,部分社会学实践者在学科认同上强调自己的科学家身份,对他们而言,坚守方法的原则要比研究对象的选择更重要。但是,社会学的性质并不由方法所决定,真正的问题在于社会学的范围假设是什么。我们不能通过“方法”本身来理解社会学的性质,需要揭示的是方法背后更深层次的假设为何。其次,古尔德纳认为方法论不仅指导方法的具体展开和实践,它还具有意识形态的属性。如果研究方法以社会控制系统的存在为前提,它本身也属于一种控制系统。此时的社会学实践模仿物理学,它的范围假设将人当成“物”,认为可以像对待非人材料一样对人进行处理和控制。在这样的控制实验中,人作为“主体”实际上并不知情。因而信息的增值,将以人类主体性和尊严的丧失为代价。
此外,古尔德纳还批判了方法论中的超然性与客观性,认为它们反映了社会学对实用主义文化的追求,代表了一种自我与社会的异化。当个人对生活世界不满,却又不愿意采取批判的积极态度,客观性成为个人与他所厌恶世界的相处方式。它将无处可逃的体验与内在的“流亡”转化为原则性的冷漠,此时的客观性成为异化者的意识形态。早期对社会学价值中立的讨论,古尔德纳便批评方法论中这一“盲目的仪式性教条”否定了社会学的一切价值因素和道德意涵,将导致研究者与社会的自我疏离和异化。
在古尔德纳诊断的学科危机中,帕森斯的功能主义理论是主要的批判对象。这一理论的稳定和均衡承诺塑造了一个封闭的社会系统,无力应对社会混乱、失序和冲突问题的挑战。外部社会环境的发展变化,凸显了功能主义理论的内在缺陷。在米尔斯和古尔德纳的时代,现代福利国家的兴起,重塑了这门学科与国家机制之间的关系,后者为社会学提供经费支持和学科发展所需的资源。在这种联结关系中,社会学越来越成为福利国家解决工业社会问题的技术基础。然而,以功能理论为核心的社会学,在新的社会环境下无法为福利国家提供所需的知识或者智力资源。“古典”和“静态”的功能主义缺少适用的理论工具与内在动力,来应对福利国家在社会变迁过程中亟须解决的核心问题。
当功能主义理论无力应对社会变迁的挑战之时,各类调查实践和经验研究在20世纪中期的美国社会蓬勃发展,社会学的人才培养也开始以市场需求为导向。在彼时社会学方法的教科书中,强调市场分析和民意测验符合政府和商业组织的需求,社会学的研究方法可以训练学生相应的数据分析能力。并且,调查研究的成本变得越来越昂贵,依赖大量的外部经费支持。研究机构对研究问题的选择缺少自主性,反而更多地由提供经费的商业组织、政府机构所决定。对美国社会学研究方法的反思,米尔斯预示了一个新兴研究群体的崛起,他们受过抽象经验主义训练,熟练掌握方法流程和操作,但是只能称这一群体为研究技工,而不是社会学家。
二、方法的进展与计算想象:从认识论危机到计算社会学
在古尔德纳诊断学科危机的同时代,欧洲大陆的社会学家并没有缺席这场讨论,且后者表现出不一样的理论取向。法国社会学家雷蒙德·布东(Raymond Boudon)强调统一与规范的实证研究才是克服社会学危机的关键。此外,在结构功能主义理论大厦摇摇欲坠之时,方法领域的数理社会学(mathematical sociology)和计算社会学(computing sociology)开始强势兴起,不仅社会系统、结构和过程等社会学理论的核心概念成为模型化和数学阐释的目标,许多前瞻性的研究与学科构想在20世纪末甚至构成了社会学的“计算想象”。但是,由理论主导的学科史书写并没有将方法与经验社会学的发展纳入考察。在学科危机的特定历史时期,方法的进展对学科构建、理论与经验研究的整合建议形成了独特的话语,并对如何克服危机做出了方法与方法论意义上的回应。
1.认识论危机与数理社会学的兴起
不同于古尔德纳对方法的责难和批判,布东对社会学危机的考察,指出学科危机的主要问题在于社会学认识论的不确定性。一方面,这门学科对外部社会因素的影响非常敏感。不仅研究主题,学科的取向、研究方法,甚至是学科的语言也会受到影响。与自然科学的线性发展不同,社会学的敏感性和认识论的不确定性相互强化,学科的发展也以危机的方式进行。围绕认识论和方法论引发的诸多争论,便是社会学潜在危机的明显表征。布东并没有将经验社会学和研究方法当作批判对象,他认为社会学的问题恰恰在于表现得不够实证,欧洲大陆的散文式写作与缺少经验观察的研究才是学科发展的阻碍。他提出以实证主义的认识论来解决当前社会学认识论不确定的问题。要对学科的词汇进行哲学反思,对其多义性进行诊断分析。此外,在类型学意义上建立社会科学使用数学模型的分类,为社会学寻求标准化的研究范式。
布东试图调和社会学理论与研究方法和经验研究之间的张力。根据布东的描述,在自己身处的20世纪60年代,社会问题或者社会学研究中散文或者思辨式的写作不胜枚举,观察数据的缺乏是问题的主因。事实上,稳定和制度化的数据来源对当代学者的经验研究非常重要。20世纪早期的美国社会科学虽然出现了“统计转向”,社会学研究也开始吸收统计学的方法,但是数据质量仍在一定程度上制约了统计方法的发展。美国社会学早期的创始人之一吉丁斯认为,强调社会学研究中因果关系重要性,数据在质量和数量上的缺乏影响了统计学在社会学研究中的应用。随着战后统计技术的广泛应用,出现了大量调查机构和数据库。尤其是经验社会学的兴起,布东乐观地预估未来,认为到2000年,可以成功建构一门以观察为基础、研究社会变迁的社会学,而不是在他的时代,或多或少还受到19世纪进化论影响,甚至是带有印象主义色彩的社会哲学式研究。布东在这里提供了一个与米尔斯和古尔德纳完全不同的危机诊断方案,后两位学者对实证主义和经验研究的批判,在布东那里被当作了社会学需要坚定追求的未来,乃至重视经验研究的美国成了欧洲需要模仿的“参照群体”。
值得注意的是,20世纪50年代“数理社会学”开始兴起,在70年代达到顶峰,学科史上许多经典的经验研究与方法论创新也出自这一时期。1964年科尔曼出版了《数理社会学导论》,很快便成为该领域有影响力的教学参考书。1967年布劳和邓肯的《美国职业结构》出版,二人将路径分析和线性回归分析引入美国社会流动的考察,不仅成为社会流动研究的经典,更是改写了后续的研究。这一阶段定量研究取得诸多进展,其时间正好是激进社会学瞄准结构功能主义理论火力全开之时。数理社会学对方法论体系的建构,甚至表现出了理论的雄心,要用数学模型这种科学的语言揭示抽象复杂的社会系统与行动模式。
尽管数理社会学在学科体系中被视为方法论的内容,但是在理论建构方面,尤其是提升理论可验证性和适当性方面有很大的潜力,因而我们不能将数理社会学限制在方法领域。此外,数学被视为社会学理论建构的“科学语言”。数理社会学的本质在于建构一种可以代表社会现象形式的抽象系统,这一普遍主义的抽象系统不仅不受特定对象的限制,在目标上也与社会学理论相一致。社会学理论旨在发展对社会和文化规律的解释,数理社会学可以使用更为精确的数学模型来取代日常语言的含糊描述,进而社会学有能力对更高层次抽象系统中的规律进行解释。科尔曼的数理社会学将数学视为社会学语言的动力。日常生活语言虽然是理论最初的表达方式,但要获得概念间清晰的逻辑关系,只有转向数学的形式结构才有可能。甚至,需要将口语化的社会学理论“翻译”为数学和逻辑的语言,以将理论中的定理转化为可观察和测量的结果。数理社会学的兴起代表了经验研究和方法领域的重大进展,它将结构与系统当作阐释对象,与彼时主流的社会学理论研究相一致,这一理论旨趣显然代表了对结构功能主义风潮的一种“方法论回应”。帕森斯式理论勾勒的社会结构,可以经由数学模型的方式,动态地揭示社会结构系统生产与运转的过程,弥补结构功能主义内在的不足。并且,“模型”并不是统计学意义上的狭义概念,它是社会系统的公式化表达。但是,这种单方面的回应并未在社会学理论中引起回响,甚至在学科史中也长期处于缺席的状态。
2.社会学的“计算想象”与未来主义叙事
20世纪末,随着个人电脑的日渐普及,一部分对计算机应用程序感兴趣的学者对未来的社会学研究实践提出了颇具前瞻性的“计算想象”。他们预测了计算社会学的巨大潜力,将其视为21世纪的学科整合力量,是弥合理论与方法裂痕,实现两者共同发展的关键,甚至有能力彻底重构这门学科。这些前瞻性的内容还包括对尚未实现的计算机技术进行畅想,认为人工智能将给所有领域的社会科学带来革命性的变化,其中的一些判断在21世纪的数字社会几乎成了现实。
这一时期社会学的“计算想象”可以概括为三个特征:首先,研究者们表达了一定的技术乐观主义立场,认为随着计算能力的提高,社会学研究处理复杂数据与理论假设的能力也将相应提升,甚至可以弥合社会学传统中固有的二元论裂痕;其次,在计算社会学的认识论中表达了一定的还原论倾向,强调社会学有能力处理更为复杂的社会现象和互动关系,也更有可能揭示社会结构的运行与全貌,这种看法存在将社会结构还原为庞大数量与复杂微观社会互动的风险;最后,因为缺少实质性的研究成果,“计算想象”代表了一种未来主义特征的叙事,它把研究过程中可能面临的困境和问题暂时悬置,强调技术进步带来的革命性变化,所有问题也终将随技术进步而得到解决。
20世纪末的计算想象认为彼时的社会学研究受客观计算能力与分析条件的限制,为了使理论和模型有效和可操作,存在一种简化研究假设的需要。随着计算机信息处理能力的提升,这种局限也被打破。经验研究不需要简化假设,甚至能透过微观复杂的社会互动来考察社会结构的再生产。到了21世纪,依靠计算机的碾压性力量,社会学家将“大有作为”。计算社会学甚至可以弥合定量与质性、宏观与微观、理论与方法之间的长久裂痕。在20世纪90年代,这显然是一个非常大胆的论断。但是,这一论断实际上还衍生了一套新的二元论,传统研究中的简单假设和部分对象对应计算社会学的复杂假设和整体对象,并认为二者之间的鸿沟和张力可以通过技术能力来解决。值得商榷的是,对社会结构的经验考察,能否通过对微观互动数量上的提升来完成,还存在认识论上的疑问。
此外,在人工智能领域,已有学者意识到它在社会学的广阔前景,主要集中在文本分析、网络分析、多主体模型、理论评估和专家系统几大领域。其中,专家系统的建构可以通过计算机程序来模拟专家的知识积累和决策过程,并利用它来解决实际问题。这一系统背后涉及对主体或者行动者的基本认知与假设,人工智能为重估这种社会学的核心假设,如人的行为、行动和能动性提供了机会。对于人工智能中涉及的对社会行动的模拟仿真,柯林斯在20世纪90年代便指出,人工智能需要在社会学家的帮助下才有可能实现。受行动者网络理论的影响,技术的社会性与实践性受到社会学家的重视。社会学对人工智能的研究,首先需要在本体论上破除“社会”与“科学”的二元划分,它将人工智能视为一种纯科学领域的非社会行动,研究也被限制在对其后果或者影响的考察,而不是对人工智能的实践活动过程进行研究。
计算社会学对数据生产、采集和使用,以及结构性数据分析处理机制的未来畅想,与当代的大数据环境颇为相似。威廉·班布里奇(William Bainbridge)设想了一个共享社会数据的普遍网络架构,社会科学家可以获取和利用大规模的政府数据库,在研究中应用前沿领域的人工智能技术,并使用一些计算机辅助设备或技术收集数据资料。未来的访谈技术,借助智能机器便能展开,甚至不需要访谈者的参与。班布里奇还提到一个和今天的实时大数据分析很接近的概念,即“未来”对无时无刻与无处不在的“自然数据流的监控”,智能系统将自动地收集分析来自自然与社会环境中的数据。
在诸多畅想的背后,也有学者强调计算机与软件应用在学科发展中面临的困境。尽管新计算机技术在社会学中被视为“革命性”的工具,但是它在20世纪90年代的应用还只限制在小范围的电脑爱好者群体中。彼时这一领域的学者不仅相关成果难以发表,获得终身教职的机会也相对较低。并且,计算机的新应用并没有解决什么实质性的社会学问题,导致方法的创新难以获得承认。社会学的应用软件还处在“原始时期”,其成果也难以和布劳、邓肯与科尔曼等人的研究相提并论。
20世纪末的“计算想象”对计算社会学和人工智能的构想,这种明显带有未来特征的叙事因为缺少实质性的研究成果,在方法史中形成了一段被遮蔽的历史。不可否认的是,许多在彼时看来过于超前的构想,在21世纪的数字生活中却已经变得习以为常,乃至真的在方法领域对社会学构成了挑战,对社会学的调适与回应提出了要求。
三、21世纪将要到来的危机:数据洪流中的经验社会学
20世纪末虽然短暂地讨论过“拯救社会学”的问题,但危机似乎已经远离这门学科。量化和质性研究方法进一步在学科内部得到巩固,成为教学大纲中的必修课程。进入21世纪,在互联网和数字化时代,依然有学者拉响了学科危机的警报,不过这次陷入危机的是经验社会学。
在过去40年里,社会学曾主导了方法论的创新研究,抽样调查与深度访谈成为社会学研究和阐释“社会性”的有力方法。但是,这两种方法已经无法应对当下的需要。尤其是在当代信息资本主义的背景下,日常生活中越来越多的事务性数据被私有和公共部门收集、处理和分析。研究数据和分析技术在学术领域之外的扩张和发展,对传统的经验社会学发起了挑战,学科危机表现在三个方面:应答率的下降;全球化背景下抽样框受到民族国家单位的限制;调查研究在私有企业,尤其是市场调查领域的激增,社会学已经失去了技术优势。公司和企业不仅拥有比抽样调查更强大和有效的分析工具,还拥有自己的组织及商业运作所衍生的海量数据,社会学惯用的抽样调查方法显得非常有限。班布里奇设想的社会数据架构已经成型,但是社会学却被屏蔽在这一架构之外。
为了应对经验社会学的危机,萨维奇在之后提出了一种颇具争议的方法。对于日常生活和工作中随处可以看到的数据化现象,萨维奇呼吁发展“描述社会学”的研究,除了要关注因果分析,还需要将描述和分类当作社会学的研究目标。在数据激增的时代,社会学要与叙事、数字和图像建立联结,超越当前社会学惯用的收集、使用和分析数据的实践方式,积极和批判地参与介入大数据的研究。
萨维奇和巴若斯的文章在学术界掀起了巨大波澜。这些针对大数据与经验社会学的讨论,并没有局限在方法问题,而是触及了更为广阔的学科历史和社会理论。事实上,如何参与和介入大数据研究,它对社会学而言并不是一个简单的技术问题,不能将其还原为研究方法如何更高效地分析和处理数据。数据背后的知识生产和权力关系,还需要我们回答“什么是方法”“方法为了什么”这样的元问题。
罗斯玛丽·克罗普顿(Rosemary Crompton)指出萨维奇等人对传统方法的拒绝,将加深量化研究专家缺乏的趋势。社会学是一门存在高度异质性的学科,方法论之争伴随着学科的起源与发展,在20世纪后期也存在“实证主义的量化研究与阐释学的质性研究”之间的“范式之战”。社会学家需要在方法之间存在张力的环境下工作,甚至掌握不同的经验研究方法。克罗普顿强调因果性的探究不应在社会学中缺席,且“描述转向”的建议反而会弱化学者对统计分析技术的关注。
事实上,方法的范式或者认识论之争在当前的社会学中已经趋于冷却。当前不仅是理论多元的时代,亦是方法多元的时代,乃至混合研究方法成为田野工作者的常见选项。认识论的差异难以再像布东所处的时代那样,成为学科危机的根源。在数字化时代,量化与质性方法之争已经式微。对因果性的讨论也如此,在社会变迁和历史发展过程中,人类有许多不同的认知方式,不能假定因果分析的方法具有唯一的优势。在认识论上,我们能看到一元论向多元论的转变逻辑。
虽然萨维奇等人最初将危机的范围限定在“经验社会学”的领域,但是由此衍生的讨论显然已经溢出了经验研究和方法问题的范畴。数据实践机制一直存在于资本主义的历史发展中。利茨·斯坦利(Liz Stanley)分析了19世纪末南非战争期间英国殖民者建立的“中央集权系统”,它对集中营人口的登记、分类、测量、审查和监控,运用了彼时先进的技术设备。作为殖民主义和帝国主义的知识生产机制,它反映了方法实践中研究者与国家之间的关系。这一系统在处理大规模数据和统计技术上存在重要的方法论创新,但是英国社会学界对南非战争缺少关注,系统运转所衍生的大量数据,亦不被彼时的社会学家获取和分析。斯坦利认为这种情形与经验社会学在当代的困境非常相似。
四、新认识论与本体论:大数据与研究方法的再思考
社会学对大数据的介入并不限于经验研究的范畴,理论维度对大数据的探讨聚焦在方法实践及其后果的讨论。方法或者经验研究并不是一个简单收集、呈现和分析经验事实的过程。在追溯数据与方法的历史和展开理论探讨的同时,不仅开启了新的议题,亦为理解和应对危机提出了不同的建议。
在认识论领域,将当代社会科学研究定义为一种“数据驱动型科学”,以区别传统的“知识驱动型科学”;在本体论层面,引入了更多的社会学理论与历史探讨,对方法和数据的认识也不断深入。大数据并不是进入21世纪才出现的新事物,需要关注历史上的“大数据”生产与实践。方法和数据实践构成了现代国家机制的一部分,并在不同时代和地方表现出不一样的特征。当然,这种对历史上大数据的“重新发现”,并不意味着社会学危机的解除,它反而更要求我们重新思考大数据的历史以及方法的政治。
1.大数据背景下的范式转移:虚拟性终结与数据驱动型学科
针对日常生活中信息技术的高度嵌入,有学者发出了“虚拟性终结”的呼声,要求我们从认识论上放弃对互联网虚拟与现实的二元论假设。传统的互联网研究局限在对网络文化和用户行为的外部考察,但今天的互联网已经成为社会和文化数据的来源。我们要研究的不是互联网和它的用户,而是与互联网相关的文化和社会。这种认识论的变化,对方法的创新与调适提出了新要求。传统的网络研究对用户行为活动的考察,这种数字化的方法还属于对网络行为进行测量的外部媒介。然而,当前的网络情境下,许多数据实际上是随着网络与生活的实践而产生,成为“内在的数字化数据”,如链接、标签、网络日志的生成等等,采取传统的外部视角和媒介,对网络行为或者态度的经验观察与测量无法反映其本质特征。“虚拟性的终结”要求社会科学发展内在的数字方法,而不仅仅是对传统方法的数字化转化。
大数据带来了断裂式的创新,它挑战了过去的认识论传统。新经验主义认为大数据分析以一种新的认识论来理解这个世界,而不像过去通过假设检验来验证理论。通过数据本身来说话,理论的作用被极大的限缩,甚至有“理论的终结”一说。柯岑批评这种方法将数据的产生视为绝对客观和中立的过程,在复杂的社会系统中,不仅数据的产生无法排除理论的在场,对其阐释也无法完全避免人为的偏见。另一种认识论混合了假设推论、演绎和归纳的科学方法,它从数据而不是从先前的理论中挖掘新的认识与假设。这种“数据驱动型科学”有别于传统的以理论和假设作为基础的“知识驱动型科学”。相比于新经验主义的一些错误假设,后者似乎更代表大数据研究的未来方向。理论、方法和大数据应该是整合共融而不是相互排斥的关系,大数据既可以检验理论,理论也可以反过来指导数据挖掘的方向。
新认识论为新研究领域甚至是新学科的发展提供了理论基础。面对数量和种类更加庞大且复杂的数据,依托强大运算能力的计算机,计算社会科学成为实证主义社会研究发展的新方向。大数据已经改变了生物学和物理学的研究,但是在社会科学领域的进展还比较缓慢。数据驱动的计算社会科学需要发展新范式来培养学者,培养“具有计算能力的社会科学家”以及“具有社会研究能力的计算机科学家”。因为研究角色的互补和领域的重叠,这一计划需要社会学家和计算机科学家通过合作与相互学习来完成。数字时代的社会学研究,社会科学与数据科学的结合代表了未来。但是,这些发展并不是要把社会科学家转变成统计学家或者计算机科学家,而是通过开启跨学科和部门的合作,使之成为一门实证科学,甚至“重写”量化和质性方法的划分。它需要社会学家创新性、批判性和反思性地面对新形式的数据,并探索新的研究方法。在这里,最实质性的工作是重新理解和定义方法问题。
2.大数据的生产实践:方法与数据的本体论
历史维度的阐释强调大数据并不是21世纪才出现的事物,19世纪工业化和现代民族国家兴起,对人口增长和流动进行统计与治理的需求,不仅使得社会数据激增,亦将社会统计打造为现代国家基础架构的一部分。可以说,数据洪流的出现并不是信息技术与数字化设备普及应用的后果,它作为现代性的产物,伴随着现代民族国家的发展而产生。现代国家使用统计方法考察和治理人口,代表了一部大数据的历史。社会学应该关注这些数据如何“制造”人口,以及统计分类的政治。
从治理的角度考察方法和数据的政治,显然受到了福柯理论的影响。在福柯看来,如果说资本积累的技术带来了西方经济的起飞,那么聚人而治的方法则带来了政治的起飞,巧妙的、计算的征服技术取代了传统的仪式性且高成本的暴力形式的权力,“人口”成为聚人而治的直接对象。拉普特认为福柯过于简单地将人口视为权力实践的对象。对象化之所以可能,还需要特殊的工具和机制来呈现和制定它。拉普特提出了人口度量学的概念,通过不同方法对主体的经历、生物和事务性信息的分类和测量,以此实现对人口表现的识别和测量。拉普特关注人口之所以成为“人口”的实践过程,从中我们还能看到行动者网络理论的影子。在“制造”人口的重要工具中,人口普查被视为一种存在诸多异质性行动者的社会技术实践。同时,制造人口的过程,亦是个体变成“数据主体”的过程。在这种身份化实践中,经由不同的行动者和非人行动者的交织与互动,个体也完成了数据化转变。为此,数据并不只是简单地“被收集”或者经验性地将事实“呈现”出来,它是一系列社会技术与人类行动者配置的后果。
研究方法的实践不仅仅只是收集与呈现经验事实的过程,它同时也在“制造”事实,并且这种实践具有实际的社会意涵。对人口的分类、族群的统计、殖民地人口的登记,会带来现实的政策后果,乃至会对被调查者的社会或者族群认同产生影响。安德森的民族主义研究指出,殖民者在殖民地实施的人口调查、制图术和调查实践代表了一种权力制度的运行和展开,它们不仅提供了殖民地政府对治理对象和空间的想象,作为殖民地的治理机制,还赋予治理对象真实的生活内容。并且,历史上常规性的民意测验、抽样调查、人口普查已经渗入西方社会的日常生活,成为国家机制的一部分。
随着信息技术和数字设备在日常生活中的普及,今天的情形显然不同于福柯所考察的18世纪的欧洲。人口依旧是重要的治理对象,但是其制造和实践机制会发生一定程度的变化。人口普查这种历史悠久的国家治理机制,在当代英国便面临中断的情况。而且,今天种类繁多的互联网应用背景之下,会有不同的数据主体被制造出来。在一些政府和商业机构的运行过程中,生产了海量的事务性数据,作为人们实际活动的衍生物,这类信息被认为代表了人们的实际作为,对其分析是重要的决策依据。表面上看,海量数据的出现为社会学研究开启了方便之门。但是,对数据的分析和阐释,不管其体量如何,我们还需要理解数据的产生和运作过程,以一种更全面的视角来理解今天的社会事实。故而,对社会学家而言,他们固然可以利用这些数据展开复杂的计算分析,但更重要的是,要在本体论层面将数据的产生和使用理解为一种基本的社会事实,而不是纯粹地等待进一步分析的原始数据。
我们将大数据视为一种知识生产和实践的机制,考察这一过程中人类作为主体的存在和生活方式。古尔德纳对方法论背后意识形态的批判,为福利国家展开的调查研究,其范围假设将人类主体客体化为调查、监控和控制的对象。在大数据时代,这种客体化的现象并没有消失,信息通信技术的普及使得“数据主体”的生产和制造更具有即时性和普遍性特征。我们的网络行为所生产的数据,成为互联网公司和政府机构用数学算法来推断用户身份分类的基础。我们的互联网体验在本体论层面被赋予一个新的身份,它由软件算法“自动决定”。新身份并不是虚拟世界的数字标签,它甚至决定了用户生命的可能性,在信息和资源的导向与分配上,会给个体行动者带来现实后果。并且,在数据主体的生产过程中,分析工具并不是完全价值无涉的技术实践,它还嵌入了特定的价值与社会规范。数据主体的身份可以根据不同的逻辑和目的划分为不同的类别,这也是方法和数据政治的表现。
在技术角度,一些学者质疑大数据虽然规模大,但是“质量”不够好,无法和抽样调查获取的数据相提并论。大数据在社会科学中的应用价值还是一个开放的话题,数据体量大并不意味着信息的价值也大,低质量的大数据分析易于带来错误的统计推论。类似质疑数据质量的观点,经常被批评大数据的学者所采用。以另一种视角来看,一旦我们摒弃这种工具主义的标准,在本体论层面理解和考察数据的生产实践,将它视为一种当代的社会生活,其社会学意涵显然超出了方法问题本身。
3.大数据的生活:方法与数据的政治
在科学、技术与社会(STS)领域的研究者看来,社会学研究及其方法实践具有生产性,方法实践制造了社会事实和社会世界。社会科学所知的世界既是真实的,也是被生产出来的。并且,在生产“事实”和制造“世界”的过程中,方法的实践并不是在简单地描述世界,同时也在打开和展演它。这种方法的“本体论的政治”,强调方法的实践意义和历史性,无法将其从具体的历史情境中剥离出来。
我们追溯方法的历史,一方面可以在认识论和方法论的历史谱系中发现方法形成的知识传统与内在理路;另一方面,方法的形成和实践在特定历史条件下展开,并不是在真空环境中形成的知识产品。实证主义方法论的兴起有其哲学历史的根源和流变,它还是社会历史和情境的反映与回响。虽然存在方法论之争,实证主义的经验研究在当代社会学中已经被打造为这门学科的标志性技艺。但是,操作方法的标准化流程在写进教学大纲之前,社会学研究在认识论上还处于一种相对混乱的状态。仅仅是在二战之后,实证主义方法论才在美国社会学逐渐占据主导地位。这种方法的“胜利”并不是因为实证主义在科学性上取得了胜利,它来源于对美国战后社会结构和生活发生变迁的回应。资本主义在战后美国的发展,福特主义强调规范管理和可预见性的社会规制,为实证主义的兴起提供了“社会的”本体论事实。美国社会盛行的福特主义生活和管理方法,以及由此形成的模式化社会系统,才是实证主义取得支配地位的社会基础。
对比学科危机话语的讨论会发现,古尔德纳、米尔斯、布东等人和斯坦梅兹一样,都是基于“当前”的社会事实来反思社会学与方法。“今天”的社会科学和方法已经无法充分地回应象牙塔之外的事实,它还停留在19世纪以民族国家为单位的知识生产范式中。但是随着全球化的展开,许多问题早已突破了民族国家的边界。如何理解全球化的流动性所带来的复杂局面,方法实践如何产生新的“事实”,这些问题对21世纪的社会科学提出了挑战。社会科学需要改变学术习惯,重新想象自身、方法和它们探究的“世界”。劳和厄里并没有提到大数据,亦没有像萨维奇一样以危机示警,他们强调社会科学对复杂性问题进行研究的迫切性,需要采取新视野理解当前充满复杂性与诡谲多变的社会世界。
厄里和萨维奇的阐释突出了方法与当前的社会或者生活世界之间的张力。厄里等人质疑以民族国家为单位的社会研究在当代的有效性,而萨维奇则强调在当代的社会生活中,各种各样的方法论工具扮演了越来越重要的角色。社交网络、调查、制图、算法和信息分类等,它们不仅被视为各种即时模式的社会关系,甚至“构成”了社会本身。数据生产和实践机制嵌入当代资本主义的运行过程中,成为数字社会的基础架构。萨维奇以“方法的社会生活”来概括这种方法在日常生活中的实践与渗透。为了反对工具主义视角单纯以技术性的“更好”和“更坏”来设计研究,他提议社会学家应该在研究实践中批判性地反思研究方法。
虽然萨维奇等人反对只从工具主义角度来理解方法,但是在早期涉及“危机”的文献中,仍暗含了技术和工具维度的比较思维。经验社会学的“危机”正是来源于社会学在当代资本主义机制中方法上的缺席,米尔斯批判的“方法熟练工”在当代的资本主义和技术环境下面临巨大的挑战。此外,古尔德纳界定的危机,表现为彼时社会学理论与福利国家需求之间的矛盾。而今,社会学抱守传统的研究工具,似乎也与福利国家对数据利用和分析的当代需求存在矛盾,社会学理论的危机开始向经验社会学的危机发展。然而,如果社会学真正参与到当代资本主义的数据生产与消费机制中去的话,技术的危机或许可以得到暂时缓解,价值危机将成为社会学无法回避的新问题。社会学对大数据的参与,在目标上难以和商业组织保持一致。虽然存在利益驱动的数据分析,但是利益驱动的社会学并不符合这门学科最为基本的价值取向。一旦社会学家参与到逐利的事业中去,将难以捍卫这门学科的基本价值。
五、结语
将学科危机与方法问题置于长时段的社会学史,会发现方法之争在不同历史阶段存在内容与目标上的差异。在古典社会学阶段,它表现为实证主义和人文主义认识论的冲突。在米尔斯和古尔德纳的时代,方法之争更多地表现为学术共同体内部价值认同上的冲突。同时代研究方法的进展在学科史中较少受到关注,尤其是数理与计算社会学的兴起,彼时的学者们对社会学与计算机的结合提出了一些大胆且超前的构想。
随着网络社会的兴起,数据在我们的社会生活中发挥了越来越重要的作用。激增的数据洪流,以及学术界之外大量数据分析技术的应用和高速发展,让学者产生了方法的焦虑与学科的危机感。围绕大数据与经验社会学的危机,相关讨论已经溢出了研究方法或者经验社会学的范畴,历史和理论视野的汇入,延伸并拓展了大数据社会学的研究视阈。
20世纪末一系列关于社会学危机的讨论,在很大程度上回应的是西方社会学内部组织制度面临的困境问题。在21世纪,信息与数据的全球流动,国际移民的不断扩大,跨国组织和公司的商业活动高速发展,挑战了以单一民族国家为分析单位的社会学研究。尤其是随着互联网的普及,数字化生活成为一种基本的生活形态。今天的方法或者经验社会学的危机已经无法限定在固定的地理区域与地方性的组织情境中,它是全球社会学需要面对的挑战。
大数据研究虽然表现出很强的技术性特征,但是它与社会学研究的结合,并不仅仅是定量研究方法的创新与分析工具的变革。理论没有终结,理论与方法的对话也不应该被摒弃。大数据时代的到来亦是一个需要打碎学科自满与狭隘门户偏见的时刻。当“我们”在各种商业和行政组织机构的数据实践中被“制作”成治理对象和潜在消费对象的时候,或许今天的社会学更为迫切地需要对这种大数据生活做出理论上的解释以及方法上的反思。
(注释与参考文献从略,全文详见中国人民大学复印报刊资料《社会学》2022年第11期/《人文杂志》2022年第6期)