|
|
提要:“文化反哺”是代际的反向社会化。而本文提出,反向社会化有代际和代内两种模式。随着互联网特别是自媒体的普及,以代内反向传播为特征的“文化反授”现象应运而生,文化的传授者比学习者年轻,但不具有亲子式的代际年龄差异。与代际“文化反哺”相比,代内“文化反授”具有年龄差距趋近化、空间距离扩大化、传承关系多元化、施受身份瞬时化、传播内容选择化和变迁条件虚置化等六大特征。在理论阐述的基础上,本文以“网络热词”的传播为例,利用提取自新浪微博和百度搜索2013-2015年的网络热词的每日词频指标进行了实证研究。基于时间序列的宏观分析和基于面板数据的微观分析均证实了代内“文化反授”模式的存在。
关键词:社会化;文化反哺;文化反授;网络热词;大数据;网络传播
一、导言:“代际”与“代内”
“文化反哺”是国内学者上世纪80年代提出的文化传播重要范式,主要指“在急速的文化变迁时代所发生的年长一代向年轻一代进行广泛的文化吸收的过程”(周晓虹,1988:23)。其理论研究多以卡尔·曼海姆(Mannheim,1952/1923)的“代际社会学”(Sociology of Generations)为学术源头(周晓虹,1988,2015a,2015b,2015c;刘晓东,2005;弓丽娜,2004;龚界文、胡静,2004;陈正良,2005;成伯清,2015;连连,2015;李春玲,2015)。其质性和定量的实证研究主要聚焦于家庭内部的亲代子代(周晓虹,2000;周裕琼,2014;朱秀凌,2015)或学校中的师生之间(张臣、王健,2006;郑金洲,2008)。“文化反哺”概念从提出之日起,就与家庭和学校场域中的“代”紧密联系在一起。
不过,曼海姆(Mannheim,1952/1923)的“generation”含义较为宽泛。曼氏的“代”虽也契合生物年龄上的年代、亲子代等概念,但其理论贡献与文化演进的生理视角仅略有相涉,更主要的则在于对“社会之代”(social generations)的分析。而“社会之代”,也即具有相同社会意识、文化行为和特征的同龄人,与当代社会科学中的“同期群”(cohort)概念更为接近。因此,进入20世纪下半叶,该领域的国际学者(Pilcher,1994;Glenn,1977;Rosow,1978)均强调,“generation”更适用于描述家庭亲代子代关系,而“cohort”才是更为宽泛、也更符合曼海姆原意的表达。从中文文献看,将曼海姆的“generation”译作“代”,本身无可厚非。但偏偏中文语境中的“代”更侧重于生物年龄的代和辈分之含义。这在一定程度上使得“反向社会化”(也即反向文化传承)的研究者几乎无一例外都聚焦于家庭亲子关系、学校师生关系等年龄代际差异明显的领域,把“文化反哺”和“反向社会化”等同起来。
实际上,早期社会学家之所以使用“generation”,文化反哺理论之所以聚焦于年龄上的代际模式,和20世纪文化演进传播的时空特征息息相关:无论是曼海姆在“cohort”一词尚未广泛运用于社会科学的上世纪20年代,还是周晓虹正式提出“文化反哺”的上世纪80年代,“社会之代”和“生理之代”(biological generations)是同步契合的。一个更准确和学术化的表达是:社会的文化同期群(cultural cohort)与年龄的代际同期群(generationalcohort)是高度匹配的。例如,在整个20世纪,能够观察到反向文化传播的场所确实仅限于学校、家庭等生物代际界限十分明显的社会场域。
如果说上世纪80年代新的生活方式和器物催生了“文化反哺”这一反向社会化现象(周晓虹,1988,2000),那么,本世纪初互联网的普及,尤其是近年来自媒体的大规模应用,则进一步改变了社会文化传播的时空和主体特征。以微博、微信、移动设备客户端为代表的自媒体平台,使得文化生产的门槛迅速降低、内容快速增长、速度急剧加快,而社会学习和传播的效率也大大提高。这些特征充分适应也进一步强化了年轻人的文化生产、学习能力和追求身份区隔的主动性,进而有可能在同一生理年代、同一辈分的人群中产生出文化鸿沟和隔阂,形成“年龄之代”内部的“文化之代”。
尽管年龄群落的标签和网络传播并非当代社会文化过程的全部,但这些新生现象无疑在提示我们:自媒体时代的反向社会化模式可能已经无法用“文化反哺”这个代际的概念和理论来全面概括。因为今天的文化反向传播呈现出“代际”与“代内”并存的二元模式。越来越多的反向社会化是以“代内”的“文化反授”方式来进行的。
在本文中,我们将正式提出与“文化反哺”相并行的代内“文化反授”概念,以对曼海姆(Mannheim,1952/1923)和周晓虹(1988)关于文化过程中的“代”的问题和文化反哺概念进行反思和归纳补充。除了理论和案例阐述,我们还将利用“网络热词”进行大数据实证研究。我们认为,经过借用、谐音、缩写、引申、组合等多种方式产生的网络热词,借助于互联网和自媒体的力量对大众文化和社会心态产生了深远影响,是当代文化过程的重要组成部分(刘志杰,2009;陈燕侠,2011;邹军,2013)。其传播过程很可能就体现了“代内文化反授”的特征。在实证研究部分,我们把在自媒体平台使用热词作为一种无意识的文化传授过程,把用搜索引擎检索热词作为一种有意识的文化学习过程,探究这两个过程之间的统计关联。
二、理论篇:“文化反哺”与“文化反授”
在文化传播的方式中,一个引人入胜的类型就是“反向社会化”,也即传统意义上的受教育者对教育者反过来施加影响,传授知识、价值观念和行为规范的自下而上的社会化过程。其研究主要源于国外学者对“二战”后青少年所受影响的分析(龚界文、胡静,2004)。理论上,反向社会化可以溯源到卡尔·曼海姆对社会文化过程的概括:在文化传播过程中,不断有新参与者出现,而原有的文化参与者逐渐消失,因此呈现出代际的更替(Mannheim,1952/1923)。
(一)代际“文化反哺”:文化同期群“匹配”代际同期群
中国学者周晓虹在上世纪80年代正式提出了“文化反哺”的概念。他认为,时代的快速发展、生活环境的快速改变造成了代际生活方式、生活态度、价值观上的巨大差异。传统社会中,老一辈为年轻一代人提供了行为榜样,而工业化与现代化的进程打破和逆转了这一过程(周晓虹,1988,2008)。传统的“父为子纲”的模式被颠覆,亲子之间的“反向社会化”或者说“文化反哺”的现象出现了,而且普遍存在于价值观、生活态度、行为模式、器物使用等各个方面(周晓虹,2000,2011)。其他国内学者也从社会化、青年文化等不同角度对这一重要概念进行了理论拓展和研究(刘晓东,2005;弓丽娜,2004;龚界文、胡静,2004;陈正良,2005;成伯清,2015),实证研究则分别从家庭(周晓虹,2000;周裕琼,2014)和学校(张雁华,2002;郑金洲,2008)入手,分析亲代子代、师生关系中的文化反哺。一批实证经验研究生动、可靠地展示了这种现象(王凡,2005;周裕琼,2014;李凌凌、郭晨,2016;周晓虹,2011,2016)。
我们也注意到,曼海姆的“代”本身具有多重含义。例如,曼海姆本人对“代定位”(generational location)的定义就是“行为、感觉和思想的某种既定模式”(Mannheim,1952/1923:291),并未有严格的年龄跨度匹配。实际上,在对曼海姆的批评中,格伦(Glenn,1977)和洛斯奥(Rosow,1978)均提出,“generation”应该是仅仅用于描述家庭亲代子代关系的术语,而“cohort”才是更为宽泛、也更准确的表达,即在一段时段内一群具有类似特征、经验的人。进入90年代,皮彻(Pilcher,1994)在《美国社会学杂志》(AJS)上撰文对曼海姆的代社会学进行回顾,其综述中提到,“generation”一般指10年跨度以上的“年代”(如60年代人、80年代人)。实际上,经济合作与发展组织(OECD)社会政策部给出的现代社会家庭亲子代年龄差距更高达20-30年左右,而同期群则没有这样的明晰界限。
汉语中的名词“代”原本主要指相邻两辈人之间的血统世系关系,也可以用来特指某一辈人(如祖父那一代、70年代等)或时代,以及历史上的或人类发展,尤其是文化发展的一个时期。用“代”来翻译曼海姆的“generation”,应该说字面上是合理的,但却可能因为“代”字在汉语中的特征而忽略了原概念的非生物年龄意义——曼海姆更为强调的是social generations。不过,早期社会学家之所以使用“generation”一词,文化反哺理论之所以聚焦于年龄上的“代际模式”,本质上是因为20世纪文化传播过程中,文化同期群与年龄的代际同期群是同步匹配的。不靠一代人的时间,无法积累形成文化上的重要区隔。这样,只有在学校的师生中、家庭的父子母子的“代”之间,我们才能观察到年轻人对年长者的反向文化传播。
为何在20世纪代际同期群与文化同期群可以保持同步匹配?文化反哺本质上是一种共享文化的过程,需要媒介作为中介。而在整个20世纪,虽然印刷和电讯传播取得了巨大的进步,但较之互联网特别是自媒体传播,仍存在四个方面的不足:第一,文化内容的生成点数量有限;第二,文化传播以点对面的形式进行,单向度且缺乏实时反馈;第三,文化产品内容更新较慢,制作成本大,门槛较高;第四,年轻人在文化生产和传播方面没有优势。这四个方面的不足,使得整个20世纪的文化媒介虽与18、19世纪相比首次具有了催生反向社会化的能力,但其积累速度却相对较慢。一个具有明显文化特征、可以进行标签化的文化群体,需要“年龄之代”的时间跨度,而难以通过短暂的文化积累和文化生产来构建。
也因此,整个20世纪,无论是曼海姆提出代社会学的20年代,还是周晓虹提出文化反哺的80年代,在反向社会化的历程中,文化同期群和年龄同期群之间始终存在一个“代”的耦合匹配。非年龄之代无以积累起文化之代。也恰恰是这种时代特征使得基于代际现象的“文化反哺”概念具有一定的局限性:“反哺”的意涵是子代对亲代的代际供养。但从反向社会化的角度看,年轻者向年长者传播新的信息,可能并不仅仅限于亲代子代之间。同一生理年代的人之间,或许也可能存在文化鸿沟,也就具有了反向文化传播的可能。
(二)代内“文化反授”:文化同期群“切割”代际同期群
较之传统的网站、BBS论坛和博客,以微博、微信为代表的自媒体平台或Web 2.0具有海量的内容提供者、全通式点对点的网络渠道和高度密集的内容更新,而其内容发布的经济社会地位门槛很低,非常有利于年轻人占据内容生产的主导地位。这样,文化的“新”“旧”鸿沟可能已不需通过数十年或一代人的时间来积累。比如,一个被大学本科生所创造、使用的词汇,借助微博微信迅速流行开并成为热词,而在平均年龄仅仅大了3-5岁的博士生或者毕业生人群中,知晓的人可能寥寥无几。实际上,“70后”、“80后”和“90后”这样以十年为单位来区分文化群体的重要标签今天似乎已显得略有粗疏;“90后”和“95后”的网络社交方式已经出现了巨大的差异(韩立勇,2015);在百度百科里,“85后”、“95后”、“05”后均因具有鲜明的文化特征而成为单独的词条,而“75后”、“65后”却没有这样的“文化”独立性资格。因此,总体而言,“代内”的反向文化传播因自媒体的出现而具有了“硬件”的可能。
就此,我们正式提出“文化反授”的逻辑思路和基本概念。在互联网尤其是自媒体出现之前,家庭、学校场域内的新生知识鸿沟为反向社会化提供了可能。而反向社会化的年龄跨距就是一代人甚至两代人,这就是著名的“文化反哺”模式。但随着互联网和自媒体的普及,数年的年龄差异、网龄差异,或已可能形成文化区隔。这样,当代反向社会化的年龄跨距既可能是“代际”的,也可能是“代内”的;当代社会反向文化传播的模式,就会从“文化反哺”独大演变为“代际反哺”与“代内反授”并存的格局。
概言之,反向社会化具有二元模式:“文化反授”与“文化反哺”一样,都是反向社会化的具体过程。与“文化反哺”不同的是,“文化反授”是基于代内的反向社会化,传授者与学习者群体间的年龄差异较小,远小于“文化反哺”中的家庭亲子、学校师生间的生理年龄差。如果说文化反哺是文化同期群“契合”了年龄的代际同期群,那么文化反授就是文化同期群“切割”了年龄的代际同期群,彼此不再同步匹配。
(三)“文化反授”的六大特征
“文化反授”和“文化反哺”一样,都是现代性所体现的张力,是现代化、全球化的结果及其在文化传播模式中的投射(周晓虹,2008)。而代内的“文化反授”则体现了互联网特别是自媒体对于现代性的深刻形塑:互联网使得文化生产、传播、扩散的成本降低,进程加快,密度加大,使得整个文化生产群体的“能力方差”得到缩小,最终成为现代性所体现的“同期群”张力:基于互联网和自媒体的巨大力量,不到一代人的生理年龄差异就足可以构造出独特的身份认同,形成独特的文化品味,构建独特的文化区隔,形成文化意义上的两代甚至多代。较之代际“文化反哺”,我们认为代内“文化反授”具有以下六个重要特征。
1.年龄差异趋近化
毫无疑问这是“代内文化反授”的最重要、最核心的特征。如前文所述,代内“文化反授”的概念正是基于文化“施”与“受”的双方年龄差距相较于“文化反哺”有所缩小而提出的。实际上,代内“文化反授”标志着当代社会文化生产、内容创作的加速和多元化趋势。
2.空间距离扩大化
在互联网特别是自媒体时代,“文化反授”现象中的“授”“受”双方可以远隔千里万里而不再局限于家庭、学校或者单位。以网络热词为例,其创作使用者和学习者可以远隔重洋,不受地域限制。例如,广东方言“猴赛雷”(粤语“好犀利”的谐音)的日常使用地点原本仅局限于广东等粤语方言的使用区,但在成为网络热词并被网民使用传播后,这个方言词汇就变成了原有区域外人群的用语。与之形成对照的是,“文化反哺”的发生空间多为家庭、邻里、社区、学校等有限的空间。
3.传承关系多元化
代内“文化反授”不再拘泥于“文化反哺”中父子、师生这样的亲密人际关系。因为在互联网和自媒体平台上,陌生人之间同样可以完成反向文化传播的过程。在互联网和自媒体的大环境下,人人都能输出信息,人人也都在接受他人创造和输出的信息。这种文化传承者社会关系的多元化,使得社会化的途径从传统的点对点发散成为具有极高效率的群对群模式。一个热词诞生之后,可以迅速让千千万万的受众同时学习、传播和扩散,而不是有限的点对点的私相授受。
4.授受身份瞬时化
在互联网和自媒体平台的代内“文化反授”中,“授”“受”双方的身份并不固定。在某一个时刻或者场域,针对某一个话题,你是学习者;在其他时刻或者场域,针对其他的话题,你是传授者。甚至同一个话题,学习者、传授者都可能发生身份转化。例如,去年一度很流行的网络热词“友谊的小船”来源于对英文单词“friendship”拆解之后的翻译,而随着该词在其他领域的借用、衍生,逐渐形成了“翻船体”。在这一过程中,网民们在学习了新信息之后,迅速进行了再创造,并从学习者转变为反授者。
5.传播内容自主化
在“文化反哺”关系中,年轻人或者孩子并不一定是文化内容的创造者。周晓虹(2000)甚至认为“除了得自操作性经验的知识外,孩子本身并不是各种知识或信息的制造者”。但在互联网时代的代内“文化反授”中,很多传播内容都是传授方自己的创作。互联网和自媒体给予了他们发布创作内容的空前机会。同样,在“文化反哺”行为中,接受方对于反哺的内容会积极学习,但对于代内“文化反授”而言,学习的方式和程度是选择性的、自主的。比如,年轻人群中常用“宝宝”来指称自己,而这一热词则不会在中老年人群中被广泛使用。这种选择性既使低龄网络使用者的创造性和文化符号的区隔性进一步强化,也体现了学习者在反向社会化中的能动性:互联网文化通过代内“文化反授”的接受与否定的双重过程被塑造和建构出来,这既是“反授”的过程,也是通过对“反授”内容的选择进行文化塑造的过程。
6.变迁条件虚置化
周晓虹(2000:60)强调,“文化反哺”多见于急剧变化中的社会:“社会变迁的加剧,新事物和新规则的层出不穷,一方面使亲代原有的知识、经验甚至价值判断丧失了解释力和传承价值,另一方面使子代第一次获得了指点父母的机会,这是文化反哺现象出现的宏观背景”。而对于代内文化反授,社会变迁已经不再是必要的条件。只要有自媒体平台和网络,年轻者获取文化传播主动权的现象就自然会出现。
三、实证篇:利用网络热词验证“文化反授”
在当代社会,互联网的诞生和普及使得大量新的“网络热词”涌现出来。这些词汇追求新奇、富有创意、充满个性(石国亮,2009;张媛,2015)。而且,这些词汇往往经历了一个由新词到热词再到“词媒体”的演化过程(管雪,2011;宋巍,2011)。对网络热词的搜集和研究从一开始就引起了学界的重视,迄今积累的文献包括网络词汇的产生(郑远汉,2002;李润生,2003;张云辉,2007)、测量(汪洋等,2012)、关注度(王昊,2014)以及社会经济和文化功能(方亭、樊英利,2011;李铁锤,2015;柳力丽,2013;何洪峰、彭吉军,2010)。不过,针对网络词汇传播模式的实证研究往往难以深入。主要是因为对于定量分析而言,文化现象本身难以测量,大规模的数据难以搜集;对于定性分析而言,局部、案例式的分析无法让我们获得网络语言传播现状的全景认识,更难把个体发现推及全体。现有的网络用语实证研究虽已开始运用百度指数等量化工具来进行分析,但相关文献将视野集中于某个或者少量词汇,且仅仅进行了数据描述,缺乏深入的机制探讨(王昊,2014)。在本文中,我们将基于网络大数据,对互联网中较具代表性的热词群体在自媒体和搜索引擎中近年来的传播使用模式进行全景分析,通过计量方法检验代内“文化反授”假说。
(一)研究设计
我们的实证研究策略分三步进行。
1.确定“文化反授”的双方
在本文中,我们把自媒体上的热词使用者作为“文化反授”的传授方,而把互联网的热词搜索者作为学习方。这里所谓的传授,实际上指的是自媒体(如新浪微博)的热词使用被其他人观察到的过程。由于自媒体平台具有开放性和实时性,热词只要被使用,就会被其他的参与者发现,而好奇者会通过各种方式进行学习,中文搜索引擎(如百度)就是其中一个最便捷的渠道。如果自媒体热词使用者的年龄总体上略小于搜索引擎热词搜索者,且这种年龄差异又不至于用“代”来衡量,那么它们显然就可以成为我们验证代内“文化反授”的两大数据源。
2.宏观层次分析
基于热词使用者的平均年龄略小于热词搜索者这一前提,我们正式提出用来验证代内“文化反授”现象存在的假设。我们认为,尽管网络热词千差万别,但整体而言,热词在自媒体中被青年人创作和大量使用,会使得原本不了解热词的同龄人和年龄稍大的人群开始利用互联网搜索引擎进行检索,了解新生词汇的含义。而人们了解了含义之后会进一步选择性地去使用这些词汇,可能形成一个“使用-检索-使用”的因果链条。因此,我们可以在宏观层面上预期,在一定时段内,热词在自媒体上出现的总体频率越高,互联网检索引擎中对热词的总体搜索量就会越大,而搜索量又会反过来促进热词使用,进一步提高热词在自媒体中的总体出现频率。因此,我们正式提出假说1。
H1:在宏观层次上,网络热词在自媒体中出现的总体频度和在搜索引擎中的总体检索热度存在双向统计关联。
我们注意到,网络热词中既有相对浅显、可以望文生义的或已经被社会大众熟知的(例如“楼主”、“给力”、“点赞”、“斑竹”),也有部分特别新颖、不能一眼看出含义、多由青少年群体创作使用的(例如“然并卵”、“碧池”、“不明觉厉”、“杀马特”、“十动然拒”)。对于后者这种“低龄热词”,年龄稍长的中青年群体或因成长时代背景使得他们对其有一定的隔膜,或因社会、职业身份不便而不会去真正使用。这样,“低龄热词”先是被青少年传播使用,然后会使得同龄人和年龄更大的群体通过互联网进行检索来了解其含义,但接下来只有同龄人会使用,而年龄更大者在学习了解后未必会去使用。换句话说,如果核心假说H1成立,那么H2作为H1在特殊词汇群体中的体现,也理所当然应该成立。这里我们可以提出一个推论,也即假说2。
H2:在宏观层次上,“低龄热词”在自媒体中出现的总体频度会影响其在搜索引擎中的总体检索热度,但反之不然。
从计量分析策略角度看,检验H1就相当于检验全体热词的微博使用是否和百度检索指数构成双向“格兰杰原因”(该计量经济学术语不是反事实框架下的因果机制,而是指:对于X和Y两个时间序列,在Y的自回归模型中,如果加入早前的变量X有助于解释Y,则认为变量X是引致变量Y的格兰杰原因)。检验假说2则相当于对一部分特别新颖的、青少年热衷使用的、不易识别真实含义的“低龄热词”进行分析,并检验是否只存在微博使用对百度检索的单向影响。
3.个体层次分析
宏观层次的结论,对应的是自媒体和搜索引擎使用人群的总体现象和总体规律,但相关结论不能简单推及热词的个体层面,否则有可能带来社会科学推断中的生态学谬误(ecological fallacy)。而且网络热词林林总总,种类繁多,总体上的使用和搜索规律未必能在个体层次上显现出来。为进一步检验本文的假说能否在个体热词层面上得到验证,我们将每个热词都视作一个独立样本进行个体层面的进一步分析。具体方法如下:如果我们有400个热词的800天跟踪数据,我们就获得了一个横向400个样本、纵向800期、两个不同变量的大型面板数据。利用这个“大T小N”的面板数据,我们可以进行多种面板模型的回归,以获得样本层次也即个体的热词层次的具有反事实因果推断效应的平均偏效应估计值。如果基于热词个体样本和基于热词总体指数的分析都得出了一致的结论,那么我们关于代内“文化反授”的理论就会得到非常强有力的证明。因此,我们提出假说3和假说4。
H3:在个体层次上,一个网络热词在自媒体中的出现频度和在搜索引擎中的检索热度存在双向的统计关联。
H4:在个体层次上,“低龄热词”在自媒体中的使用频度会影响其在百度搜索中的检索热度,但反之不然。
(二)数据、热词和变量
1.两大数据源
本文的自媒体数据来自新浪微博。新浪微博是一个由新浪网推出的供微博客进行信息分享、传播以及获取信息的平台。用户可以通过网页、WAP页面、外部程序和手机短信、彩信等发布140个汉字(280字符)以内的信息,并可上传图片和链接视频,实现即时分享。它是中国大陆访问量最大的网站之一。到2015年9月其活跃用户就超过了2亿。本文的互联网搜索引擎数据来自百度搜索。中国所有提供搜索引擎的门户网站中,八成以上由百度提供搜索引擎技术支持。百度搜索引擎是目前更新时间最快、数据量最大的中文搜索引擎(费志勇、褚润贞,2003)。百度搜索量的高低反映了用户对相关事件的关注程度,百度后台数据库将每天高达40亿次的海量搜索数据进行处理保存,从中可以获取最具代表性的搜索热度数据集。
具体而言,新浪微博为我们提供了用于检索社会关注和热议程度的“热词指数”,它覆盖了100万入库的使用频率最高的词汇,涉及经济政治社会文化的方方面面。而百度搜索的“百度指数”则是以网民在百度的搜索量为数据基础,以关键词为统计对象,科学分析并计算出各个关键词在百度网页搜索中搜索频次的加权和。我们从相关数据接口批量读取了研究时段每一天每一个热词的新浪微博指数和百度指数,将其作为热词出现和搜索学习的测量指标。
无论是新浪微博热词还是百度指数,均非简单直接的词频数量。在大数据分析文献中使用大型自媒体平台和搜索引擎提供的官方数据(如谷歌趋势、推特第三方词频工具等)是主流的方法(类似实证分析参见Preis et al.,2013;Curmeet al., 2014;Bryden et al.,2013;陈涛、林杰,2013;直接关于数据的文献回顾和讨论参见Scheitle,2011;Mellon,2013,2014;Nuti et al.,2014)。和国际文献中常用的谷歌趋势等重要指数一样,尽管这类指数的算法都未全部公开,但由新浪微博、百度等大型平台提供的科学数据,本身经由专业团队生成,且在计算过程中考虑了每日微博、搜索总量和分布等特征并进行了后台加权处理,比研究者通过各种非官方渠道获得部分文本资料再自行检索计算更为可信。
2.热词名单和分析时段
综合多方资料,并结合互联网对有关新生热词的讨论和总结,我们共搜集到了近年来的420个可能的网络热词(综合了《咬文嚼字》杂志历年评选的热词、人民网舆情监测室报告、相关文献提及的热词以及部分网友搜集公布的热词表单)。然后,我们逐一检测它们是否同时进入了新浪微博“热词”名单并被提供百度指数。由于新浪微博只提供出现较多的真正热词的指数,而百度公开提供的指数则来自被用户关心关注并购买了权限的词汇,因此,同时具有微博指数和百度指数的词汇,就必然是使用较为广泛的热词。最终我们获得了377个网络热词的相关数据,也即377个热词的微博指数时间序列和377个百度指数时间序列。由于“低龄热词”没有绝对标准,我们的办法是由一位作者、两位非作者研究生、一位非作者大学教师等四个不同的人根据各自的主观判断进行标记,然后将同时获得三人以上“提名”的非低龄热词删除。这样,我们从377个热词中删除了165个字面容易解读、没有明显年龄使用特征的常见热词,获得了212个“低龄热词”。我们提取的网络热词数据覆盖了2013年3月1日到2015年6月11日间(832天)的数据库。也就是说,对应每一个热词,我们都有长达832天的时间序列数据。
3.用户年龄结构
新浪和百度提供了网络热词的使用和搜索数据。但要验证我们的假说,一个关键的前提就是新浪微博热词使用者的年龄比百度搜索热词检索者的年龄要小,以形成“反授”,但这个差距必须在代内。我们从新浪微博和百度搜索中提取出每个热词用户的年龄数据(对于每一个网络热词,我们都能够获取其在某个时段、某个地域的使用者、搜索者的年龄分布结构)。因此,我们可以实现对热词使用者、搜索者年龄特征是否符合代内和反授的要求进行总体的验证。尽管网络平台的用户注册年龄、性别等数据可能存在一定的误差和缺失,但基于全国海量用户历时数年的累积资料无疑具有较高的参考价值和代表性。
我们在分析时段(832天)中抓取了百度指数中的“人群属性”和新浪微博指数的“属性分析”数据,报告在表1中。由于两家网络平台的年龄结构预设不一,因此我们在各年龄段中取中位数进行大致估算并发现,在377个热词中,微博发布者年龄约比百度搜索者的年龄小5.5岁。在377个热词中,微博发布者年龄大于百度搜索者年龄的仅为53个,小于搜索者的则为322个。尽管人们在新浪微博和百度注册时不一定全部填写真实的年龄,但基于海量规模的总体数据,我们可以认为,热词的网络发布者和使用者,也即授者和学者的年龄差异是代内的而不是代际的。换言之,来自新浪微博和百度的相关热词数据可以构成我们进行“文化反授”的可靠数据来源。
4.变量描述
图1展示的是三年来全部网络热词基于新浪微博指数的自媒体使用频度和基于百度指数的检索热度时间序列,以下我们直接称之为“微博指数”和“百度指数”。原始数据中,377个热词的新浪微博指数均值为2420(标准差为14939),百度指数均值为66663(标准差为285265)。考虑到数量级差异,我们对全部曲线进行了标准化Z值处理,并按照周均值来进行绘制,时间范围从2013年3月1日到2015年6月11日。由于词条众多,面积图的视觉呈现使特别高的波动比较显眼。实际上,尽管部分热词的使用和检索呈爆发式的增长和下降,但大部分热词的曲线仍相对集中在-2到5之间的Z值区间。随着时间的推移,不少词条的百度检索热度有所下降,在图1中表现为横轴靠近右侧部分的Z值小于0,也即低于800日均值。这显然是因为用户在检索学习过后就不会再重复检索。
为进行宏观分析,我们从这377个热词的词频时间序列中提取出一个“共性”信息,并对全部热词时间序列先求标准化Z值,然后再加总求和并取对数,这样可以获得一个不受少数几个使用率最高热词影响的总体指数。为计算总体百度检索热度,我们采取了同样的方法(百度指数均值为16.93,标准差为0.46;新浪微博指数均值为13.70,标准差为0.21)。图2展示了加总指数及日变化时间序列。同样,我们对“低龄热词”也进行了类似计算并展示在图3中。尽管图3和图2看起来类似,但仔细观察,两者之间仍然有不小差异。这意味着低龄热词的传播和网络热词的总体传播接近但并不完全相同。
(三)宏观分析结果
在进行时间序列分析之前我们首先进行单位根(unitroot)检验,使用增强迪克-富勒检验(Augmented-DFGLS检验)和菲利普-帕芬检验(PP检验)两种方法,分别测试了带和不带时间趋势的情况。限于篇幅,这里不报告单位根检验结果,感兴趣的读者可以向作者索取。结果显示,三年来微博指数是平稳时间序列I(0),而百度指数是一阶单整的单位根时间序列I(1)。因此,我们对两者分别求一阶差分以获得平稳时间序列进行格兰杰因果检验。在经济学意义上,对数值的一阶差分相当于水平值的增长率。这样,时间序列分析验证的是微博指数日增长和百度指数日增长间的关联。模型滞后项个数根据SBIC(Schwarz Bayesian Information Criterion)、AIC(Akaike’s Information Criterio)、HQIC(Hannan and Quinn Information)和LR信息标准来联合确定。
1.网络热词的总体传播模式:双向互动
我们对网络热词的两大总体指数进行格兰杰分析,结果见表2。从总体上看,网络热词在自媒体中的使用可以有助于预测后期的网络检索。而对网络热词的互联网检索,也同样有助于预测后期的热词使用。相关的滞后期为7天。换句话说,前一周内的微博热词使用总体上会影响当下的百度热词检索;反过来,前一周的百度热词检索,总体上也会影响当下的微博热词使用。这样,假说H1得到了统计证明。
2.“低龄热词”的传播模式:单向影响
对于“低龄热词”的微博指数与百度指数我们也进行了同样的格兰杰因果检验,结果见表3。从表3中可见,低龄热词在自媒体中的使用可以有助于预测后期的网络检索。但低龄热词的互联网检索却无助于预测后期的热词使用。相关的滞后期为20天,约三周。这意味着对于低龄热词而言,三周内的微博热词使用会影响百度热词检索;但反过来,三周内的百度热词检索并不会对微博热词使用产生影响。这样,假说H2得到了统计证明。
为确保时间序列分析结果可靠,我们还进行了如下稳健性分析。
第一,考虑到微博指数和百度指数分别是I(0)和I(1)时间序列,时间序列平稳性不同,我们还使用了Tod-Yamamoto方法来对水平值进行格兰杰检验。检验结果同样支持了H1和H2假说。这实际上意味着微博指数和百度指数不只是增长率相关,绝对数也相关。第二,采取主成分分析法而不是Z值相加的方法来获得百度和微博指数。其中对百度指数我们获得了42个特征值大于1的成分,对微博指数获得了43个特征值大于1的成分。尽管计算繁琐,但我们仍然根据这些成分的解释贡献率计算出了因子得分并求和获得了总体指数。基于主成分分析计算总体指数的检验结果也和我们正文中所展示的结果一致。第三,我们还在热词表单中删除了部分专业术语和新闻事件词语,进行了重新分析,也获得了和前文一致的结论。限于篇幅,这里不再展示。
(四)个体分析结果
为防止生态谬误,我们在个体层面以热词为样本进行面板数据分析。对于全体热词,我们有377个热词的832天每日数据,因此可以获得具有313664(=377×832)个观察值样本的面板数据。对于低龄热词,则可以获得176384(=212×832)个观察值样本的面板数据。由于T远远大于N,且热词使用、检索不会具有长期的路径依赖特征,因此动态面板模型不适用本研究。这样,我们分别使用混合最小二乘法(Pooled OLS)、单向个体固定效应(One-way FixedIndividual Effect,控制热词个体效应)、双向固定效应(Two-way FixedEffects,同时控制热词个体效应和时间效应)和可行广义最小二乘法(Feasible GeneralizedLeast Square,处理异方差和自相关)来分别进行拟合。
我们把四种模型(分别记为P-OLS、One-way FE、Two-way FE和FGLS)的回归结果报告在表4中。考虑到可能的双向因果,我们分别使用解释变量的当日数据(观察值n=313664)和一阶滞后数据(观察值n=313287)进行检验。从表4中不难发现,无论是使用当期变量还是滞后变量,热词的使用(微博指数)总是显著地正向影响热词的学习(百度指数)。而反向的作用在低龄热词中不存在。在全体热词中,也只在0.1的水平上显著。换句话说,微观层次的面板数据分析结果和宏观数据的时间序列分析结果呈现出高度的一致。
我们继续进行了稳健性测试,包括:(1)在P-OLS和FE模型计算标准误时,采用了D-K(Driscoll & Kraay,1998)的稳健估计,综合考虑误差项可能存在的异方差、自相关和词间相关;(2)对FGLS模型分别增加个体固定效应、双向固定效应;(3)对全部指数取对数值后再进行拟合;(4)对全部指数的对数一阶差分也即日变化率进行同样的多模型测试。以上稳健性测试都得到了与表4一致的结论。
四、结语
本文是对周晓虹的“文化反哺”概念的当代反思和拓展,是对曼海姆代际社会学理论的致敬。我们提出与“文化反哺”并行的“文化反授”的概念,总结了其作为互联网时代反向社会化重要模式的六大特征,并以网络热词的传播为例,挖掘和利用自媒体、搜索引擎大数据进行了宏观层次和微观层次的实证检验,证实了“文化反授”现象的存在。
在理论上,我们强调自媒体出现的社会文化后果之一就是迅速提升年轻人的文化创作和传播能力,使得同一代、同一年龄同期群内也能形成不同的文化标签、品位和认知能力的差异鸿沟。我们的研究说明,反向社会化是一个不断发展演变的现象,其机制和特征受到文化传播方式的巨大影响。和周晓虹提出“文化反哺”的20世纪80年代相比,当代中国的“文化反哺”不再是反向社会化的惟一途径。代内“文化反授”已成为自媒体时代反向社会化的重要渠道。这一现象以往的国际国内社会学界均未有专论,值得引起社会学、传播学界更多关注。
在方法上,我们从大数据中提出关键变量,对以往无法测量的文化传授、学习行为进行了科学的操作化。我们的数据覆盖了2013-2015年间近400个网络热词的832天每日跟踪数据,形成了较为可靠的时间序列和面板数据。此外,在分析层次方面,我们在定量社会研究领域较早进行了宏观微观的相互检验分析,验证了代内“文化反授”现象既是一种宏观层次的文化过程,同时在微观层面也即单个热词层面也真实存在。我们的研究还进一步对低龄热词进行了局部分析,使用了尽可能多的模型设置和变量处理,确保验证假说的逻辑严密稳健。
无论是理论分析还是实证检验,本文的分析结果都清晰地告诉我们:互联网尤其是自媒体为当代社会化过程提供了一个崭新、独特的文化空间。越来越多的个体在这个空间中不仅仅是接受和使用信息的文化的消费者,同时也担当起了文化生产者的角色,创造、搜寻、遴选、学习和传播着信息。而个体的文化行为汇集在社会宏观层面,最终形成了文化传播的新模式。我们应该意识到,当85后、95后、05后也逐渐成长、老去,“文化反授”的渠道却依然会畅通甚至进一步强化。无论如何,发现、验证和理解反向社会化的二元模式,将有利于我们加强对互联网时代文化传播过程的理解。
本文还存在一些不足。第一,尽管我们从热词的宏观和个体层面进行了细致分析,但由于无法掌握每一个热词的真实创作发布者、检索者的个体年龄,因此年龄结构的前提仍然有进一步论证的空间。我们希望在未来的针对新生热词创作者的质性访谈研究中获得更多的数据。第二,我们的热词表单选取是在本文初稿写作前的2015年,因此一些2015-2016的新生词汇没有入选。更重要的是,热词的选取必然存在疏漏,低龄热词的界定也不可避免地依赖于主观判断。但考虑到词汇数量和微博、百度用户的地域全覆盖特征,我们对大数据的利用已可以突破传统问卷调查数据的局限,并足以揭示网络文化传播的总体和细节。最后,限于篇幅,我们无法对单个的热词进行逐一展示分析。而根据我们的前期分析,这些热词的总体半衰期、普莱斯系数等等都具有非常明显的特点,可以进行类别研究。我们将会在后续研究中进一步深入。同时,我们呼吁对热词个体的扩散进行多主体仿真建模(agentbased simulation)分析,以探索个体热词的产生扩散是如何成为一种群体层次的社会现象的。而我们文中所提供的相关参数,例如总体1周的滞后期等等,都可以为仿真分析进行实证校准提供依据。
附录:
网络热词表(N=377):
给力、粉丝、可爱、嘻嘻、围观、FF、神器、土豪、最美、木有、童鞋、秒杀、抓狂、达人、GL、神马、有木有、土豪金、HP、博客、吃货、U、吐槽、正能量、卧槽、GX、尼玛、蕾丝、领导、严重、HJ、屌丝、路过、纠结、小清新、女王、得瑟、奇葩、么么哒、江南style、浮云、围脖、Hold不住、卖萌、内涵、狗狗、感冒、穿越、小白、逆袭、节操、统一、微电影、B4、极品、有种、聚会、走你、中国梦、路人、马上有钱、喵星人、逆天、马甲、高富帅、小黑、伤不起、白富美、女汉子、包子、沙发、悲催、老大、Hold住、萝莉、木耳、气场、坑爹、欧巴、同志、脑残、菊花、二代、苦逼、你妹、小三、型男、硬伤、无语、无道、同人、低碳、合体、熊孩子、杀人、腐败、宅男、吼吼、鉴定、稀饭、隔壁、迪奥、叫兽、非诚勿扰、置顶、也是醉了、流星、刷屏、虾米、重口味、钓鱼、高端大气上档次、汪星人、吐血、碉堡了、蛋白质、石化、草根、地板、思密达、无节操、正太、咔咔、山寨、大姨妈、拉拉、楼主、且行且珍惜、美眉、椅子、潜水、酱紫、小资、腹黑、战队、你懂得、COOL、御姐、黑客、凹凸、小苹果、毛线、潜规则、小强、HAPPY、养眼、流口水、蛋疼、死党、总政、青蛙、逗比、泡菜、富二代、忐忑、帝都、我靠、杯具、躺枪、茶叶蛋、菜鸟、油菜花、H7N9、恐龙、泥巴、中国式、闷骚、备胎、劳资、我擦、驴友、厚厚、绝壁、板凳、剧场版、我勒个去、水桶、老湿、逼格、天然呆、秋裤、光盘、也是蛮拼的、鸡冻、剩女、大丈夫、大黄鸭、直男、极客、非主流、脑洞大开、果酱、拍砖、为毛、泡妞、盖楼、劈腿、黑名单、歇斯底里、骇客、大帝、水手、卡哇伊、打飞机、马赛克、度娘、碰瓷、解码、毁三观、BUG、周一见、咔嚓、李天一、大虾、我倒、茶几、地沟油、撕逼、流弊、朋克、蛇精病、外遇、杀马特、切糕、呵呵、小婊砸、蜗居、绿茶婊、饭局、鸟叔、我和小伙伴们惊呆了、失联、酵母、操蛋、漫迷、穷游、大刀、**、有形、雷人、中国大妈、苍老师、狗仔、壁咚、碧莲、鬼畜、五仁月饼、愤青、烧饼、纯净水、泥垢、意淫、雨神、正点、鸟人、打铁、伐开心、炮灰、伪娘、碧池、最炫民族风、比特币、捡肥皂、臣妾做不到、伟哥、鸭梨山大、光盘行动、海天盛筵、国五条、灌水、月光族、神马都是浮云、不约而同、坛子、到此一游、白骨精、钉子户、法克、画面太美我不敢看、斯巴达、渐冻人、有钱就是任性、河蟹、以太、保证不打死你、蚁族、心焦、破鞋、闰土、爆点、拐点、大拿、车震、闪婚、二百五、反腐败、潜水员、心机婊、现在问题来了、狼族、小白脸、如花似玉、转基因大豆、太保、谢特、注定孤独一生、图样图森破、停摆、咸猪手、抛砖、油墨、吃软饭、素人、圣水、草包、我跟你什么仇什么怨、丁克、表叔、水蒸气、千斤顶、十动然拒、渐冻人症、凤凰男、揩油、调教、鸡婆、房姐、肉鸡、咣当、同人志、带我装逼带我飞、斑竹、宅男宅女、刀锋战士、拉皮条、自干五、甄嬛体、第一口奶、挖掘机技术哪家强、打气筒、不差钱、陈欧体、时间都去哪儿、穷癌、仙人跳、狂顶、闪客、略屌、板斧、嫩模、杜甫很忙、猪娃、暴笑、男默女泪、矮矬穷、SOHO、红客、吃翔、紧缚、妈癌、钻石王老五、然并卵、腊鸭、维客、袁厉害、伊妹儿、火钳刘明、同人女、元芳你怎么看、恋爱起步价、北京咳、孔雀女、一字马女生
低龄热词表(N=212):
FF、神器、木有、童鞋、GL、神马、有木有、土豪金、HP、吃货、U、吐槽、尼玛、蕾丝、HJ、屌丝、小清新、女王、奇葩、么么哒、浮云、围脖、Hold不住、卖萌、内涵、小白、逆袭、节操、统一、B4、极品、走你、马上有钱、喵星人、小黑、包子、Hold住、萝莉、木耳、坑爹、欧巴、菊花、你妹、无道、同人、合体、稀饭、隔壁、迪奥、叫兽、刷屏、虾米、汪星人、碉堡了、蛋白质、石化、思密达、无节操、正太、拉拉、椅子、潜水、酱紫、腹黑、御姐、凹凸、毛线、小强、蛋疼、总政、青蛙、逗比、泡菜、杯具、躺枪、茶叶蛋、油菜花、泥巴、备胎、劳资、我擦、驴友、厚厚、绝壁、板凳、我勒个去、水桶、老湿、逼格、天然呆、鸡冻、直男、极客、脑洞大开、果酱、拍砖、为毛、盖楼、劈腿、骇客、大帝、水手、卡哇伊、打飞机、马赛克、度娘、毁三观、BUG、周一见、咔嚓、大虾、茶几、撕逼、流弊、朋克、蛇精病、杀马特、切糕、呵呵、小婊砸、蜗居、绿茶婊、酵母、漫迷、穷游、大刀、有形、雷人、壁咚、碧莲、鬼畜、五仁月饼、烧饼、泥垢、意淫、雨神、正点、打铁、伐开心、炮灰、伪娘、碧池、捡肥皂、海天盛筵、灌水、坛子、白骨精、钉子户、法克、斯巴达、渐冻人、河蟹、以太、蚁族、心焦、破鞋、闰土、爆点、拐点、车震、潜水员、心机婊、狼族、太保、谢特、图样图森破、停摆、抛砖、油墨、素人、圣水、草包、丁克、表叔、水蒸气、千斤顶、十动然拒、凤凰男、调教、房姐、肉鸡、咣当、同人志、刀锋战士、自干五、第一口奶、打气筒、陈欧体、时间都去哪儿、穷癌、仙人跳、狂顶、闪客、略屌、板斧、杜甫很忙、猪娃、暴笑、男默女泪、矮矬穷、SOHO、吃翔、紧缚、妈癌、然并卵、腊鸭、维客、袁厉害、火钳刘明、同人女、孔雀女、一字马女生
作者单位:南京大学社会学系