|
摘要: 本文关注中国大陆中学生课外补习参与及其负向情绪生成的因果关系。本文基于中国教育追踪调查两期数据,借助工具变量等方法来化解内生性偏误,在量化层面上回答了课外补习参与“是否致郁”以及“使谁抑郁”等问题。本研究主要发现如下:其一,课外补习参与对中学生的情绪健康状况具有显著的“致郁效应”,但这种效应主要存在于家庭背景占劣势的较低阶层的子女当中,而家庭背景具有优势的较高阶层的子女对此类负向情绪有更强的抵御能力,表现出了“心理免疫”的现象;其二,本文从“情绪调节”的角度入手,对“致郁效应”的阶层异质性做出了进一步解释。研究结果有助于我们深入理解课外补习参与可能具有的健康不平等意涵。
关键词:社会分层;课外补习;负向情绪;因果推断;工具变量
作者简介:李适源, 北京大学光华管理学院社会研究中心;刘爱玉,北京大学社会学系
一、问题提出
伴随着中国经济改革与教育市场化的进程,围绕中小学升学考试科目而展开的课外补习班(cram school)在中国社会蓬勃兴起。近年来,初中和高中阶段的课外补习参与率以及市场规模呈攀升之势,成为教育竞争的典型文化意象(薛海平、丁小浩,2009;中国教育报,2017;孙伦轩、唐晶晶,2019)。
与此同时,青少年抑郁等负向情绪也呈现快速增长态势。在中国教育追踪调查(China Education Panel Survey,CEPS)2013—2014学年的全国抽样数据中,超过30%的初三学生报告“过去的一周有时或经常感到抑郁”(已经过抽样权重调整)。新近的医学与心理学研究发现,抑郁症在中国青少年群体中的发生率处在高位(苗瑞凯,2020)。在部分发达地区,表现出轻度抑郁症状的中学生比例高达30%左右(张文武等,2014;牛娟等,2019)。值得警惕的是,青少年抑郁是导致自杀最常见的诱因之一(Bridge, et al., 2006;Waldvogel, et al., 2008),近年来不断出现的“中学生跳楼事件”也得到了社会各界的持续关注。此外,还有研究发现,班级其他学生的负向情绪可以通过班级社交网络实现“负向情绪的传染”,从而放大个体负向情绪所造成的社会心理后果(李长洪、林文炼,2019)。可见,考察青少年负向情绪的生成机制以及情绪调节境况具有紧迫的现实意义。
青少年抑郁等负向情绪的增长可能与近年来激烈的教育竞争存在关联(Lin, et al., 2008;McCarty, et al., 2008;Yi,2013)。已有研究发现,参加课外补习可能会导致青少年抑郁等负向情绪的增加(Kuan,2018;Zheng, et al., 2020;Chen and Kuan, 2021)。课外补习参与对青少年情绪健康(emotional well-being)的这类副作用,可简约地称之为补习参与的“致郁效应”(depressive effect)。
课外补习与青少年的情绪健康问题,与2021年7月以来国务院颁布的“双减”(减轻义务教育阶段学生作业负担和校外培训负担)政策息息相关。“双减”政策明确强调,“坚持从严治理,全面规范校外培训行为”“不再审批新的面向义务教育阶段的学科类校外培训机构”,政策还提出要“着眼学生身心健康,保障学生休息权利”。可以说,青少年的心理健康问题得到了国家层面的关怀和重视,决策者也试图通过对课外补习的约束和规制以保障学生的身心健康。
保障青少年的心理健康对于经济社会的可持续发展具有关键作用。从经济增长的角度来看,课外补习和青少年的情绪健康问题关涉到“教育人力资本”和“健康人力资本”的积累(Becker,2007;Hartog and van den Brink,2007;Azarnert,2020)。从社会分层的视角看,由于家庭教育资源和教养方式的阶层差异,青少年的身心健康问题有可能会扩大既有的教育不平等。由此观之,保障青少年的心理健康与顺利成长对于促进社会公平和可持续发展具有深远的现实意义。
目前,决策者已经注意到补习机构的无节制增长(以及课外补习的过度参与),可能是导致青少年学业负担过重以及引发情绪健康问题的原因。但从学理上看,课外补习与青少年情绪健康的因果关系仍需进一步的澄清和检验——课外补习在多大程度上会威胁到青少年的情绪健康?课外补习究竟威胁到哪些青少年的情绪健康?这些疑问都有待严谨细密的研究。
考虑到不同社会阶层的成员可能在主观认知、情绪体验、行为选择等维度上存在异质性(Duncan, et al., 1988;Xie,2007;谢宇,2006),课外补习给青少年情绪健康带来的后果可能也存在阶层差异。例如,即使参加了类似的课外补习,某些阶层的子女可能在补习过程中持续积累负向情绪,另一些子女却对补习过程中派生的负向情绪具有更好的调节能力,甚至对负向情绪表现出“心理免疫”的现象。我们在评估课外补习对青少年情绪健康的因果影响时,需要更细致地考察不同家庭阶层背景(或称家庭社会经济地位)的学生在补习参与中的情绪健康是否具有相异甚至相反的表现。
从实践层面看,因果效应的异质性对于政策评估和政策制定具有重要意义。课外补习的情绪健康后果若的确存在阶层分异,那么“双减”政策在推行的过程中可以针对不同社会群体的背景与需求状况,做到有的放矢、精准施策,从而增进政策效力。
从学理层面看,课外补习是否会带来抑郁等负向情绪的积累,在多大程度上会带来负向情绪,这些问题仍然存在分歧;其次,课外补习参与的“致郁效应”是否存在阶层异质性,究竟存在何种模式的阶层分异,目前也少有经验研究给出明确答案,有待进一步的实证检验。
本文的研究问题和结构安排如下:首先,基于全国性的调查数据和工具变量方法,考察参加课外补习是否显著增加中学生的负向情绪。在回答补习“是否致郁”的基础上,进一步探究课外补习究竟“使谁抑郁”?“致郁效应”是否在不同家庭阶层背景的学生群体间存在差异?最后,本文尝试解释“致郁效应”为何存在阶层分异。
我们对研究问题做出两点说明:其一,本文关注的课外补习是指“围绕中小学的升学考试科目(如语文、数学、英语),以提升考试成绩为导向的学业辅导班”(Bray,2013;Kuan,2018;Zheng, et al., 2020),不包括“艺术、体育等非学业导向的课外兴趣班或特长班”;其二,本文关注的负向情绪主要指“抑郁情绪”(depressive mood),可将其理解为“沮丧低落的、暂时性的负向情绪状态”。有必要将抑郁情绪与“抑郁症”(major depressive disorder)加以区分,抑郁症是指“长期持续地处于低落消沉的情绪、对日常生活失去兴趣、且自身难以调节的心境障碍”(De Zwart, et al., 2019)。短暂的抑郁情绪未能及时调节而逐渐累积,可能会进一步转化为抑郁症。本文对情绪健康的分析主要围绕抑郁情绪展开。
二、文献回顾与研究框架
本文的核心问题是课外补习参与“是否致郁”以及“使谁抑郁”这两大问题。针对课外补习“是否致郁”的问题,现有经验研究存在两种竞争性的观点:其一,补习参与有利于缓解同辈压力及其引发的负向情绪,发挥了“安慰剂”的功效(Zheng, et al., 2020;孙伦轩、唐晶晶,2019);其二,参加课外补习可能会增加青少年的负向情绪,具有致郁效应(Bray, 1999, 2013;Kuan,2018;Zheng, et al., 2020;Chen and Kuan, 2021)。针对“使谁抑郁”的问题,少有本土研究考察“课外补习的情绪健康后果”是否存在总体异质性,也未能深入讨论情绪健康后果的组间分异模式。本文的文献回顾正是基于上述两大经验困惑(课外补习“是否致郁”以及“使谁抑郁”)而展开。
(一) 是否致郁:“致郁效应”与“安慰剂效应”的分歧
课外补习参与对情绪健康状况的影响存在两种竞争性的观点。第一种观点认为,课外补习参与对于情绪健康状况存在致郁效应,即补习参与可能增加青少年的抑郁情绪。致郁效应的可能机制是,长时间、高强度的课外补习对学生可自由支配的闲暇时间以及亲子之间的互动具有“挤出效应”(crowding out effects),导致学生陷入高度紧张的刚性时间约束当中,这将对情绪健康产生威胁。其中最直观的影响是参加课外补习对青少年的睡眠剥夺(Kuan,2018),而睡眠时间缺乏及各类睡眠问题是导致负向情绪积累的重要诱因(Yoo, et al., 2007;Pasch, et al., 2010;Gujar, et al., 2011;Gruber, et al., 2012)。另一种观点认为,课外补习参与对情绪健康状况具有“安慰剂效应”。也就是说,课外补习并不必然提升学业成绩,却能有效缓解同伴压力,进而缓解抑郁等负向情绪(Zheng, et al., 2020;孙伦轩、唐晶晶,2019)。更具体地说,青少年参加课外补习受到同伴间社会比较的驱动。个体了解到同伴参加了课外补习,担心同伴成绩超过自己,于是选择参加补习。在接受课外补习之后,个体得到一定程度的“心理安慰”(Zheng, et al., 2020)。
目前,“安慰剂效应”与“致郁效应”都得到了不同程度的实证检验。关秉寅(Kuan,2018)基于中国台湾地区21世纪初的教育追踪调查数据,利用倾向得分逆概加权(inverse probability treatment weighting,IPTW)处理内生性问题之后,发现参加课外补习会显著增加九年级学生的抑郁情绪。此后,陈怡蒨和关秉寅(Chen and Kuan, 2021)使用时效性更强的“台湾后期中等教育长期追踪调查”(TUSD)2014—2015学年数据,基于类似的实证策略,发现对于“初中三年始终参加课外补习的学生”和“在中途退出课外补习的学生”而言,参加课外补习会显著增加这两类学生的抑郁情绪,一定程度上印证了关秉寅(Kuan,2018)之前的研究发现。
与之不同的是,有学者基于大陆地区的中国教育追踪调查(CEPS)数据发现,课外补习显著增加了学生的自信心和自我效能感,而课外补习的“致郁效应”只在长时间过度补习的情形下才显著存在(Zheng, et al., 2020)。孙伦轩和唐晶晶(2019)也印证了补习参与的“安慰剂效应”,他们使用倾向值匹配基础上的双重差分法(PSM-DID)发现,课外补习的参与显著改善了学生的情绪健康水平,能够减少抑郁等负向情绪水平。
(二) 经验分歧的可能原因
关于“安慰”与“致郁”的分歧,笔者认为除了研究资料存在时间、地域和结果变量测量上的差异以外,不同研究对内生性问题的处理方式可能是造成分歧的成因之一。在课外补习对情绪健康的因果效应识别过程中,主要的内生性问题可归结为两类:一是遗漏变量与自选择偏误,二是反向因果问题。
首先讨论遗漏变量与自选择偏误。这一问题的成因是核心自变量取值并非“随机分配”,即个体是否参与课外补习是由学生自身(或者家长、老师)决定的,而不是以随机实验的方式来指派。因此,可能存在未观测到的混淆因素,该因素既与课外补习的参与决策相关,又影响到学生的情绪健康,那么该混淆因素可能导致遗漏变量偏误。例如,“学生的性情特质”一般难以观测。一方面,性情偏悲观的学生更可能秉持“补课无用论”,参加课外补习的主观意愿相对更低;同时,性情偏悲观的学生或更易产生消极的自我暗示,抑郁等负向情绪也相对更多。因此,性情倾向便是一个典型的遗漏变量,它可能使补习参与对情绪健康状况的因果效应估计出现偏误。
另一个问题是反向因果偏误。本研究的核心自变量是课外补习的参与,因变量是学生的负向情绪水平。心理学和教育学的研究指出,情绪健康状况也会对学生课内外学习投入的积极性产生影响(Chen and Li, 2000;Needham, et al., 2004;Crosnoe, et al., 2007;McLeod and Fettes, 2007;McCarty, et al., 2008)。具体来说,情绪健康状况较差(负向情绪倾向较重)的学生,学习动力较弱,参加课外补习的意愿相对较低。负向情绪(结果变量)对于课外补习(原因变量)具有“负反馈效应”,这可能导致基于普通最小二乘法(ordinary least squares,OLS)得出的补习致郁效应受到系统性的低估。原因在于,课外补习带来的负向情绪积累使学生在未来继续参加补习的可能性下降,进而稀释了未来补习带给学生的致郁效应。
涉及课外补习与负向情绪的本土研究主要使用的分析方法是倾向值匹配(propensity score matching,PSM)以及双重差分法(difference in difference,DID)。但倾向值匹配只能化解由可观测的混淆因素带来的因果推断偏误,较难克服无法观测的遗漏变量的干扰,也难以彻底解决反向因果问题。此外,由于补习参与是微观主体的选择(而非外生的政策冲击),双重差分法的适用性也值得商榷。
为了进一步化解遗漏变量偏误与反向因果带来的内生性问题,本文使用工具变量法(instrumental variable,Ⅳ)和滞后变量法(lagged variables)进行因果推断。有效的工具变量能够更好地化解遗漏变量和反向因果问题,较好地捕捉到补习参与对中学生负向情绪的真实因果效应(Angrist, et al., 1996;Angrist and Pischke, 2009;Morgan and Winship, 2015)。
(三) 使谁抑郁:补习参与的异质性后果
关于补习参与“是否致郁”这一问题,只能在总体平均的意义上回答课外补习对青少年情绪健康的后果。无论数据结果表明补习参与是“致郁”还是“安慰”,两者都可能忽略了平均因果影响所掩盖的总体异质性。
总体异质性可以理解为总体内“不同个体之间的差异”,正是因为异质性的存在,“相同的原因会导致不同的结果”(谢宇,2006:48)。在本研究关注的情境中,即使受访学生参与了相同数量和质量的课外补习,不同学生的学业收获、对课外补习的态度评价和情绪体验也可能是不同的。也就是说,补习参与的情绪健康后果很可能是“因人而异的”。关注并捕捉总体异质性,不仅有助于在学理上进一步澄清被总体均值掩盖的群间差异,更有助于为社会政策提供更加明确、细致和精准的目标指引。
近年来,在有关青少年发展的经验研究中,针对青少年的“发展型结果”(developmental outcomes)(Kim,2011)的异质性分析日益得到重视。有学者将美国人口调查数据和“佩里学前教育干预”(Perry preschool intervention program)的实验数据相匹配,发现“佩里学前教育干预”更有助于改善家庭社会经济地位处于劣势的子女的非认知能力。教育干预的良性影响在社会阶层较低的孩子当中也更持久和深远(Xie, et al., 2020)。再如,有关婚姻家庭和子女养育的西方研究发现,父母离异对子女发展的影响并不都是负面的,父母离异对子女教育成就的不利影响主要存在于社会阶层较高的子女群体中(Brand, et al., 2019)。
情绪健康状况作为身心健康的重要指标,也可视为青少年的一项“发展型结果”。在围绕补习参与的经验研究中,值得一提的是关秉寅(Kuan,2018)对中国台湾地区中学生情绪健康的异质性分析。他按“补习参与概率”的高低将样本分为五组,分别估计每组学生参加补习的情绪健康后果。结果发现, “致郁效应”仅在“补习参与概率较高”的第四组学生中统计显著,其他各组学生的抑郁情绪并未因补习参与而显著增加。此外,关秉寅的新近研究也发现补习参与的致郁效应的严重程度可能依赖于“补习参与的模式”(Chen and Kuan, 2021)。不过,上述研究的异质性分析主要着眼于补习过程本身,并未直接指向情绪健康后果的阶层异质性。
(四) 理论框架:教养方式与情绪健康后果的分异模式
捕捉和检验情绪健康后果的阶层异质性及其具体的分异模式,有助于研究者厘清和评估影子教育的教育不平等与健康不平等意涵,并提供更为细致精准的政策指引。
本研究从家庭教养方式(parenting style)的阶层分异出发,在理论脉络上对情绪健康后果的阶层异质性做出推断与解释。家庭教养方式的阶层分异自20世纪以来就得到了持续关注(Kohn,1963;Dornbusch, et al., 1987;Lareau, 1987, 2011;Steinberg, et al., 1992)。黄超(2018)结合本土情形与经典文献,按照“沟通频繁度”与“要求严格程度”划分出四种教养方式,分别是“权威型”(亲子沟通频繁,要求严格)、“宽容型”(沟通频繁,要求不严格)、“专制型”(沟通较少,要求严格)、“忽视型”(沟通少,要求也少)。黄超(2018)发现,中国家长对其子女普遍具有高要求和高期待,教养方式分异的关键在于沟通维度——较高阶层的家长多用权威型教养方式,较低阶层的家长多用专制型教养方式。更重要的发现是,权威型教养方式更有助于培养子女的非认知能力(non-cognitive skills),子女在自我效能、社交能力和集体融入等多方面都有更好的表现(黄超,2018)。
家庭教养方式的阶层类型学理论及本土经验为本研究探索情绪健康后果的阶层异质性提供了思路。在补习参与过程中,家长对子女负向情绪的体察与引导以及学生自身的情绪调节能力,可能是情绪健康后果因人而异的关键因素。具体来说,较高社会阶层的家长更可能采取“积极回应,注重沟通”的教养方式,更及时地体察和回应子女在补习中派生的负向情绪,引导子女进行情绪调节。同时,若将情绪调节能力视作非认知能力,那么较高阶层的家长的教育方式可能更有利于培养子女的情绪调节能力;相比之下,较低社会阶层的家长由于将相对稀缺的经济资源用于课外补习,可能会要求子女在课外补习中取得适当的学业回报。当子女受到负向情绪困扰时,较低阶层的家长可能无法及时察觉到子女情绪变化(并展开有效的沟通、引导与回应)。如果从非认知能力的角度来看,较低阶层的家长的教养方式也不利于培育子女自身的情绪调节能力,导致影子教育引发的负向情绪在较低阶层的子女群体中更明显。
上述理论框架提供了一种经验预测——补习参与的情绪健康后果可能存在“劣势—特异”与“优势—免疫”的阶层分异模式。换言之,课外补习引发的负向情绪可能是较低阶层子女的“特异性后果”,而较高社会阶层的子女对此类负向情绪具有较好的“心理免疫能力”。进一步看,由于负向情绪的长期累积会对学生未来的学业表现、身心发展带来持续的不利影响,课外补习可能借助健康不平等的生产,隐秘地促成了教育分层格局的维持与延续。因此,围绕情绪健康后果展开的异质性分析,对于进一步揭示教育与健康不平等的再生产具有启发意义。
(五) 异质性分析的具体策略
从方法策略的角度看,围绕青少年“发展型结果”而展开的异质性分析仍有待商榷。通常做法是按照接受处理的倾向得分(如参加课外补习的概率)将全样本分组,然后考察组内因果效应在不同组间的差异。
由于倾向得分将家庭背景的各项测量指标(父母收入、教育、职业等)“合众为一”,在某些情形下,倾向得分所表达的社会阶层信息可能是含混的。例如,学生家庭背景的各指标与学生是否参加补习的相关性并不一定是统一且同向的,可能有一些家庭背景指标与补习参与正相关,而另一些家庭背景指标与补习参与负相关。另外,由于分组使用的倾向得分是基于样本数据估计得出的派生变量(generated variables),而非总体的真实变量,基于倾向得分而获得的组间分异模式可能受到抽样误差和样本选择偏差的干扰(Breen, et al., 2015)。因此,若以倾向得分作为家庭背景的分组变量进行异质性分析,其结果可能具有误导性。
综合考虑,本研究决定采用多个相对客观的家庭背景指标(而非估计出的倾向得分)来划分全样本,通过分组回归的方式考察情绪健康后果的阶层异质性。具体来说,家庭背景的分组标准是多分类的家庭经济条件、父母的最高受教育程度以及父亲的职业类别。
三、数据、变量与方法
(一) 数据来源
本文使用中国教育追踪调查(CEPS)的两期数据,包括基期数据(2013—2014学年)和追访数据(2014—2015学年)。该调查采取PPS抽样,在基线调查中抽取了112所学校、438个班级的约2万名初中生作为样本;第二期调查成功追访到了近1万名初一(升初二)的学生。
本研究的样本主要选取的是基线调查(2013—2014学年)的七年级学生,这批学生在2014—2015学年再次受访。后续分析主要使用追访数据,同时也将基期数据中的某些变量作为滞后变量进行统计控制。在本研究使用的所有变量上均不存在缺失的受访者进入研究样本,最终保留的样本共6 535人。
(二) 变量与测量
本文参考了代表性研究的建模策略,对控制变量进行了全面且审慎的选取。
1. 原因变量
本文的核心自变量(原因变量)是课外补习参与,操作化为“最近一年来,学生是否参加奥数/普通数学/语文/英语补习班(参加设为1,否则为0)”。研究样本中,2014—2015学年参加课外补习的学生占全样本的38.68%(2 528人),本学年未参加课外补习的学生占全样本的61.32%(4 007人)。
我们比较了不同家庭背景(家庭经济条件、父母文化程度、父亲职业类别)的学生在本学年的补习参与率,发现补习参与率与学生的家庭社会经济地位呈正相关关系。家庭背景处于较高阶层的子女补习参与率相对更高。
2. 结果变量
本文的因变量(结果变量)是中学生的情绪健康状况,操作化为“负向情绪得分”。本文借鉴了代表性研究对抑郁情绪的处理方法(Kuan,2018;Chen and Kuan, 2021),使用项目反应理论(item response theory,IRT)的定序计分模型(graded response model),假定受访者负向情绪水平与受访者对情绪量表题目选项的应答概率服从逻辑斯蒂函数关系,然后使用最大似然估计法(maximum likelihood estimation,MLE),将CEPS问卷中负向情绪量表的应答结果转化为每位受访者的负向情绪IRT得分。
研究样本2014—2015学年的负向情绪IRT得分在-1.53到2.75之间,均值和中位值都接近0,标准差为0.93。负向情绪得分越高表明受访者的负向情绪积累越多,负向情绪倾向程度越严重。我们比较了不同家庭背景(家庭经济条件、父母文化程度、父亲职业类别)的子女负向情绪得分的组间差异,发现负向情绪的严重程度与学生家庭的社会经济地位呈负相关,家庭阶层较高的子女负向情绪得分更低。
3. 控制变量
控制变量分为五类:学生特征、家庭特征、班级特征、时间固定效应、地区固定效应。
(1)学生特征。其一,人口学特征,包括学生性别、年龄、民族、兄弟姐妹数量、户籍类型、迁移流动状况(分为本地学生、省内流动、跨省流动三类)、五分类自评身体健康状况。其二,前期的学业能力,包括七年级时的认知能力标准得分、七年级的语数外标准化期中成绩、(自评的)六年级时学习语数外的吃力程度。其三,居住安排,包括是否与双亲同住、是否寄宿、家庭所在社区的类型。其四,亲子关系,包括与父母亲的亲近程度、学生的日常生活与照料由谁负责、学生在家的学业辅导由谁负责。
(2)家庭特征。其一,家庭收入,包括家庭经济条件、家庭收入的相对水平。其二,家庭文化,包括父亲、母亲的受教育程度,物质性文化资本(家中藏书量、学生是否有独立的书桌、家中是否有电脑与网络)。其三,双亲职业,职业类型根据CEPS问卷的职业分类,转化为多个虚拟变量。其四,监督管理,操作为对子女学习生活的要求与监督强度。其五,亲子沟通,操作为与子女讨论学习及生活问题的频率。
在后续的阶层异质性分析中,本研究将家庭经济条件、父母亲的最高受教育程度以及父亲的职业类型作为家庭背景的分组变量。选取理由基于两点:从社会分层的经典理论来看,收入、教育与职业通常被视作社会经济地位(SES)的核心构成(Blau and Duncan, 1967);从分析策略看,相较于连续型倾向得分,父母教育和职业类型等变量均为多分类变量,天然具备“社会分组”的性质,能更清晰明确地表达出学生所属的家庭阶层信息。当然,这样的分组标准也有不足之处,在分析步骤和结果解读上相对更加繁琐和庞杂。
(3)班级特征。其一,学生是否得到语数外三科老师或班主任老师的提问、表扬、批评。其二,学生对班级班风、班级同学友好程度的评价以及参加班级活动的频率。其三,学生对所在学校的喜爱程度、对同校学生的亲近程度、转校意愿。
(4)时间固定效应。即在回归分析中纳入学期虚拟变量(秋季1,春季0),目的是控制那些只随时间变动而不随个体变化的异质性。
(5)学校固定效应。使用普通最小二乘法(OLS)估计时为每个学校分别设置虚拟变量,将它们纳入回归方程,目的是控制学校层面难以观测的异质性。
(6)区县固定效应。在使用工具变量两阶段最小二乘法(TSLS)估计时,为每个区县分别设置虚拟变量,目的是控制区县层面难以观测的异质性。
(三) 模型设定与实证策略
1. 基准模型设定:OLS及其内生性问题
首先估计基准回归模型,只纳入当期(第二轮CEPS追访数据)的控制变量进行OLS多元回归,进而得到课外补习参与对负向情绪得分的斜率系数估计值。
回归方程如(1)式所示。其一,结果变量Yisct是处在时期t、区县c、学校s的受访学生的负向情绪得分;其二,原因变量cramschisct为学生i在最近一年是否参加课外补习班(学业辅导班)的虚拟变量,参加取值为1,未参加取值为0;其三,Xisct为学生(及其家庭、班级)层面的控制变量;其四,μs为学校固定效应(学校虚拟变量);其五,λt为学期虚拟变量;其六,εisct为回归方程的误差项(error term),它包含了所有未观测到的、且对学生i负向情绪IRT得分具有影响的因素。
β1, ols为本文所关心的课外补习对负向情绪的因果效应参数。如果在给定控制变量的条件下,误差项εisct与原因变量cramschisct不相关,则基于OLS得到的样本回归系数是对因果效应参数β1, ols的一致估计量(consistent estimator)。
2. 引入滞后变量:对基准模型的初步改进
为了初步缓解内生性问题,我们在基准回归模型中加入了受访学生的“前期学业能力”以及结果变量的滞后项(前期负向情绪),作为控制变量。具体而言,纳入了受访学生七年级的语数外三科期中考试成绩和六年级时学习语数外的吃力程度,将其视作对前期学业水平的度量;同时,也加入了学生在七年级时的认知能力测试标准化得分,作为学业能力的代理变量。在下面的回归方程(2)式当中,列向量Xisc, t-1就代表了上述的“前期学业能力”。
另外,本文还纳入了受访学生在上一学年的负向情绪IRT得分。假定结果变量(负向情绪)对原因变量(课外补习参与)的反馈效应存在“时滞”,即只有上一期的结果变量才会影响到当期的原因变量。那么给定上一期结果变量后,当期的结果变量就不再影响当期原因变量的取值。在这种情况下,纳入结果变量的滞后项能较好地化解反向因果问题(Manski,1993;陈云松、范晓光,2010)。
3. 工具变量法:内生性问题的进一步处理
本研究使用工具变量法以进一步化解内生性偏误。本文的工具变量是个体所对应的“位似群体”的补课参与率。“位似群体”是指与学生本人处在同一区(县)但不同学校的其他学生群体。本文工具变量的选取思路借鉴了既有实证研究(Zhang,2013),并对工具变量的构造方法做出了改进。
本研究中工具变量的含义是,“与学生个体i处在同一区(县)而不同学校的‘其他学生’当中,参加课外补习的人数(占‘其他学生’总人数)的比例”。本文工具变量的数学表达式如(3)式所示。在第二行展示的分式中,分子一项度量了“学生个体所在区(县)其他学生是否参与补习的样本频次加总(在计算中排除了与本人同校的学生)”,分母一项度量了“学生个体所在区(县)其他学生的总人数”(计算中排除了与本人同校的学生)。
基于工具变量进行因果推断,关键前提是工具变量的有效性,这依赖于工具变量的相关性与外生性。相关性是指工具变量(“位似群体”补课参与率)与原因变量(学生个体是否参与课外补习)的总体(偏)相关系数不为零。本工具变量实质上度量了区(县)层面的中学生补课参与水平。一定程度上,它反映了该地区课外补习市场“局部均衡”的结果。一方面,工具变量可反映学生所在区(县)的其余八年级学生群体对课外补习的需求;另一方面,工具变量也能反映该区(县)补课机构的丰富程度。从需求侧看,地区性补课需求很可能通过地区内人际网络发生信息传递;从供给侧看,地方补课机构的丰富程度也可能影响个体参与课外补习的难度与机会分布(如开班数量、补习费用)。这说明工具变量与原因变量很有可能是相关的。从实证结果角度看,一阶段回归的F统计量远大于10,从统计学意义上来看不存在“弱工具变量”问题。
其二是工具变量的外生性,即要求工具变量与误差项εisct不相关。也就是说,在给定控制变量的条件下,本文的工具变量(“位似群体”的补课参与率)不能与其他未观测到的、影响个体情绪健康的混淆因素产生关联。以下提供三点论证。
首先,本文的工具变量反映了地区层面的补课参与率,可能受到地区间经济文化发展差异的影响,导致工具变量与未观测到的地区异质性发生关联。因此,本文设置了区(县)固定效应,仅在每个区(县)内部进行因果识别,在很大程度上降低了上述问题发生的可能。其次,本研究的工具变量度量了地区层面的宏观特征,它不太可能对微观个体的情绪健康状况产生直接影响。第三,最为重要的是,本研究在构造工具变量的过程中有意地排除了“与个体i处在同一学校的学生群体”。有关同伴效应的代表性研究指出,与个体同班的同学或同校校友可界定为个体的“同伴群体”(杜育红、袁玉芝,2016;杜育红、郭艳斌,2019),而同伴群体的社交网络具有“情绪传染”的可能(李长洪、林文炼,2019)。换言之,课外补习行为可能直接影响到个体的情绪状况。例如,同伴群体竞相参加补课,可能使尚未参与补课的学生感到同辈压力增大,导致负面情绪增加。因此,本文的工具变量中有意排除了基于“强关系”的同伴效应的干扰。本文认为,对个体情绪健康状况有较大程度和直接影响的人群很可能是距个体较近的同伴群体,即那些与个体同班或同校的学生群体。而那些校外的、距离更远的“位似群体”的补课行为很有可能不会直接影响到个体的情绪健康,需借助个体所在学校或班级的同伴群体行为特征对个体情绪健康带来间接影响,所谓“远亲不如近邻”。本研究在工具变量的构造中已阻断了上述这条间接作用路径;同时,本文并不否认个体有重要或亲密的好友与个体处在不同学校,但是在随机抽样的情形下,身处外校的受访者很难对本校的学生产生系统性的同伴效应。
就具体估计方法而言,本文使用两阶段最小二乘法(two stage least squares,TSLS)得到(即课外补习参与对负面情绪得分的因果效应的估计结果)。基于工具变量的TSLS回归方程如下式(4)和(5)所示。
为了进一步保障工具变量的外生性,可以在上述两个方程(4)和(5)中加入“学生的前期学业水平和认知能力”这一组滞后变量Xisc, t-1。理论上而言,如果本文选取的工具变量IVsct满足相关性假定和外生性假定,即π1≠0且Cov(IVsct,εisct)=0,则能较好地近似衡量总体因果效应参数。
四、研究发现
本部分使用上文介绍的分析方法,基于CEPS两期数据主要回答以下三个问题:其一,课外补习“是否致郁”,即考察课外补习参与对负向情绪水平的总体因果效应;其二,课外补习“使谁抑郁”,即考察课外补习致郁效应的阶层异质性;其三,解释致郁效应为何存在阶层分异。
(一) 描述性统计结果
首先,本文的研究样本可划分为“本学年参加补习”和“本学年未参加补习”两个子样本(简称补习样本、未补习样本),然后分别进行描述性统计。表 1报告了结果变量(负向情绪)及部分控制变量的均值和标准差,发现如下:
其一,补习样本的负向情绪得分显著低于未补习样本。平均意义上看,未参加补习的学生似乎表现出了更多的负向情绪。不过,由于暂未考虑到学生的家庭背景、上一学年的负向情绪以及学业表现,而这些因素既可能影响到学生当期的补习参与决策,又可能与当期的负向情绪密切相关,因此简单的负向情绪组间均值比较结果有待进一步的澄清。
其二,从控制变量的分布来看,补习学生更多来自较高的社会阶层,拥有较少的兄弟姐妹、更多来自城市、有更高的认知能力得分和语数外期中考试成绩,拥有更好的家庭经济条件和物质性文化资本。比较而言,未参加补习的学生更多来自较低阶层的家庭,有较多的兄弟姐妹,更多来自农村,认知能力测试和期中考试的表现也相对欠佳,家庭经济条件和物质性文化资本相对较差。
其三,迁移流动状况的组间比较值得注意。在参加补习的学生中,“本地入学比例”反而略低于未参加补习的学生样本,且这两组学生的“跨省流动比例”并无显著差异。这一结果可能与筛选样本的标准有关。本文的研究样本只包含那些在所有控制变量上都拥有观测值的受访者。我们发现,变量(特别是学生户口类型)存在缺失的受访者更多地来自流动人口较多的地区。因此,那些处于迁移流动状态的受访者可能因缺失值未能进入研究样本。考虑到这一点,在后文的回归分析中我们控制了“学生的迁移流动状态”“学生家庭所在的地区类型”“学生所在区县”等变量,以免发生样本选择偏误。
(二) 总效应的因果识别:课外补习是否“致郁”?
为了进一步考察原因变量(课外补习参与)对结果变量(情绪健康)的因果效应以及因果效应的组间(阶层)异质性,研究从描述性统计转向回归分析。
表2展示了在不同的分析方法和模型设定条件下,总效应的系数估计结果。表 2的第(1)列是基准OLS模型得到的系数估计值。在控制了个体层面协变量、学校固定效应、学期固定效应的基础上,参加课外补习对负向情绪得分的效应系数并不显著区别于0值。接下来,笔者在基准模型的基础上纳入滞后变量,以缓解反向因果问题和滞后效应带来的遗漏变量偏误。表 2的第(2)列系数显示,将滞后变量进行控制之后,课外补习参与对负向情绪得分的影响系数估计值增大,系数估计值在p<0.05的水平上显著为正。这在一定程度上印证了“负向情绪对课外补习参与”的负反馈效应可能导致因果效应系数被低估。
在多元OLS回归的基础上,本研究使用工具变量法来进一步处理内生性偏误。首先,使用当期数据(2014—2015学年CEPS截面数据)构造了学生个体对应的“位似群体”课外补习参与率作为工具变量,使用两阶段最小二乘法(TSLS)来估计课外补习参与对负向情绪得分的因果效应,结果如表 2的第(3)列所示。第(3)列末尾报告了第一阶段回归的F值,数值上远大于临界值10,说明此处使用的工具变量满足相关性假定,暂不存在弱工具变量问题。
基于工具变量的TSLS估计结果显示,课外补习参与对负向情绪得分的因果效应系数显著为正。数值上看,给定控制变量,参加课外补习(相较于未参加)使学生的负向情绪得分增加约0.38个标准差(这是因为致郁效应的点估计值约为0.35,而负向情绪得分的样本标准差约为0.93),即课外补习对情绪健康表现出显著的致郁效应。
考虑到基于当期数据构造的工具变量(即2014—2015学年“位似群体”的课外补习参与率)可能与结果变量(即2014—2015学年学生的负向情绪得分)存在互为因果的问题,本文用2013—2014学年的CEPS基期数据,构造了滞后期的“位似群体补课参与率”作为第二个工具变量;再将两个工具变量同时放入一阶段回归方程,进行两阶段最小二乘估计。结果如表 2第(4)列所示,与第(3)列系数非常接近。此外,本文在表 2的第(4)列下方报告了过度识别检验的J统计量。J统计量数值约为0.01,p值超过0.9,过度识别检验不显著。这在一定程度上印证了本研究工具变量的外生性(陈强,2014)。
需要注意的是,与加入了滞后变量的OLS回归相比,工具变量法对致郁效应的估计值增大了7倍左右。存在两种可能的解释:其一,由于遗漏变量和反向因果等问题,OLS回归可能过低估计了真实的致郁效应;其二,当因果效应具有个体异质性时,工具变量法所估计的其实是“局部平均因果效应”(local average treatment effect,LATE)(详细介绍参见Angrist, et al., 1996;Angrist and Pischke, 2009)。也就是说,本研究用工具变量估计出的致郁效应可能反映的是“(总体当中)课外补习的参与决策真正受到了‘位似群体’影响的那些学生”的平均因果效应(Stock and Watson, 2015:506-508)。这些学生的补习参与决策更易受到外界的影响,由此推测他们对补习效果的认知评价以及补习参与中的情绪体验也相对更敏感,更易受社会环境因素的影响。因此,补习参与引发的负向情绪可能在这部分学生当中更强烈和鲜明。这也说明本研究的结果可能不宜直接推广到所有学生,而是更适用于那些补习参与易受到他人或周遭环境影响的学生群体。不过,工具变量和(加入滞后变量的)OLS回归虽在量上有较大区别,但是从致郁效应的方向和显著性上看并没有质的差别。
为了检验课外补习参与的“致郁效应”是否受到课外补习强度的调节(孙伦轩、唐晶晶,2019;Zheng, et al., 2020),本文将学生的“周末日均补习时长”转化为4个虚拟变量(不补习、0~2小时、2~4小时、4小时以上)。放入后三个虚拟变量(基准组是未参加补习的学生)作为回归方程的核心自变量,生成与之对应的工具变量,进行两阶段最小二乘回归。然后,本研究使用瓦尔德检验(Wald test),原假设为“上述三个虚拟变量对应的系数之间没有显著差异”,卡方统计量显示,这三个系数在p<0.1的水平上并不存在显著差异。我们使用类似的方法将“补习科目数量”转化为5个虚拟变量(未参加补习、只补习1门、补习2门、补习3门、补习4门),并放入后四个虚拟变量(基准组是未参加补习的学生)作为回归方程的核心自变量,其余设定不变。统计结果显示,这四个虚拟变量对应的系数也不存在显著差异。上述结果可在一定程度上说明,补习参与的致郁效应并不明显依补习时长和补习科目的数量发生变化。
总的来看,课外补习参与对中学生的情绪健康具有显著的致郁效应,即参加课外补习会显著增加学生的负向情绪,其效应大致为0.38个负向情绪得分的标准差。此外,补习参与的致郁效应并不明显依补习时长和科目数量而发生变化。
(三) 阶层异质性分析:课外补习使谁抑郁?
本节考察学生的家庭阶层背景对课外补习致郁效应的调节作用。核心问题是,对于不同家庭阶层背景的子女而言,课外补习参与的致郁效应是否存在组间异质性。
本研究按照家庭背景变量的取值将全样本分组,以分组回归的方式考察各组的组内因果效应的显著性差异,而未设置交互项来直接比较各组系数的大小。因果推断研究者范德韦勒(VanderWeele,2015)将基于分组回归系数的显著性比较方法称为“定性交互分析”(qualitative interaction)。定性交互分析的目的并非考察不同群体在致郁效应具体数值上的组间差异是否显著,而是在定性层面上考察致郁效应在哪些子群体中显著存在。
本文使用父母双方的最高受教育程度、父亲现从事的职业类型来划分不同的子群体,然后分组进行回归分析。表 3展示了按照父母最高受教育程度划分的分组回归结果,估计方法和变量选择与总效应分析保持一致,详见表 2中第(4)列的模型设定。将表 3后三列系数进行横向比较可以发现,只有在父母文化程度为初中及以下的子女群体中,补习参与对负向情绪的因果效应系数显著为正。相比之下,父母文化程度为中专或高中、大专及以上的两组子女,参加课外补习对负向情绪的回归系数在p<0.1的水平上并不显著区别于0值。父母文化程度相对较高的子女对课外补习引发的负向情绪表现出心理免疫现象。
类似地,表 4中展示了按照父亲当前从事的职业类型进行分组的回归结果,估计方法和变量选择与表 3保持一致。将表 4中的后五列系数进行比较,只有在较低职业阶层(工人、农业劳动者和城市初级劳动者)中,其子女参与课外补习的致郁效应显著为正。相比之下,在较高职业阶层中(体制内或体制外的管理人员、专业技术人员等),致郁效应的估计值在p<0.1的水平上不显著区别于0值。也就是说,父亲职业阶层较高的子女对课外补习诱发的负向情绪表现出心理免疫现象。
(四) “致郁效应”为何存在阶层分异?
依据理论框架,笔者推测,家长教养方式的阶层分异模式以及与之关联的子女非认知能力(情绪调节能力)的差异可能有助于解释致郁效应为何存在阶层异质性。但是,受数据和变量可及性的限制,本文暂且无法完整验证理论框架的解释力。本研究主要考察了“情绪调节境况”这个具体维度上的阶层分异,进而为前文的理论框架提供支持性证据,仍有待更完善的质性解释和量化检验。
具体来说,我们将研究样本进一步限定为“最近一年参加了课外补习的学生”,发现不同社会阶层的子女在负向情绪调节方面存在与致郁效应类似的组间差异。具体而言,CEPS问卷中有多项问题涉及学生产生负向情绪时,学生及家长的应对状态。主要有以下三方面问题:其一,由受访学生家长作答的“家长主动与子女讨论心事或烦恼的频率”,以及由受访学生作答的“父亲、母亲与自己讨论心事或烦恼的频率”,这三个变量都是三分类的定序变量(从不、偶尔、经常)。上述三个变量在一定程度上反映了家长主动体察子女负向情绪的情况。其二是受访学生对于“出现负向情绪时,自己通常可以很快调整过来”的同意程度,该问题采取的是四分定序测量(从“完全不同意”到“完全同意”),在一定意义上衡量了学生自身的情绪调节能力。其三是受访学生对“出现负向情绪时,可以很快在他人帮助下调整过来”的同意程度,该问题同样采取了四分定序测量方式。这个变量在一定意义上体现了学生自身的情绪调节能力,以及通过他人帮助来调节情绪的难易程度。
本研究将上述五个变量的取值进行加总平均,然后将其转化为均值为0、方差为1的“情绪调节境况的标准化得分”,它综合了家长对子女情绪的主动体察状况以及子女依靠自身或通过他人帮助以实现情绪调节的状况。该变量得分越高,说明情绪调节境况越佳。
本研究用组间均值比较的方式来考察情绪调节境况的阶层差异。表 5按照父母受教育程度分组,报告了最近一年参加了课外补习的学生情绪调节境况的分异模式。第(1)列系数是“家长主动与子女讨论心事、烦恼的频率”的组间比较。第(2)列和第(3)列系数分别展示了各组子女对“自己可以很快调整负向情绪”以及“能在他人帮助下很快调整负向情绪”的同意程度。从趋势上看,父母文化程度越高,子女对这两项陈述的同意程度越高。第(4)列系数是对前三列系数的综合,展示了“情绪调节境况的标准化得分”的组间均值差异。可以看出,子女情绪调节的境况随父母文化程度的上升而不断向好发展。如果父母学历为研究生及以上,子女的情绪调节境况得分比父母文化程度为小学及以下的子女高出近0.6个标准差,比父母文化程度为初中的子女高出约0.4个标准差。表 5最后一行报告了组间均值检验结果。以班级聚类且异方差稳健的F统计量显示,在“家长主动与子女谈心”“在他人帮助下很快能调整负向情绪”及“情绪调节境况的标准化得分”这三个变量上,都存在显著的组间差异(p < 0.01)。而按父母文化程度划分的各组子女虽在“自己能很快调整负向情绪”的同意程度上表现出阶层差异,但并不显著(p=0.13)。
接下来,我们以学生父亲现从事的职业类别作为分组标准,发现在最近一年参加了课外补习的学生当中,各组子女的情绪调节境况也存在类似的分异模式。组间均值比较的结果如表 6所示。总的来说,相较于父亲位于较低职业阶层(例如普通工人、农业劳动者、城市初级劳动者)的子女,父亲处在较高职业阶层(如体制内外的管理人员、专业技术人员)的子女拥有更好的情绪调节境况。例如,父亲为政府机关领导干部的学生“情绪调节境况标准化得分”比父亲为普通工人或农业劳动者的学生高出了约0.45个标准差。此外,表 6的最后一行报告了组间均值检验结果。除了“自己可以很快调整负向情绪”这一变量仅在p < 0.1的水平上边缘显著,其余三个变量均在p < 0.05的水平上存在显著的组间差异。
为进一步验证情绪调节境况的阶层差异是否稳健,本研究进行了以下两个OLS回归。在回归方程中,“情绪调节境况的标准化得分”作为因变量,学生的人口学特征、学期和学校固定效应作为控制变量,父母最高受教育程度和父亲职业类别(处理为多个二值变量)分别作为两个模型的核心自变量。回归结果显示,在控制了学生特征、学期和学校固定效应后,情绪调节境况在不同阶层的子女间仍存在显著差异(联合检验p < 0.05)。
上述结果表明,不仅由补课引发的致郁效应存在组间异质性,不同家庭背景的学生在情绪调节境况方面也存在类似的阶层分异模式。接下来要回答的问题是,情绪调节境况的阶层差异是否能够解释(或影响)致郁效应的阶层差异。这是一个“高维度”的因果推断问题,原因变量是情绪调节境况的阶层差异(而非个体层面的情绪调节境况),结果变量是由补习引发的致郁效应的阶层差异(而非个体层面的负向情绪水平)。针对上述原因变量和结果变量,均只有一个相应的观测值,难以用结果变量对原因变量进行回归来估计出因果效应,因此,我们选择“反事实模拟”的分析框架来回答这一因果问题。
反事实模拟的思路是:对于参加补习的较低阶层的子女而言,假定他们的情绪调节境况变得和较高阶层家庭的子女同样好,其他条件不变,那么(原有的)致郁效应的阶层差异是否也会相应地缩小(或者说,致郁效应的组间异质性是否会相应减弱)?在这个反事实情境中,参加补习的较低阶层家庭的子女与那些较高阶层家庭的子女在情绪调节境况上存在的“事实性”阶层差异不复存在(平均而言)。这时,如果致郁效应在较高与较低阶层子女间(事实上)存在的差异也因情绪调节境况的阶层差异被“反事实地抹平”而相应地缩小甚至消失,那么就可以印证情绪调节的阶层差异在一定程度上能解释致郁效应的阶层差异。
在实证策略上,本研究借鉴了代表性研究使用的反事实分析框架(Liu 2019;VanderWeele 2015),并基于研究情景的特殊性(高维因果推断)进行了相应调整,具体步骤如下:
第一步,使用全样本(6 535人)数据和主效应分析中所用的工具变量回归模型设定,在此基础上引入“情绪调节境况”的一次项、“情绪调节境况”与“补习参与”的交互项。模型设定如下所示,Yi为负向情绪得分,Di为补习参与变量,Mi为情绪调节境况,Xi为控制变量。我们用两阶段最小二乘法估计出“情绪调节境况”与“补习参与”的交互项对应的系数β3,其估计值为-0.384(p < 0.01),“情绪调节境况”所对应的系数β2的估计值为-0.202(p < 0.01)。
第二步,分别在较低阶层子女样本、较高阶层子女样本中进行工具变量回归,模型设定和第一步相同。将这两组子女的情绪调节境况的取值(Mi)设定在各自的样本均值处(表示为和),然后分别估计出这两组子女的“致郁效应”(基于事实情形)。较低阶层的子女“事实上的致郁效应”表示为δLow, act,较高阶层子女“事实上的致郁效应”表示为δHigh,act。进一步计算出较高、较低阶层这两组子女在致郁效应上的事实性差异,记为△actuai。计算方式如下所示:
接下来,将参与了课外补习的较低阶层子女的情绪调节境况“设定”在,即“较高阶层子女的情绪调节境况的均值处”,其他条件不变,重新估计出较低阶层子女的致郁效应,即“反事实的致郁效应”,记为δLow,ct:
用较高阶层子女的“事实上的致郁效应”减去较低阶层子女的“反事实致郁效应”,即可得到两组子女在致郁效应上的反事实差异,记为△counter。
最后,计算致郁效应的“事实差异”与“反事实差异”的差异(简称为“差中差”),它反映了假定(参与补习的)较低阶层子女的情绪调节境况“调整到”与较高阶层子女一样好的水平后,致郁效应的阶层差异缩小的幅度。线性模型设定下,致郁效应的“差中差”可以简单地用下式计算得出:
假定参加了补习的较低阶层子女的情绪调节境况变得与较高阶层子女同样好,保持其他条件不变,将会使较高阶层家庭与较低阶层家庭的子女致郁效应的“事实性差异”缩小(β2+β3)个单位。
接下来,将致郁效应的“差中差”除以致郁效应原有的事实差异,就可以得出致郁效应的阶层差异缩小的百分比大小(差异缩小的幅度)。
本研究考察了父母受教育程度较高和较低两组子女在致郁效应上的阶层差异及其反事实结果,以及父亲职业阶层较高和较低两组子女在致郁效应上的阶层差异及其反事实结果,如表 7所示。表 7第一行系数表示,假若“父母文化程度为初中及以下且参加了补习的子女”的情绪调节境况变得和“父母文化程度为大专及以上的子女”同样好,那么较高与较低阶层子女的致郁效应差异将会(相较事实情形)缩小约42%。第二行将组间比较限定在“父母文化程度为初中”和“父母文化程度为本科及以上”的两组子女,情绪调节境况的反事实模拟显示,致郁效应的阶层差异将会(相较事实情形)缩小约84%。第三行系数表示,假若“父亲职业为普通工人、农业劳动者或城市初级劳动者”的情绪调节境况变得与“父亲职业为管理人员、专业技术人员”的子女一样好,那么较高与较低阶层子女的致郁效应差异将会(相较事实情形)缩小约26%。最后,将组间比较限定在“父亲职业为普通工人”和“父亲职业为管理人员”的两组子女,我们发现情绪调节境况的反事实模拟使致郁效应的阶层差异(相较事实情形)缩小约58%。
上述反事实模拟结果表明,“情绪调节境况”的阶层差异可能在一定程度上影响和解释了致郁效应的阶层差异(组间异质性)。不过,这是一个高维因果问题,我们难以保证情绪调节境况及其阶层差异满足因果推断框架要求的“可忽略性假定”(ignorability assumption)。因此,反事实模拟的结果只能为本文的理论解释提供支持性证据,无法直接和严谨地证明情绪调节的阶层差异对致郁效应的阶层差异具有因果影响,该问题仍有待进一步研究论证。
五、结论与讨论
(一) 结论
课外补习在当下已是全球性的普遍文化现象,伴随着日益激烈的教育竞争,青少年的负向情绪问题持续得到舆论关注,也成为社会科学研究的重要议题。在此现实背景下,本文关注中国大陆中学生课外补习参与和情绪健康状况的因果关系问题。本文基于两期CEPS数据,用工具变量法和滞后变量法化解因果推断中的内生性偏误,首先分析了课外补习对负向情绪得分的总体因果效应;然后使用分组回归的方式考察课外补习的致郁效应可能存在的阶层异质性;最后对致郁效应的阶层异质性进行初步解释和量化检验。主要结论如下:
其一,本文回答了课外补习“是否致郁”的问题。加入滞后变量的OLS回归和工具变量回归结果均显示,参加课外补习会显著增加学生的负向情绪得分。其中,基于工具变量法得到的致郁效应估计值约为0.38个标准差。
其二,在回答了“是否致郁”的基础上,本文探索了课外补习“使谁抑郁”的问题。本研究按照父母最高受教育程度、父亲当前从事的职业类型划分出不同的子群体,使用分组回归进行异质性分析,发现课外补习的致郁效应表现出“劣势—特异”和“优势—免疫”的阶层分异模式。
其三,本文尝试对课外补习致郁效应的阶层异质性做出解释。本研究基于家庭教养方式的理想型和经验发现提出了一个初步的理论框架:在课外补习参与过程中,不同社会阶层的家长对子女负向情绪的应对方式可能有所不同,子女自身的情绪调节能力可能也存在组间差异。我们具体考察了参加补习的学生“情绪调节境况”的阶层分异模式,并采用反事实模拟的方式展示了“情绪调节境况的阶层差异”与“致郁效应的阶层差异”的内在关联,为本文的理论框架提供了支持性的证据,但仍有待进一步的质性解释和量化检验加以完善。
(二) 讨论
本文的发现可能有助于弥合既有研究的经验分歧。其一,就课外补习对负向情绪的总体因果效应而言,补习参与的影响存在“安慰”与“致郁”的分歧。本文通过比较OLS多元回归与工具变量法的TSLS回归结果,认为安慰剂效应值得商榷,它可能是未充分考虑到反向因果问题,导致课外补习的致郁效应受到系统性低估(孙伦轩、唐晶晶,2019)。其二,本文使用工具变量处理内生性问题后,课外补习的致郁效应并未明显受到补习强度的调节。相较于未参与补习的学生,不同时长、不同科目数量的补习参与都会显著增加学生的负向情绪。而有学者认为补习的致郁效应只在补习强度较大的情形下才会凸显(Zheng, et al., 2020)。本研究发现的情绪健康后果所对应的补习参与阈限相比既有研究更低,该发现或更具警示性的政策意涵。
本研究对课外补习致郁效应的阶层异质性分析,有助于我们理解课外补习可能具有的教育与健康不平等后果。本文发现,课外补习引发的负向情绪很可能是较低阶层子女的特异性后果,而较高阶层的子女对此类负向情绪具有较好的心理免疫能力。这可能意味着,即使课外补习参与机会的阶层差异在逐步弥合,课外补习参与结果的不平等仍可能继续。负向情绪的长期累积又将对学生的学业表现、身心发展带来多方面、持续性的不良后果。由此,课外补习可能借助健康不平等的生产,隐秘地维持和延续了现有的教育不平等格局。这为未来的教育分层研究和进一步的“双减”政策落地提供了有益启发。
(三) 局限与进路
本研究仍存在诸多局限。其一,本文并不能完全印证家庭教养方式与课外补习的致郁效应及其阶层分异之间存在因果关联。其二,受数据可及性的限制,本文难以捕捉到课外补习的类型与质量的差别,如培优(enrichment)与补差(remediation)的区分,补习班的班级规模、教师授课水平、补习讲授的内容等。课外补习类型的阶层分异也可能是致郁效应呈现阶层异质性的解释之一。其三,本文在阶层异质性分析中的分组标准还有待改进,主要参考了经典理论的做法,用父母文化程度、职业类型来划分样本以展示课外补习与负向情绪的阶层分异图景。
此外,本文使用分组回归的方式捕捉阶层异质性的做法也值得商榷。即使面对同一份情绪量表,不同家庭背景的子女对量表的主观理解可能存在差异;另外,即使参加质量和数量相同的补习班,不同家庭背景的子女面临的情绪健康问题的来源可能不同。一个可能的猜想是,较高阶层的子女在补习参与过程中或更易产生向上的社会比较或平行比较,并与其父母的“中产焦虑”相互叠加,对自己在补习中取得的进步并不满意,在“内卷”浪潮裹挟下倍感竞争压力;而弱势阶层的子女或受制于家境约束,忧心补习无用、浪费稀缺的家庭经济资源。这样看来,不同家庭背景的子女在情绪健康等主观指标上的可比性仍有待改进。
本研究有两个改进方向:其一是获取信息量更为丰富的全国代表性数据,进而对家庭教养方式、课外补习与负向情绪的因果机制进行更扎实的实证分析;其二是走进田野,观察不同阶层的子女在补习参与过程中的真实境遇与心路历程,探索不同类型的家长帮助其子女化解负向情绪的具体策略及阶层分异的图景,以期充实和发展量化发现,迈向更鲜活饱满又接地气的社会研究。
(注释与参考文献从略,全文详见《社会》杂志2022年第2期)