研究说气温越高、成绩越差:结论显而易见的研究,我们为什么要关心,又该关心什么?

最新的一份研究探讨了气温与学习成绩之间的关系,他们发现,气温与学生成绩之间显著负相关。

具体地,研究分析了美国 1,000 万中学生总共 13 年的考试成绩,发现气温上升会导致成绩下降;高温对低收入家庭和少数族裔家庭的学生造成的影响更大。

他们还发现空调的使用几乎可以完全抵消这种不利影响。

听起来这些结论似乎不用做研究我们也知道。我们先试着读一下这篇论文。

热与学习的研究

这份研究,Heat and Learning, 《热与学习》, 是 NBER 的一篇工作论文,由哈佛大学、UCLA、乔治亚州立大学和美国大学理事会(大学入学考试委员会)的研究者共同完成。

NBER,美国国家经济学研究局,创立于 1920 年,大部分经济学研究者都不会陌生,相当多的诺贝尔经济学获得者都是他的成员。

NBER 的工作论文(working paper)在 Google 学术的商业、经济与管理类中 h-5 指数和 h-5 中位数(可以简单理解为引用量)均排第一(截至发稿),大名鼎鼎的 AER、QJE 等经济学期刊都排在后面。不过,要注意,NBER 的工作论文并没有经过同行审议——工作论文,顾名思义,还没有正式发表,文章的质量也要自行判断(理论上任何期刊论文都是),但是大部分 NBER 的工作论文最后都发表在期刊上了

研究者声称能够提供如此明确的依据证实气温升高会导致学习成绩下降,他们的研究是头一份。

他们分析了 2001-2014 年美国 1,000 万参加 PSAT 的中学生的考试成绩、当地温度数据( 1996-2014 年),以及通过问卷得到的学校空调安装和使用情况(占有率),得出了一系列结论。PSAT 是 SAT 预考,相当于国内高考前的模拟考试,主要是 10、11 年级的中学生报名参加,相当于国内高一、高二的学生。

这些数据涵盖的地理范围很广,包括了全美不同气候和温度的地区。研究发现考前一年内在校期间更热的话,学生的成绩就越差。无论在北部还是南部,平均更冷或更热的州,这个结论都成立。

具体地,研究指出,平均而言,在校期间内气温每上升 1 华氏度(约等于 0.56 摄氏度),考生成绩就会下降 1% 。这个影响在气温达到 70 华氏度( 21 摄氏度)时开始显著——你跑一遍数据的话可以看到小星星(**)了;而到了 90 华氏度( 32 摄氏度)及以上,影响程度陡增。简而言之,这种影响不是线性的——越热越影响成绩,热得越厉害对成绩的影响越大。

这是为什么?

他们认为最有可能的原因是,高温影响了教学时间内(在校期间)学习的效率。太热就学不进去,至少在发达经济体是这样——(出于学术严谨)毕竟样本只有美国。这并不是凭空猜测——虽然贴近常识——与其他变量相比,他们发现,平均而言,只有在校期间的气温(准确而言是“热曝露量”, heat exposure )会对学习成绩造成影响(影响 1 ),暑假和周末的气温对成绩的影响(影响 2 )非常小,并且在控制了这部分热曝露量之后,并没有改变影响 1 的程度。

此外,控制了地区经济情况(影响 3 )之后,影响 1 的程度也没有变化,排除了经济情况作为中介变量的可能。这种可能即,不是高温降低了成绩,而是作用于家庭的与高温相关的经济情况影响了学习成绩。同样的逻辑排除了空气污染的影响(影响 4 )。因为排除了这些可能——当然不可能穷尽——进一步支持了高温影响学习效率的推论。

为什么值得关心

不过,对于不同的学生,这种影响的程度是不一样的。研究发现黑人和拉美裔的美国学生(方便起见,简称少数族裔学生)受到高温的影响是白人学生的 3 倍,居住在低收入地区的学生受到的影响是来自高收入地区学生的 2-3 倍。

尽管可能有其他诸多因素会导致上述情况——比如更有钱的学生可以承担补课的费用,但是一种“更简单的解释”是低收入学生,无论在家还是在学校,能够使用空调的几率相比更小。

美国教育获得中的族群差距是受人关注的话题,人们关心的是哪些因素导致了这些差距。

研究认为气温是其中一个因素。基于地理信息的数据(邮编)分析显示,少数族裔学生所经历的气温比白人学生平均高 5 华氏度( 2.78 摄氏度);而气温每增加 1 华氏度造成的成绩下降,少数族裔学生平均比白人学生多 0.002 个标准差。二者相乘,差距是 0.01 个标准差。参加 PSAT 前大概有 10 年的学校教育,如果这些效应是可以累积的,这个差距就是 0.1 个标准差,即气温带来的影响在少数族裔学生身上要多 0.1 个标准差。

为什么少数族裔学生经历的气温平均高 5 华氏度,没有详尽的解释。不过,我们可以看到另两项统计,调查显示少数族裔学生为主的学校的空调占有率,相比白人为主的学校低 3.5% ,这个差距不随地区而变;低收入地区比高收入地区低 5% ,这个差距比冷热地区的差距要大。

来看实际的结果——以 PSAT 成绩数据代表教育获得,数据显示,少数族裔学生的成绩比白人学生平均低 0.8 个标准差。这就意味着,对于美国教育获得中的族群差距,气温这一因素可以解释 1.25% ( 0.01 个标准差)到 12.5% ( 0.1 个标准差)。

这是一种“政策模拟”(policy simulation)——显而易见的结论背后,往往只要再挖一下,还是会看到“让人想一下”的发现,这就是为什么对于这样的研究,有时也值得关心。进一步地,关于具体有哪些可以考虑采取的措施,姑且叫“政策含意”(policy implication),我们稍后再讲。

另一方面,研究发现空调的安装和使用(占有率)“几乎完全”可以抵消高温给成绩带来的影响。最基础的模型显示,在没有空调的学校,升温 1 华氏度,成绩下降 0.0032 个标准差;交互项系数则告诉你,在有空调的学校,这个影响要小 0.0025 个标准差——抵消了 73% ,这是他们说的“几乎完全”的意思。不过,不必吹毛求疵,加入了更多交互项和其他自变量的若干个模型显示的结论与这个模型得出的结论,在“更多空调,更少(高温对成绩的)影响”这点上,方向是一致的,只是程度不同。

到这还不够有说服力,更重要的一步是他们在等式右边加入了“学校空调变化”这一变量,实际是想通过考察额外装了空调的学校,跟 10 年前没装的时候比(只用了 2016 和 2006 这两个时间点的数据),学生的成绩有没有上升,来看这种“抵消效应”是否存在。结论是存在的,而且这一结论不受其他若干可能影响空调占有率因素的影响。意思是说,其他条件不变,仅仅因为学校安装了空调,学生成绩受到高温的影响就会减弱。

这意味着空调占有率的变化更可能是外生的(exogenous),而不是横截面变化(cross-sectional variation)本身带来的。这点很重要(虽然数据的时间节点数量有限,这是缺憾),一些看起来有些糊涂的研究往往对内生性(Endogeneity)的处理不到位。有了以上两段的支持,论文指出,空调能够实质地——至少“部分实质地”——减少高温带来的负面影响。

关心的时候要注意什么

好了,为什么要说这么多,难道不是知道高温会影响学习成绩、空调可以缓解这一问题就可以了吗?从而甚至更进一步,建议相关部门在学校多安空调不就可以了吗?这不就是副标题所谓的“政策含意”了吗?

在解读结论含意,甚至据此作出政策建议之前——不过值得注意的是,NBER 创立之初就设定好的 5 条准则之一就是要刻意回避给出政策建议——对于研究结论的论证过程要特别当心。这解释了为什么我们花了不少篇幅,挑了一些重点来讲从高温与差成绩之间的相关性走到高温(有诸多限定条件的高温)导致差成绩都要经历哪些。这也部分解释了文中诸多让步和定语从句的出现。

从研究到建议,要特别注意两点:1、相关(correlation)不等于因果(causation 或者 causality);2、结论推广的时候需要注意机制(mechanism)的发生过程。

先说第一点,气温越高、成绩越差,按字面意思可以有两种解读:气温与成绩之间有负相关性,或者高的气温导致差的成绩——先不论是直接还是间接导致。现实中,得出前一种解读很容易,只是标准不同;得出后一种解读其实非常困难。一般来讲,得到 causality 会比 causation 相对简单一些,前者不要求直接的因果关系。

在以经验研究为主的社会科学中,这种困难尤其明显。比较理想的得出因和果(cause and effect)的所谓黄金标准是随机对照实验(RCT)或者双盲实验,这在医学中比较常见。但是大量经验研究是对研究发生前就存在的数据做的分析。社会不是实验室,实验室中的变量是相对可控的,不需要在后续做大量的工作来排除一些扰动项,或者厘清它们与你所关心的因变量(比如学习成绩)或自变量(气温)之间的关系。

这在如今“大数据时代”要格外注意,数据以前所未有的方式被收集,无论从量上还是获取方式上——似乎带来一种真相触手可及的幻觉,相关性变得非常更容易得到了——这并不代表对于因果关系的推导变得更容易了,恰恰相反,对因果关系的推断变得更重要了。

将相关与因果混淆是一种常见的归因错误。就像我们在另一篇文章中提到的一样,虽然研究指出聪明的人多 30% 的概率会戴眼镜(准确来说是视力更差),但戴眼镜本身不能让你更聪明。不过,基于这种错误导致的刻板印象却“挺好用的”——一些研究表明,当你戴眼镜的时候,人们还是会倾向于认为你更聪明。

再说第二点,大部分社会科学研究的对象都是人类社会中很小的部分,但通常研究的意图并不会止于讲清楚具体个案,而是寻求某些普遍性的解释。但这几乎不可能,所以见得更多的是扩大研究结论的“场景应用”。推广有一些条件,如果能具体讲清楚因和果之间具体是如何发生的,也就是其中的机制是明晰的,影响的过程是可分解的,那么推广起来会容易一些。

这份研究中支持高温与差成绩之间因果性存在的一个理由是,他们将在校学习期间的气温与周末及节假日的气温对成绩的影响做了比较,发现后者的影响极小(见第一小标题段段末)。这才较为有力地支持了他们给出的机制解释:高温影响了学习效率,从而导致了更差的成绩。

因此,以这份研究做依据向学校要求在宿舍安空调的时候,要注意强调你在宿舍中的学习时间对你整个成绩的影响是显著的,换种说法——虽然意思已经变了——你在宿舍的时间也有相当部分拿来学习。这样,推广上述研究结论的时候会更站得住脚一些。这也是一种“政策模拟”的具体应用了。

政策含意

注意了这些问题,再说回政策含意。

虽然 NBER 追求中立,避免给政策建议,但政策制定者显然也是它的读者之一

在这份研究中,作者们计算了安装空调可以带来的收益(学习成绩的提升)和安装、使用空调的成本,认为这是件值得做的事情。同时,他们想得更远,在全球变暖的趋势下,气温对学习成绩的影响,总体而言会更大。安装和使用空调,经他们的计算,对于少数族裔和低收入学生而言,效益更大。

到了这一步,在第二个小标题段段首的发现——不同的学生受到的影响不同,就有了实际的政策含意了,剩下的只是(在更多元的研究基础上)具体采取什么方式来做:比如是否要增加针对这些学生为主的学校的空调补贴,比如是否要继续改善学生的构成比例等——这些都不是论文中提出来的。

除此之外,在前文关于教育获得的族群差异那一节(第二个小标题段)中,其实还有更多引申出来的话题。比如关于在少数族裔学生身上发生的高温的 10 年累积效应。在美国实行了 40 多年的平权法案(AA)在教育领域的实践有颇多争议,除了“逆向歧视”的批评之外,对于平权应当在教育的哪个阶段来做也是热门话题。不止美国,牛津大学在去年底的尝试——将数学考试延长 15 分钟,但对提高女生成绩没啥帮助——也被视为无奈之举。也许更该做的平权尝试是在大学之前的中学和小学,理由就是那 1.25% – 12.5% 的累积效应。

一份好的研究常常会有政策含意。

再比如我们另一篇关于流动儿童上学的文章中提到,上海财经大学的两位研究者在《学校类型与流动儿童的教育》一文( 2014 年)中指出,学校类型是导致流动儿童学习成绩差的一个主要原因。控制了家庭和学生个人因素,同时通过工具变量处理学校选择的内生性问题之后(“内生性”这个词又出现了一遍),他们发现学校的类型对成绩更差的学生影响更大。此外,他们指出,上海市最近几年对民工子弟小学的改制——只是改变了一下学校的类型,具体可见上述报道——已经显著改善了不同户籍学生之间的差距。现在好像又改回去了。

这篇论文发在《经济学(季刊)》上,这本刊物由北京大学经济研究中心(CCER,也叫国家发展研究院)主办。CCER 与 NBER 从 1998 年开始每年联合举办一次中国经济年会。

不过,一般而言,政策制定者对于具体的机制并不感兴趣,不知道这是好事还是坏事。

题图 / Giphy

我们做了一个壁纸应用,给你的手机加点好奇心。去 App 商店搜 好奇怪 下载吧。