心智工具箱(11):人生标准九

人类变得越来越聪明了吗?在这个牛人辈出的世界,我们该选择什么样的生活方式?

人类变得越来越聪明了吗

1984年11月的一个星期六,一位年已五十的心理学家在新西兰一所高校翻阅数据。他收到同事发来的荷兰两代十八岁少年的智商测验结果。他注意到一个奇怪的现象,虽然是相同的测验,那些1982年的孩子的得分,比1952年的得分高多了。人类是否在变得越来越聪明?这位心理学家好奇地给同行们发了封邮件,问全世界各地的研究者要数据。(当然,那个年代还没今天咱们这么方便。在微博上一吐槽,同行的数据与板砖纷纷来了。)结果令人惊讶。综合来自不同国家的数据,他发现了一个人类智商变迁的小规律:

每年智商提高0.3%左右,每十年提高3到5分左右。每三十年提高十二到二十个点左右。

这就是著名的弗林效应(Flynn effect)。这位心理学家就是弗林(Flynn)。在1987年,弗林将14个国家的不同时期智商数据收集上来,在《心理学公报》(Psychological Bulletin)发表论文《Massive IQ gains in 14 nations: What IQ tests really measure》。

Flynn

恰逢其时,当时是美国关于教育平等与种族主义反思的一个高峰期。另一位心理学家理查德(Richard J. Herrnstein)与合作者1994年出版了一本关于智商的专著:《钟形曲线》。理查德在书中报告了低智商人群容易犯罪与出现各类反社会行为,同时报告了非裔美国人的各项智商测试成绩越来越低于白人与东亚人,美国最低智商人群是一个印第安人保留区等。因此,作者们宣称:1)智商测验测试的特质是可靠的;2)这些特质是由我们的基因决定的,很稳定,难以改变。

对今天的心理学家来说,这样的结论已经属于胡说八道。因为理查德的结论是那么容易推论出另一个结论:白人必然比黑人高明。更不可思议的是,理查德们在书中公开建议:减少外国人移民到美国,以避免降低全国平均智商。

《钟形曲线》一出版,销量过大,关于黑人与白人是否真有先天差异,成为美国当时热门议题。各路人士纷纷上前吐槽,其中有份量的板砖不计其数。[^1] 如畅销书《异类》作者马尔科姆·格拉德威尔就是当年踊跃上场拍砖的年轻小将。APA(美国心理学会)也卷入了这段公案,派遣学术调查组去详细调查心理科学中关于智商与种群等的各类证据。以致笔者在十年前发给同事们的手册《APA心理与教育测验标准》中,还留下了关于这段公案的争议痕迹:

心理测验并不能证明也不应用于证明种族与文化高低

弗林效应在这个公案中,也经常被各路板砖人士拿来引用。与理查德相反的是,弗林本人是一个坚定的种族平等主义者,研究智商的目的也是为了捍卫自己的种族平等观念。毕竟,人类越来越聪明,那么,我们凭什么阻止黑人移民呢?凭什么相信黑人的智商不如白人呢?凭什么不给黑人提供更好的教育环境呢?凭什么不能相信黑人在更好的教育环境之下,智商会提升呢?

解释弗林效应的主要原因,有很多条。除了以往弗林提到的环境改善、生育技术改善、教育与对智商测验的熟悉之外,在他2011年新作《智力是什么?——超越弗林效应》与2012年新作《我们变得越来越聪明了吗?》中,弗林日益相信一种新解释,就是那些1%的由基因带来的智商卓越的人,会主动去寻找更多新鲜刺激、更复杂的多元化工作环境,慢慢地,这些1%的遗传优势扩大为99%的优势,并且遗传给下一代。通过个体指数在个人层面扩大效应,接着通过社会指数继续扩大。

聪明的人越来越聪明、越来越知道自己不聪明、越来越知道如何更聪明、越来越知道不同领域的聪明人在哪里。在互联网时代,进一步加深了鸿沟。如,大批量高智商人群借助github等共创站点,很快明白下一步创作方向。再如少数科学家聚集在一个小众社区,纷纷表示对脏乱差的数据整理流程不满。这个时候,通过努力与参考其他领域的好方法,很快就可以将这个问题彻底解决。解决后,这批人又发现新的问题。在一边发现自己越来越笨的过程中,另一边是整体社群变得越来越智慧。[^2]

标准九

那条历史公案中的“钟形曲线”是什么呢?它就是被高斯、高尔顿等无数人,誉为上帝曲线的正态分布曲线。达尔文表弟高尔顿叹道:“我几乎不曾见过像误差呈正态分布这么激发人们无穷想象的宇宙秩序”。如下图所示:

Bell Curve

[正态分布]的概率密度函数曲线,因为在形状上是个钟形,所以也被称之为钟形曲线;又因为是被高斯首先在数学上证明,因此正态分布也被称之为高斯分布。[^3] 让我们穿越到高斯那个年代。在1809年与高斯一起玩一个非常高明的思想游戏。假设上帝是个苦逼的实验科学家。在造人的时候,他进行了大量实验。这些实验,每次都会出现一些误差。这些误差是如何分布的呢?比如,人类的智商、身高、胆固醇含量等。[^4]

高斯注意到一个现象,无论上帝进行造人实验时,怎么偏差,呆在上帝旁边的宇宙观察者总会发现——一位“好“的人,必然是趋近算术平均值的。那么反过来,我们推导这些误差分布,是不是可以下结论:误差分布的极大似然值必然就是等于算术平均值。当已经明确知道,人类的智商、身高、胆固醇的误差分布的最终走向是算术平均值,那么,反过来推导出正态分布的公式就变得容易了。[^5]

现在继续伴随历史长河,往前穿越,来到第二次世界大战的战场。在这个年代,正是心理学大出彩的年代。其中,美国军队选拔将士,普遍采用心理测验。如何提高心理测验结果的易读性就成为一个实际的需求。首先是美国军方采用标准九体系来表示测验分数。接着,卡特尔等心理学家开始普遍采用标准九或标准十,将人格测验、智商测验的结果解释降级为个位数。其中,除了卡特尔主持开发的人格测验是标准十体系之外,多数心理测验采用的是标准九体系。

什么是[标准九](Stanine)?它是将正态分布曲线划分为九个部分,平均值为5,标准差为2,除了标准一与标准九两级之外,各个分数的范围全部都是半个标准差。如下图所示:

Stanine

这样做的好处是什么呢?首先,它让我们能够更好地理解测验结果,心理学家对普通用户解释时,不再说,你的“宜人性”是68分,而是说你的“宜人性”是7分;不再说,你的智商是115,而是你的智商是7分;用户马上就明白自己处在一个什么样的区间。其次,它让我们更好地整合不同来源的测试结果。作者早年主导开发的心理测验系统,都统一使用标准九或者标准十,在系统中提供了一项心理预警的功能。一般来说,在平均数加减两个标准差以内的是正常群体,在此之外的是需要格外注意的极端值。假设一位孩子的心理健康指标落在极端值范围内,那么,学校辅导者需要格外地注意他/她的情绪波动,以避免危机事件发生。[^6] 最后,它更符合人类是个认知吝啬鬼的习惯。我们难以清晰地认识到智商135、100分的孩子有什么差异?但是,标准九与标准五的孩子区别一目了然。[^7]

社会比较

标准九对我们有什么启发呢?一般来讲,在标准七分(以下简称为标准七)以上的那批人,是极少数,拿到标准八的人只有7%,拿到标准九的人只有4%。但是太多国家的教育,为什么必然是精英导向?让我们不断地与他们比较,努力成他们呢?

事实上,人类进化史长达三百万年,进化出阅读与教育仅仅只有数千年。我们大脑的阅读功能并不是事先就在几十万年前被设计好,而是原本的大脑机制拥有进化出阅读的可能性。伴随阅读,进而进化出整个人类社会的教育制度。所以,今天的阅读与教育就必然受到各类大脑既有的局限。人类教育体制设计的初衷,一方面是为了解放家长时间,使得多数家长有整块不受孩子拖累、充分的白天时间去继续执行从捕猎、繁殖、战争、交易到科研、艺术等各项社会功能,避免年轻一代与年老一代抢同样的时间与同样的地盘(一个有趣的事实,随着社会集体智慧的增加,每一代人受教育时间随着增加,这是避免两代人打架吗:D);另一方面,却是为了通过创造一种社会比较氛围,提供丰富的社会刺激与多变的环境,使得那些聪明的基因,能够保留与变得更聪明,从而推动人类整体的继续进化。[^8]

什么是社会比较?它来自美国社会心理学家费斯廷格的概念。一般划分为:平行比较(与那些与自己差不多的人比较,比如,一个标准五与一个标准五比较);向上比较(与那些比自己强的人比较,比如,一个标准五与一个标准八比较);向下比较(与那些比这些差的人比较,比如,一个标准五与一个标准三比较)。

Social Comparison

人的自尊体系非常有趣。身处标准七的区间,会自认是标准八区间的能力。但一般不会与标准九区间的大牛比较,而是更多与标准八区间进行平行比较。这就是认知偏差中常常提到的过度自信偏差、乐观偏差等。一个极端的变式是心理学家杜宁(Dunning)与克鲁格(Kruger)1999年发现,2000年荣获搞笑诺贝尔奖的杜宁-克鲁格效应(Dunning–Kruger effect)——无能的人从不觉得自己无能,因为他们不具备区分有能力与无能的能力。杜宁们实验发现,那些成绩处于末尾12%水平的人反而认为自己的百分比等级至少应该是67%,也就是身处标准三太久了,反而会认为自己是标准六。与此同时,那些能力更强者却可能反过来低估自己的能力,标准九们常常以为自己是标准七。

如果标准九恰巧处在标准七的社交网络的前三层(还记得邓巴数字那个人际金字塔图吗?),那么,这位标准七会很受打击。很快将自己下移到标准六甚至标准五、标准四。当一个原本能力是标准七的人在标准五区间呆久了,他会变成什么呢?另一个相反的极端是,标准七在标准八区间呆久了。最后降低了对自己的评价。这就是教育心理学史上著名的大鱼小池塘效应(Big-Fish-Little-Pond Effect,简称为BFLPE效应)。心理学家Marsh在1995年进行了一项实验,将两组超常儿童,一组放在超常儿童组成的实验班;一组放在由普通儿童组成的普通班。一年之后,在普通班的超常儿童的学业自我概念显著强于实验班学生。

Big Fish Little Pond Effect

多数遇到良师益友的标准六,比较幸运,他们遇到的标准八区间的牛人或老师们常常具备性格友善,善于做榜样与正面鼓励人这些特质。于是,原本的标准六会慢慢跃迁到标准七乃至标准八区间,如皮格马利翁效应(Pygmalion effect)等。

人的自尊体系会在不同领域反复经历这种跃迁或下降过程。这种反复反复反复的过程,慢慢地将导致一个新的衡量心理健康的指标——韧性(Psychological resilience)。如果说人的心理健康可以用强度与韧性来形容。人的自尊体系多导向强度,相反,韧性却被太多人忽视。那些韧性强的标准六能够意识到,自己在科研这样的领域可能能做到标准七,但是在艺术等领域只能做到标准三。这样,他们的动机强度适中、自尊体系的来回拉扯不会导致情绪崩溃。

韧性差的标准六,不少人会走向一个极端。在每个领域都伪装为标准六甚至标准七标准八。心理不具备这种在不同领域来回拉扯的能力。整个人绷得很紧,表面上看是高自尊高成就动机,一旦在某个领域受到打击。这个打击还被人际网络金字塔前三层的人感知到了,那么,他会脆弱得失去动力,滑向标准四乃至标准二。(参见自我评价维护模型等)。比如,Alicke等人1997年发现个体应对消极的社会比较,会夸大优秀他人的能力,当你是标准七时,你常常不觉得标准八是天才;当你下滑到标准四时,你常常感叹标准八是天才。你会发现,社会上的天才总是那么多。这种现象被称之为“天才效应”(Genius Effect)。

恰当的社会比较促进人类进步。不恰当的社会比较不仅损害心理健康,同样损害人际信任。心理学家将信任分成两种,一种是对事的信任,因为你做了某些事,从而信任你,也就是认知信任;另一种则是对人的信任,自己有多大程度受到他或她的感染,信任或她,也就是情感信任。在一篇2012年的研究报告《两方面的伤害:社会比较如何伤害情感信任和认知信任》(It Hurts Both Ways: How Social Comparisons Harm Affective and Cognitive Trust)中,研究者发现,当人们在进行向上比较时,自己的考试分数比同学更低,他们对同学的情感信任会降低——在类似于“我会向这个人承认我最糟糕的错误”事情上,标准六不倾向于告诉标准七;同样,当人们在进行向下比较时,自己的考试分数比同学更高,他们对同学的认知信任会降低——在类似于“我认为这个人的工作做得很好”这样的事情上,标准七倾向于对标准六说:不。

然而,实验出乎研究者预料的一个结果是,标准六们进行社会比较的次序也有重要作用。当首先进行向上比较再进行向下比较,只会损害情感信任。因为标准六与处在牛人区间的标准八、标准九们比较,此时此刻,向上比较是自己进行的唯一重要的比较,那么,接下来的与标准五们的向下比较就无关紧要了。当首先进行向下比较再进行向上比较,这个时候,标准六们对标准七与标准八们的不信任更少。因为已经在向下比较时,从分数比自己低的那批人获得了情感资源,研究者写道:

“(首先进行)对自己有利的比较,可能会让受试者对随后进行的向上比较的产生的威胁拥有了‘免疫力’。受试者无需非难或疏远分数更高的那个人,因为他们已经知道,自己的表现比另一个同学更好;其结果就是,情感信任就此保留下来。”

理解之后

除了选择不恰当的社会比较标准,比如,与盲人比阅读速度;或者逃避正常的社会比较,比如,故弄玄虚故作清高。我们还有哪些正常的或者积极的选择?

首先是可以选择[人生只要七十分]的态度。

将自己的目标定在标准六、标准七附近的中高区间而非标准八、标准九这样的区间。台湾女黑客Xdite在《人生只有七十分》中写道:

没有人喜欢失败。但花太多时间才做出决策才会导致大失败。经歷越多案子才有一个体悟,你无法用 plan 的 plan 到 100 分,因為这世界无时无刻都在变动,今天这样决定当时也许是 100 分,三天后只剩 80 分,一周后剩 60 分。规划出一个完美 plan 死死的执行,只会撞上冰山沉船。比较好的做法就是有七成把握就做,然后一边做一边修,就可以永远 70+。70 分高不高,非常高。因為很多人作一作就自动 0分了….光用 70 分就可以干掉一堆人了。

这是一种极其符合心理科学原理,避免行为瘫痪的做法。西蒙将其称之为,做【满意的人—— Satisficer】,不要做【追求最优化的人——Maximizer】。多数硕博逃离科研,很大程度上是被标准九们给吓坏了。太多人接受的科研训练,是瞄准世界上的top4%+top7%,却做着更低层次的事情。2012年诺贝尔化学奖得主布莱恩·科比尔卡(Brian Kobilka)加入导师实验室后,两年才发表一篇论文。但不少科研工作者呢?天天看的目标是标准八以上,却不拿出也受环境制约拿不出相应的做事格调与品味。

Satisficer Maximizer Small

其次是与友善的集体智慧创作群体呆在一起。

参与人类智慧的集体进化,这是最简单的让自己变得更智慧的方法。如开放科学、开源软件、开源硬件这样的领域。法国哲学家利奥在《后现代知识》一书中写道:“知识的传播不再是为了培养能够指导民族走向解放的精英,而是为这个系统提供一些能在其体制所要求的实际岗位上合格地完成他们的角色的扮演者。”从此,无论是他所谈的“职业知识分子”还是“技术知识分子”都将不再是精英。奇怪的是,中国每个年代,总有一批类似于余杰这样对八十年代大学生近乎追星的小女孩对偶像般的迷恋一样的人。哪有那么多精英?精英不是标准九,精英更不是能帮助你从标准五跃迁到标准七的智者。 ‘

最后是在与【过去我】的比较基础之上,探索【可能的自我们】。

一般来讲,在标准七以上的那批人,是极少数,拿到标准八的人只有7%,拿到标准九的人只有4%。从小受的教育,却是让我们去与这批人去比较。这怎么可能不导致行为瘫痪?!我们要避开进化带来的社会比较陷阱。在一个智慧加速进化的时代,牛人与牛人、大牛与小牛会非常频繁地短兵相接。很快,会将大量牛人拖下水,走下神坛。在这样的趋势下,一批人觉得标准八不过如此而已,于是继续活在自己小世界,因为自己的社会比较标准已经下放。另一批人,却走上了另一条道路,从诉诸外界的标准改为对自己的要求。如欧洲社会心理学创始人莫斯科维奇所言:

我没有汽车,甚至不会开车。…首先要有一种尺度:某个人占据第一的位置,他就代表进步。您必须接受同样的尺度,尽量靠近第一位,否则您就是落后、欠发达的,等等。接下来,每一种需要都对应一种受到承认和贴好标签的东西:如果您没有这个东西,您的需要就没有满足。多么蹩脚的逻辑!

小结

社会上永远存在着一个“人比人”的问题。我们不会因为自己的愚蠢而悲伤,只会因为比周围的人更蠢而痛苦。

原文首发豆瓣,讨论参见

最新的: