PNAS论文:近30年来,人类社会的认知扭曲现象激增

2021
08/24

+
分享
评论
学术头条
A-
A+

患有抑郁症的人易于出现适应不良的思维模式,即认知扭曲,从而以一种过度消极和不确切的方式思考自己、世界和未来。这些扭曲现象与个人情绪、行为和语言的显著变化息息相关。


患有抑郁症的人易于出现适应不良的思维模式,即认知扭曲,从而以一种过度消极和不确切的方式思考自己、世界和未来。这些扭曲现象与个人情绪、行为和语言的显著变化息息相关。


近日发表在 PNAS(《美国科学院院报》)的一篇论文 Historical language records reveal a surge of cognitive distortions in recent decades 中,一支研究团队假设,社会集体心理也会发生类似的变化,这些变化反映在语言使用的历史记录中。


他们调查了过去 125 年里超过 1400 多万本书中认知扭曲的文本标记的普遍性,观察到自 20 世纪 80 年代以来,认知扭曲的文本激增,甚至超过了大萧条和两次世界大战期间的水平。


研究结果表明,近年的社会经济变化、新技术和社交媒体可能与认知扭曲的激增有关。

认知扭曲现象


抑郁症是世界范围内造成残疾负担的主因之一。


一些证据表明,在过去几十年里,由抑郁症致使的残疾病例呈现上升趋势,尤其在青年群体中。社会中的人们面临着如战争、政治动荡、经济崩溃、粮食不安全、不平等和疾病等诸多压力源,随着时间的不断推移,整个社会是否会变得或多或少的抑郁呢?


考虑到正式的诊断标准是在 40 年前引入的,这些标准很可能早已发生了变化,所以此问题在较长时间的跨度上很难回答。


抑郁症与明显的、可识别的不良思维模式有关,导致人类处理信息过程的困难,即认知扭曲,个体用不准确和过度消极的方式来思考自己、未来和世界。


例如,当人们用消极的、绝对的术语(例如,“我是一个失败者”)给自己贴上标签时,抑郁症中的认知扭曲就会很容易出现。


他们难以接受 “灰色地带”,可能会用极端的二分法谈论未来的事件 (例如,“我的会议将是一场彻头彻尾的灾难”),或者对别人的心理状态做出毫无根据的假设 (例如,“每个人都会认为我是一个失败者”)。认知扭曲的类型通常会进行一些细化的表现,比如 “灾难化”、“二分法推理”、“否定积极因素”、“情感推理”、“算命”、“贴标签和贴错标签”、“放大和最小化”、“心理过滤”、“读心术”、“过度概括”、“个性化” 和 “应该陈述”。


认知行为疗法 (CBT, Cognitive-Behavioral Therapy) 是治疗抑郁症和其他内化行为障碍的黄金标准,其秉持的观点是,认知扭曲与内化障碍相关,并且有力地映射出环境压力下的消极情感和回避行为模式。而语言与此动态紧密交织。


在本文中,类似于调查患有抑郁症的个体一样,团队利用抑郁症和语言之间的联系来洞察整个社会,观察在集体语言中是否会发生与认知扭曲相关的变化。


这支研究团队分析了在过去 125 年里以英语、西班牙语和德语出版的 1400 多万本书(谷歌图书)中认知扭曲的文本标记的普遍性。


具体来说,团队成员正在研究数百个 n-grams(n=1 到 5)序列的纵向流行度,以标注认知扭曲图式(CDS, Cognitive Distortion Schemata)。


这些图式是由一组 CBT 专家、计算语言学家和母语为双语的人设计的,并由一组 CBT 专家进行外部验证,以捕捉 12 种认知扭曲的表现。


CDS n-grams 被设计成简短、明确、独立的语句,使用高频术语来表达特定认知扭曲类型的核心(如图 1 和 SI 附录,表 S1-S3 所示)。以三元模型(3-gram)举例,“I am a” 语句中捕获了贴标签和贴错标签的认知扭曲,无论其上下文和所涉及的准确标签(“女士”、“可敬的人”、“失败者” 等)是什么。


早期的研究表明,与随机样本相比,这些类似的 n-grams 在抑郁症患者的语言中更为普遍。


为了解释出版物数量的变化,对于每个 CDS n-gram 而言,团队将其在给定年份的普遍性定义为该年份在谷歌图书数据中出现的次数除以出版总量(用句末的标点符号数估算)。所有产生的时间序列都被转换为标准分数(z scores),以提供不同 CDS n-grams 之间相同规模的比较,并与随机选取的相同年份和同一套图书(资料与方法)的 n-grams 的零模型(null model)进行比较。

三种语言的历史文本


团队对三个独特的地理和语言领域进行了分析,分别是:1)美利坚合众国(美式英语)、(2)德语国家德语(3)所有西班牙语国家西班牙语


鉴于英语、西班牙语和德语既有共同之处(相同的字母表、共同的历史背景)又存在明显差异(作为第一语言仅限于特定的区域使用还是横跨几个大洲都作为官方语言),因此研究团队选择上述三者作为分析的焦点。


研究将分析的时间节点限制在 1855 至 2019 年,因为在这 125 年里,所有三种语言都持续保持着高出版量,语法、正字法以及拼写变化对分析的影响几乎可以忽略不计。虽然在特定区域用特定语言发表的书籍并非是整个社会的代表性象征,但可以从数千万本书籍中发现几十年甚至几个世纪以来持续存在的语言趋势。


先前的研究表明,这反映出文化、语言和心理上的变化。


l 英语(美国)、西班牙语和德语的趋势


研究团队首先研究了 1855 年至 2019 年的英语(美国)书籍(N=9,018,119)中一整套英语认知扭曲图式(n = 241)的中位数流行率的历史(图 2-A)。由于这些数据是只适用于在美国出版的书籍,团队成员记录了美国历史上值得注意的事件或时间序列上的显著变化:1899 年的本世纪末;第一次世界大战爆发;1929 年的美国金融大崩溃;第二次世界大战爆发;1968 年 CDS 流行的高峰;1978 年、1999 年和 2007 年的变化趋势明显。


在 20 世纪的大部分时间里,CDS 流行的总体趋势明显地指向 1978 年的历史最低点,只有少数几个显著的峰值,一次发生在 1899 年世纪之交(可能与美西战争有关),一次小高峰出现在 1940 年到 1945 年(大约在第二次世界大战期间),还有一次高峰是在 1968 年(可能与社会和政治动荡有关)。


从 1978 年开始,CDS 的普遍性呈现加速增长趋势。这种加速似乎可以分为三个时期:从 1978 年到 1999 年的加速增长(其中 CDS 的普遍性超过了 1910 年代的水平),1999 年到 2007 年之后实现更快增长,接着是 2007 年之后的加速增长,以及 2010 年可能稳定下来。


所谓的 “互联网泡沫破裂” 似乎与 1999 年后 CDS 普遍性的加速增长同时发生,而自 2007 年以来 CDS 流行率的加速增长似乎与社交媒体的广泛使用和大衰退(Great Recession)的开始同时发生。


目前的 CDS 普遍性比 20 世纪以来观察到的水平高出近两个标准差(1899 年的峰值除外)。



这项分析也将西班牙语视为一种控制语言与英语和德语进行对照,因为它并不局限于特定的地理区域;即,这些数据包括所有西班牙语出版的书籍,包括西班牙(欧洲)和大部分拉丁美洲(N = 1,658,438 本书)。


在整个 20 世纪,西班牙 CDS 标记的普遍性保持相当稳定,在第一次世界大战开始前后略有上升,1929 年出现了一个非常短暂的峰值,之后的近 30 年呈现降低趋势,1953 年作为转折点出现上升态势,之后直到 1984 年水平似乎趋于稳定(图 2-B)。然而,从 1984 年开始,团队观察到与英语相同的曲棍球棒模式(hockey-stick pattern):从 1984 年开始,上升趋势急剧加速,导致目前的 CDS 普遍性超过历史基线一个以上的标准差。这一趋势似乎在 2008 年加速了。


如图 2-C 所示,德语书籍的普遍性为 CDS 标记捕捉人群中重要压力时刻的能力提供了表面有效性,因为它们与德语国家(主要是德国和奥地利)特有的重大历史和地缘政治事件相匹配。区别于英语和西班牙的 CDS,其流行水平在 20 世纪左右相对较低,但自第一次世界大战开始以来急剧上升,在 1920 年和 1923 年达到顶峰,与一战德国的战败和 1923 年的毁灭性经济衰退相一致。在魏玛共和国(Weimar Republic)(1918-1933)的整个存续过程中,可以观察到 CDS 标记水平的下降。


然而,这一趋势在 1932 年被打断,此时认知扭曲水平急剧上升。这一时期面临着重大的社会动荡,经济斗争,魏玛共和国的结束,纳粹政权的出现,以及第二次世界大战的开始。


在二战期间,CDS 的普遍性迅速上升,在德国战败后的 1946 年达到顶峰。随后,CDS 普遍性急剧下降,并在 20 世纪 50 年代至 2007 年期间出现了平稳期,仅在 1962 年达到一个较小的峰值。而在 20 世纪 70 年代或 80 年代,没有任何迹象表明 CDS 普遍性加速,正如观察到的英语和西班牙语。


值得注意的是,在 2007 年全球大衰退开始之际,很明显观察到 CDS 普遍性几乎立即上升到比历史均值还高出近两个标准差的水平。


l 随机选择 n - grams 的零模型


团队根据英语、西班牙语和德语 CDS 普遍性(材料和方法,Bootstrapping 算法)的 95% 置信区间(CI, Confidence Interval),将这三种语言的变化模式与一个由 10,000 组 241 个随机选择的 n - grams 组成的空模型进行比较。这些随机 n-grams 集合是从相应的英语、西班牙语和德语的谷歌语料库中的所有 n-grams 中采样得到的,使得它们具有与相应的 CDS 集相同的 n-grams(n=1 到 5),并且由于时间的推移、出版量的不断增加,最新出版的书籍也具有相同的偏好(材料和方法,空模型)。



图中标注了影响这三个群体的重大历史事件,如 1929 年的金融危机(“华尔街大崩盘”)、两次世界大战和始于 2007 年的大衰退。


近几十年来,英语(美国)、西班牙语和德语的 CDS 普遍性显著超过了这个零模型的水平。


l 不同认知扭曲类型的趋势


如图 4 所示,团队成员依据英语、西班牙语、和德语所划分的 12 种常见认知扭曲类型,绘制了年平均 CDS 普遍性的时间序列。对于所有三种语言和大多数认知扭曲类型,呈现了典型的曲棍球棒效应,即前期 CDS 普遍性水平呈稳定或下降趋势,随后在 1980 年至 2010 年期间飙升至高于历史最高水平,远远高于历史平均值。


唯一的例外是 should 语句,由于其语法结构,很难翻译成与特定认知扭曲相关的独特的 n-grams 序列。对于英语而言,图中可以明显的看到 “倾斜的曲棍球棒” 模式,某些认知扭曲类型的 CDS n-grams 在 20 世纪下降,然后自 1978 年以来迅速飙升。


在算命、过度概括、放大和最小化、读心术、贴标签和贴错标签等方面都是如此,最显著的可能是二分法推理,这深刻的反映出这些扭曲类型可能是导致整个 20 世纪 CDS 普遍性程度下降的原因(图 2-A)。


除此之外,在美国卷入二战期间,灾难化、情感推理和读心术的程度达到了轻微的峰值。然而,对于德语来说,围绕两次世界大战期间的峰值主要表现在二分法推理、算命、贴标签和贴错标签、心理过滤、读心术、过度概括、个性化和应该声明等方面,这可能暗示出两次世界大战对德语使用的广泛影响。



结论


虽然这三种语言之间的差异很有趣,但最重要的一点也许是,在近 30 年来,三种语言的认知扭曲表达都在增加,导致了一种明显的曲棍球棒效应,充分表明了 CDS 普遍性的激增。


对已出版语言的大规模历史记录的可用性可以追溯到几个世纪前,这可能为定量研究重要的文化和语言动态提供了一个独特的机会;同时承认在验证假设和测试基于这些数据的任何观察的因果机制方面存在一定的局限性。


未来的工作可能有助于更好地理解随着时间的推移,社会集体心理的变化是如何被观察到的,以及这些变化是如何通过语言表现出来以应对各种文化和社会经济挑战的,例如从语义词义变化的量化指标来看。

本文由作者自行上传,并且作者对本文图文涉及知识产权负全部责任。如有侵权请及时联系(邮箱:nanxingjun@hmkx.cn
关键词:
认知,普遍性,变化,扭曲,语言

人点赞

收藏

人收藏

打赏

打赏

我有话说

0条评论

0/500

评论字数超出限制

表情
评论

为你推荐

推荐课程


社群

精彩视频

您的申请提交成功

确定 取消
剩余5
×

打赏金额

认可我就打赏我~

1元 5元 10元 20元 50元 其它

打赏

打赏作者

认可我就打赏我~

×

扫描二维码

立即打赏给Ta吧!

温馨提示:仅支持微信支付!