自然、经济与心理健康:从历史语言模式中获得的预测性见解

时间:2026年5月18日
来源:Journal of Environmental Psychology

编辑推荐:

**米尔兹·理查森** **英国德比大学** **摘要** 本研究利用1800年至2020年的Google nGram历史词频数据,对心理健康讨论中的长期文化趋势进行了建模,将语言视为社会压力的代理指标。研究结合了网格搜索和梯度下降的混合优化方法,模型化了包括经济环

广告
   X   

**米尔兹·理查森**
**英国德比大学**

**摘要**
本研究利用1800年至2020年的Google nGram历史词频数据,对心理健康讨论中的长期文化趋势进行了建模,将语言视为社会压力的代理指标。研究结合了网格搜索和梯度下降的混合优化方法,模型化了包括经济环境、城市化、技术、教育、社会平等、环境压力、以人为本的价值观以及人与自然关系在内的八种社会文化决定因素。语言代理指标的验证显示其与心理健康负担的历史指标具有高度的计量等价性(护理病例的r=0.88,RMSE=0.175;住院治疗和心理健康伤残社会保障申请的r=0.99,RMSE=0.062),这一点得到了Bland-Altman一致性分析误差指标的支持。社会文化因素模型对目标心理健康趋势的拟合度很高(RMSE=0.025),而且消融测试进一步确认了包含以人为本的价值观和人与自然关系的重要性,这些因素超出了更传统的决定因素。滚动交叉验证证实了该模型的时间 robustness(RMSE=0.029)。外部验证表明该模型在语言数据之外也具有很强的泛化能力,能够准确预测美国的历史心理健康社会保障趋势(r=0.974,RMSE=0.115),从而强化了社会文化决定因素的解释力。情景预测表明,恢复人与自然的关系可以显著减少与心理健康相关的讨论。研究结果表明,心理健康的结构基础似乎在于为个人和自然创造良好的经济条件,这为上游政策干预提供了一个系统化的视角。

**1. 引言**
心理健康是一个全球性议题,有证据表明各社会的心理健康问题普遍性和负担都在上升(Richter等,2019)。尽管关于其规模和趋势的争论仍在持续(Baxter等,2014;Richter等,2019),但共识是心理健康状况受到结构和文化因素的复杂相互作用的影响。这些因素包括经济发展、教育、城市化、技术变革、社会排斥以及物理环境(Alon等,2024;McAllister等,2018;Tao & Yang,2025)。然而,尽管研究范围不断扩大,但一个人类经验的根本方面——人与自然的关系——在心理健康的结构解释中仍然基本被忽视,尤其是在西方背景下。
例如,美国精神病学协会关于心理健康社会决定因素的工作组(American Psychiatric Association,2022)几乎没有提及自然。这种遗漏反映了西方医学中生物医学模型的主导地位,后者倾向于将健康视为个体对生物规范的偏离,而不是将其视为生态系统内嵌的结果(Stevens,2010)。即使是在更广泛的生物心理社会模型中,虽然承认身心联系,但也往往未能将自然环境纳入心理健康决定因素的考量范围。
本研究通过建模宏观因素对心理健康讨论随时间的影响,来解决自然在心理健康结构解释中代表性不足的问题。基于文化语料库中的历史词频数据,本研究并不将语言趋势直接视为患病率的衡量标准,而是基于证据认为词频可以近似表示人们的主观重要性和社会关注度,从而作为心理健康及其结构决定因素的文化显著性的代理指标。尽管患病率确实是文化显著性的一个因素,但本研究还评估了社会文化决定因素是否能够预测社会保障申请等制度指标,从而对模型的泛化能力进行了严格测试。后续部分介绍了幸福感的替代模型,解释了选择社会决定因素的理由,并探讨了语言模式如何反映社会压力。引言部分随后转向了实证对比和历史趋势——区分了全球和西方的发展轨迹——然后重点讨论了人与自然的关系及其对心理健康的影响。这些基础为研究的核心问题奠定了基础,即探讨心理健康讨论趋势的驱动因素以及建模未来趋势的潜力。

**1.1. 重构健康:整体健康(One Health)模型**
整体健康等整体模型已经出现,认识到人类福祉与地球健康密不可分(Rabinowitz等,2018)。这些框架强调了从分子到行星层面环境、动物和人类健康之间的相互关联(Stevens,2010)。这些互动塑造了我们的认知和福祉,但主导模型仍然将“自我”和“环境”视为独立的实体。如果这些模型得到广泛采纳,它们将有助于统一健康和环境政策,促进对生物多样性的尊重,并培养更可持续的未来。

**1.2. 语言作为心理健康决定因素的镜子**
语言等文化产品为考察心理健康的结构决定因素提供了宝贵的视角。历史语料库中的词频趋势虽然不是患病率的直接衡量标准,但可以作为社会压力和文化框架的代理指标。语言随着生活经验的演变而发展,词使用的变化往往反映了潜在的社会经济条件。例如,基于“never”和“always”等绝对主义词汇频率的绝对思维指数(ATI)与人口层面的抑郁情绪有很强的相关性(Adam-Troian等,2022)。研究表明,语言使用的激增常常与社会文化事件同时发生。例如,2010年至2021年的Twitter数据显示,“mental health”一词的提及次数增加了近100倍,这主要是由于疫情、大规模枪击事件和意识宣传活动(Stupinski等,2022)所推动的。此外,自然语言处理分析证实,临床笔记和在线文本中的词汇趋势可以提取出贫困和歧视等健康的社会决定因素,并将其与患病率联系起来(Scherbakov等,2025)。进一步分析谷歌趋势中的心理健康词汇使用情况发现其与已知的环境风险因素相关,表明这种分析方法可用于绘制患病率地图(Wang等,2022)。重要的是,像Google Books Ngram这样的聚合语料库反映了宏观层面的文化讨论,补充了个体层面的数据。书中越来越多地提及心理健康问题表明了规范的变化,并可能影响人们表达痛苦或寻求帮助的方式(Teepe等,2023)。历史分析表明,心理健康讨论长期以来反映了社会焦虑,Baumeister等(2012)指出19世纪机构化的趋势。这些语言变化为我们提供了观察塑造心理健康的社会动态的窗口。

**1.3. 心理健康患病率的趋势:全球与英语圈的视角**
全球范围内的患病率研究结果不一。Wu等(2023)报告称,虽然年龄标准化的负担有所下降,但新病例和死亡人数却在增加,并预计将继续上升。Moreno-Agostino等(2021)发现抑郁症呈上升趋势,但这一趋势并未完全由研究设计或发表偏倚解释。然而,其他研究对“流行病”这一说法提出了质疑。Baxter等(2014)认为,感知到的增长是由人口增长和更宽泛的痛苦定义所驱动的。Richter等(2019)只发现了轻微的增长,主要归因于人口变化。来自英语圈西方背景的证据显示出更为一致的上升趋势。Botha等(2023)发现了队列效应,发现1980年代和1990年代出生的人群心理健康状况恶化最为明显。Prince(2015)和Mojtabai与Jarm(2015)记录了大学咨询服务需求的增加和严重性的提升。2008年至2018年的美国谷歌趋势数据显示抑郁症患病率增加了61%(Wang等,2022)。最近,美国儿科学会宣布儿童和青少年心理健康状况处于国家紧急状态(Shim等,2022)。有证据表明,20世纪90年代初至21世纪初,西方青少年的心理健康问题急剧增加(Twenge,2011)。从更长的时间尺度来看,自1955年以来,因精神疾病而“残疾”的美国人增加了五倍,这一趋势通过住院治疗和社会保障支付得到证实,自1987年以来更是翻了一番(Whitaker,2005)。这反映了过去50年中焦虑和抑郁词汇提及次数的增加(Teepe等,2023)。

**1.4. 心理健康的社会决定因素**
除了人与自然的关系外,本研究还关注系统评价和元分析中确定的与心理健康结果相关的宏观社会文化因素(Alon等,2024;Tao & Yang,2025):
- **经济环境**:经济不安全、失业和贫困与较高的抑郁和焦虑率密切相关。相反,繁荣状态(如北欧国家)会带来更好的心理健康结果(Huggard,2003;McAllister等,2018)。
- **社会平等**:歧视、种族主义和社会排斥是导致心理健康状况不佳的主要因素(Huggard,2003)。
- **城市化**:快速的城市化导致接触自然的机会减少、社会孤立的增加以及环境压力的增加。尽管研究较少,但城市化越来越多地被认为对心理健康问题有贡献(Pienkowski等,2024)。
- **技术**:数字媒体和社交网络的崛起改变了社交互动,尤其是在青少年中。虽然一些研究将技术使用与焦虑和抑郁的增加联系起来,但证据仍然存在分歧(Teepe等,2023)。
- **教育**:教育水平通常具有保护作用,但获取和教育质量的差异可能会加剧心理健康不平等。教育还影响人们对心理健康的认知和讨论(Infurna,2021;Tao & Yang,2025)。
- **环境**:暴露于污染、气候变化和自然灾害与心理压力和创伤后应激障碍(PTSD)的增加有关(Tota等,2024)。
- 第七个因素是以人为本的价值观,在西方背景下尤为重要。英语圈和西方社会变得越来越个体主义,其价值观和信念优先考虑个人自主性和自我利益,这是影响心理健康的重要方面(Humphrey & Bliuc,2021;Scott等,2004)。

**1.5. 额外因素:人与自然的关系与心理健康**
越来越多的证据支持自然接触与改善心理健康之间的联系(Bratman等,2019)。纵向研究表明,定期接触自然可以减少抑郁和焦虑(Alcock等,2014)。心理学理论提供了强有力的证据,表明接触自然有助于支持心理健康,尤其是在减轻压力、认知恢复和最近的情绪调节方面(Ríos-Rodríguez等,2024)。这些基于自然接触的研究一致表明,与自然环境的互动与情绪改善、压力调节和幸福感的提升有关。然而,这些研究对于人与自然关系作为长期社会决定因素的作用机制提供了有限的见解。此外,这些效应不仅限于短暂的接触。越来越多的研究表明,对自然的偏好可以独立于接触程度带来额外的心理健康益处(White等,2019;Passmore, Sabine, & Yang, 2025b)。这种关系导向通常被概念化为自然连通性,它超越了情境性接触,反映了人们如何随着时间的推移感知、重视和参与自然。自然连通性,即作为自然一部分的心理感受,正在成为心理健康和幸福感的重要因素。元分析证实,自然连通性与幸福感呈正相关(Pritchard等,2019),其影响力超过了社会经济地位等公认的基准因素(Martin等,2020)。回到自然接触的话题,与自然联系较强的人从绿地访问中获得的益处更大,而联系较弱的人获得的心理收益较少(Chang等,2024)。最后,旨在增加城市居民与自然联系的干预措施为有心理健康问题的人带来了临床显著的改善(McEwan等,2019a)。
在本研究中,自然连通性并未在个体层面进行测量;而是使用与自然相关的词频作为人与自然关系历史模式的代理指标。通过这种方式构建人与自然的关系,研究可以从接触的短期效应转向更全面地理解与自然的持久关系如何影响个体和社会层面的幸福感。这种框架与社会生态视角一致,强调了环境体验如何随着时间受到社会、文化和经济背景的影响。本研究采用这种宏观视角来探讨人与自然关系的长期变化如何与历史时期的心理健康讨论相一致。

**1.6. 研究问题**
本研究旨在探索人与自然的关系以及其他宏观因素在塑造心理健康文化表达中的作用。利用1800年至2020年的英语语料库中的词频数据(主要反映英语圈的文化输出),研究了八种社会文化因素对心理健康讨论的影响,如上所述,这些因素可以与患病率相关联。这种方法允许探索长期的文化动态以及社会变迁与心理健康之间的相互作用。研究结果应被视为反映了英语文化话语中的趋势,而不是代表所有西方或全球人口的情况。具体来说,该研究探讨了以下问题:1. 词频数据能否作为心理健康普遍性的有效替代指标?2. 哪些社会经济宏观因素最能解释自1800年以来关于心理健康的参考趋势?3. 是否可以基于这些因素来预测未来心理健康的趋势?通过回答这些问题,本研究旨在促进对心理健康的更全面理解,认识到人类福祉嵌入在社会文化和生态系统中的本质。

2. 方法
2.1. 概述
为了研究不同时期心理健康的文化显著性,研究人员开发了一个预测性加权线性组合模型。目标变量来源于1800年至2019年间Google Ngram语料库中与心理健康相关的术语的频率。使用相同的方法生成了八个宏观因素的分数,每个因素通过主成分分析(PCA)验证的文化共鸣术语群来表示。该模型首先计算这些基于理论的宏观因素分数的加权和,然后通过缩放和反转步骤使预测结果与人类-自然关系的观察趋势保持一致。理论为选择自变量提供了最坚实的基础,而解释性研究通常是预测最有力的手段——“如果我们能够根据某种解释成功地做出预测,那么我们有充分的理由,也许是最好的理由来接受这种解释”(Kaplan, 1964, p. 350)。因此,目标不是孤立地分析因果关系,而是测试一个理论上的因素组合是否能够成功预测观察到的趋势。这种以预测为导向的方法与心理学中日益增长的方法论观点一致,这些观点强调机器学习方法在提高预测准确性、鲁棒性和泛化能力方面的价值(Kovač et al., 2024; Yarkoni & Westfall, 2017)。在这一原则指导下,参数优化采用了两阶段策略:首先通过详尽的网格搜索来确定最小化均方根误差(RMSE)的权重组合,然后通过梯度下降来 refinement 这些估计值。这种混合方法在机器学习中广泛应用,确保了误差最小化的鲁棒性,并通过在迭代微调之前系统地探索参数空间来提高泛化能力。

2.2. 心理健康趋势构建
从当代和历史文献中编制了一份包含102个与心理健康相关的术语的清单,这些文献涵盖了精神病学术语及其文化框架的演变(Bolinger, 2021; Fryxell, 2019; Gkotsis et al., 2016; Kendler, 2020; Parry, 2014; Půlkrabová, 2023; Reaume, 2002; Tuke, 1892; Zović, 2024)。词频数据来自Google Ngram Viewer英语语料库,该语料库提供了根据语料库规模调整后的相对频率值。Google Ngram为每个术语提供了标准化相对频率,表示为给定年份中所有单词的比例。因此,这些数据不受出版物绝对数量或数字化单词总数的影响。尽管Google Ngram数据在提供跨时间文化的洞察方面具有独特优势,但也存在一些局限性,因此采用了使用词群和因子分析等改进可靠性的方法(Juola, 2013; Kestler, 2024, pp. 1–14; Younes & Reips, 2019)。尽管存在某些局限性,Google Ngram仍然是历史研究的宝贵资源(Younes & Reips, 2019),并且已被成功应用于心理健康话语的研究(Teepe et al., 2023)。其庞大的规模有助于消除噪声和平滑异常,使其非常适合识别长期文化模式。很少有其他语料库能够提供跨越两个世纪、涵盖多种体裁的连续数据集,从而提供独特广泛的语言趋势视角。为了确保概念的一致性,采用了主成分分析(PCA)来验证术语群。保留了负载量高于0.7的34个心理健康术语。这种方法揭示了词使用的潜在结构,确认选定的术语在历史语言中形成了有意义的组合。通过依赖经验性聚类而非固定定义,PCA增强了构念的有效性并减少了术语选择中的主观偏差。所得到的拟合结果表明,所选词汇可靠地捕捉了其预期的概念,为后续建模奠定了坚实的基础。这些程序还有助于解决Google Ngram数据的已知局限性(Juola, 2013; Younes & Reips, 2019)。使用经过验证的术语群而不是单个词汇可以减少噪声或特定术语轨迹的影响,后者可能会扭曲Ngram频率中的长期模式。基于PCA的细化还通过仅保留那些在整个时间序列中使用模式一致性的术语来减轻时间词汇漂移,过滤掉可能破坏长期趋势的特异性或时代特定词汇。此外,由于心理健康指数是通过对整个历史时期进行PCA得到的,因此它反映了心理健康语言的连贯长期模式,而不仅仅是某个诊断系统或专业时代的扩展。最终的心理健康指数是通过汇总每个历史时期中经过验证的术语的标准频率,并将这些特定时期的成分合并为一个涵盖整个时期的连续指数来构建的。这一过程确保了没有单一时代的术语在指数中占主导地位,同时保留了心理健康话语的长期趋势。从1810年开始,以20年为一个间隔进行了五年平均平滑处理(例如,1820年、1840年……2020年),以减少峰值并增强时间稳定性。平滑方法还减轻了由数字化伪影、出版物数量变化或特定类型文献的波动引起的短期异常,这些都是基于Ngram分析的已知局限性。由于底层的Ngram值是标准化频率,这些趋势反映了文化显著性的变化,而不是语料库规模或出版物数量的变化。所得到的指数反映了文化中对心理疾病的参考,表明了普遍性、意识或社会关注度的混合情况。图1显示了五个时期的词频趋势、各时期得分的平均值以及所有术语的平均值。这说明了所有时期词汇频率的上升,同时控制了任何现代效应。

2.3. 语言替代指标验证
为了评估词频作为心理健康负担替代指标的测量等效性,使用了历史指标进行验证。选择了一个与词汇的时间范围一致的长久存在的英语圈制度指标进行外部验证。该指标包括美国患者的医疗就诊次数、住院率和社会保障申领情况(Whitaker, 2005)。后者通过美国社会保障管理局(SSA)关于补充安全收入和社会保障残疾保险受益人的年度统计报告更新至2020年(Social Security Administration, 2011a, 2011b; 2021a; 2021b),以及美国人口普查局(U.S. Census Bureau, 2021)的人口数据。这两个数据集都被缩放以便于比较。验证包括三个步骤:(i) 计算词频与每个指标之间的皮尔逊相关系数以评估关联度,(ii) 检查残差图以识别系统性偏差,(iii) 生成Bland-Altman图以评估一致性并确定一致性范围。Bland-Altman和相关系数等一致性指标被广泛推荐用于评估替代指标和标准指标之间的测量等效性(Giavarina, 2015)。这种多方法确保了文化话语趋势与心理健康负担的实证指标之间的稳健评估。这一外部验证步骤直接解决了Ngram数据的另一个局限性,证明了语言趋势与独立的历史指标高度吻合,从而减少了观察到的模式反映的是语料库伪影而非有意义的社会文化信号的风险。

2.4. 因子表示和替代指标构建
使用语义扩展和专家策划(如当代和历史英语词典)为每个宏观因素构建了词群。对于这种类型的建模来说,全面的词汇覆盖既不是必需的也不是最优的;正如基于Ngram的研究所建议的(例如,Juola, 2013; Younes & Reips, 2019),简洁且经过实证验证的词群比大型、异质性的列表提供了更可靠的长期信号。如上所述,使用PCA来验证每个因素的连贯性;仅保留负载量大于0.7的术语。在为八个因素选择的257个词中,经过PCA处理后保留了112个。因子分数是通过汇总经过验证的术语的标准频率计算得出的。这种方法表明,词频是衡量人类-自然关系长期趋势的有效替代指标(Richardson, 2025, 2026; Richardson & Richardson, 2026)。词汇列表故意包含了广泛、描述性和体验性的术语,这些术语捕捉了自然的元素和感官方面(例如,河流、花朵、苔藓),而不是技术性的、特定物种的或分类学的术语,后者可能反映识别实践或人口趋势,而非与自然世界的质性关系。

2.5. 宏观因素和PCA选择后的词群
1. 经济环境:失业、资本主义、经济、金融、衰退、福利、通货膨胀、收入、货币、财政、低迷、繁荣、赤字、刺激、市场、增长
2. 城市化:城市、城市景观、住房、基础设施、分区、扩张、密度、发展、城市化、高层建筑
3. 技术:机制、创新、设备、广播、电视、计算、晶体管、软件、数字、人工智能、社交媒体、技术、数据
4. 以人为中心的价值观:自主权、伦理、世俗主义、理性主义、人权、个人主义、宽容、民主、包容、多样性、赋权、自我表达、人文主义、利己主义
5. 人类-自然关系:叶子、花蕾、露水、苔藓、山脉、草地、自然、沼泽、湖泊、河流、花朵、小树林、树木、海岸、山丘、树皮、树枝、喙、岸边、花朵、小溪、树林、山谷、灌木丛、蕨类植物、开花
6. 环境压力:污染、山体滑坡、烟雾、野火、污染、自然灾害、全球变暖、可持续性、生态危机
7. 社会公平:排斥、性别歧视、民权、隔离、种族主义、女权主义、社会排斥、激进主义
8. 教育:大学、课程、读写能力、教学法、课堂、学术研究、教育体系、终身学习

由于术语选择和PCA验证是基于英语使用情况,因此所得到的因素结构可能反映了特定文化的模式,特别是与英语圈话语相关的模式。

2.6. 建模方法
使用结合网格搜索和梯度下降的混合方法,在两个主要步骤中对八个宏观因素分数与心理健康话语和心理健康目标变量之间的关系进行了建模。
步骤1:加权求和
每个时间点(t)的因子分数(Fi)乘以相应的权重(Wi),形成中间和:
FactorInfluenceScore(FIS) = ∑i=18WiFi,t
步骤2:缩放和反转
为了匹配观察到的心理健康趋势的方向和范围,将中间和除以5并减去0.75进行反转:
PredictedMentalHealth = 0.75 − (FIS / 5)
这种转换确保了预测值与随时间变化的自然词汇使用趋势相符。反转反映了这样的假设:增强人类-自然关系与减少对心理健康问题的参考有关。

2.7. 优化策略
为了确定最佳权重,采用了一种混合优化策略。该过程从详尽的网格搜索开始,系统地评估预定义参数空间内八个因素的所有权重组合,每个候选模型都使用在11个时间平滑观测值上计算的RMSE进行评估。由于研究的探索性质以及缺乏关于因素贡献的先前纵向研究,选择了这种方法。网格搜索具有灵活性,不需要对线性假设的超出加法框架的要求,并且在机器学习中因其能够通过全面参数探索来优化模型性能而得到广泛认可。在这种详尽搜索之后,使用梯度下降进一步细化权重,这是一种通过跟踪损失函数的梯度来迭代调整参数的机器学习优化技术。这种结合全局探索与局部微调的混合方法通常用于时间序列预测,以提高效率和准确性(Uyeh et al., 2022; Jun et al., 2024)。这种迭代过程确保了最终权重能够最佳地适应历史趋势,改进了初始网格搜索解决方案,并进一步降低了RMSE(Bishop & Bishop, 2023)。

2.8. 验证和评估
使用均方根误差(RMSE)和预测值与观测值之间的平均绝对差异(MAD)来评估模型性能。分析了残差以确定系统性偏差,并计算了决定系数(R2)以量化解释的方差。使用7-4和8-3 split的滚动交叉验证来评估时间泛化能力,即在早期时间点训练模型并在后期时间点进行测试。这种方法保持了时间顺序的完整性,并模拟了现实世界的预测条件。

2.8. 去除测试
为了评估各个维度的影响,进行了去除测试,比较了包含更确立的心理健康话语决定因素的完整模型和简化模型。该消融模型排除了人与自然的关系以及以人类为中心的价值观,仅保留了技术、城市化、经济环境、环境、社会公平和教育这四个因素。两个模型都通过网格搜索进行了优化,以最小化预测与观察到的心理健康术语普及率随时间变化的均方根误差(RMSE)。2.9 外部验证为了评估模型的预测性能和泛化能力,使用历史上的心理健康住院数据和社会保障指标作为目标变量进行了外部验证(Whitaker, 2005)。提取了八个宏观社会文化因素——人与自然的关系、技术、人文主义、城市化、经济环境、环境、社会公平和教育——针对五个关键年份(1850年、1903年、1955年、1987年和2003年)进行了分析。社会保障指标值被缩放到最大值1,以确保与词频数据的0到1范围可比。之前基于词频数据优化的模型权重被应用于这些因素得分,通过线性转换生成了预测的社会保障值。截距项保持不变,但缩放项进行了调整(从5调整到6.5),以使预测值保持在0到1的范围内。模型性能通过均方根误差(RMSE)和平均绝对误差(MAE)以及皮尔逊相关性(Pearson correlation)进行评估,这些指标推荐用于时间序列情境中的预测准确性和一致性评估(Chai & Draxler, 2014; Willmott & Matsuura, 2005)。此次外部验证的目的是为了预测泛化能力,而非因果关系识别;所有模型参数在验证前就已固定,且没有使用机构数据来优化或调整模型。2.10 未来情景为了探索心理健康的未来趋势,使用从2025年外推的宏观因素值扩展了预测模型。因素得分是根据1970年至2020年的观察轨迹外推到2050年的。模型假设这些因素与心理健康之间的历史关系,通过优化的权重得以保持稳定。构建了四种情景:1. 基线(趋势延续):环境和技术的持续增长,以人类为中心的价值观、城市化以及教育的适度增长;经济环境、社会公平和人与自然的关系没有变化。2. 经济提振:对经济环境给予重点关注;其他所有因素保持趋势不变。3. 以人类为中心的价值观下降:以人类为中心的价值观下降;其他所有因素保持趋势不变。4. 恢复人与自然的关系:人与自然的关系得到改善;其他所有因素保持趋势不变。使用梯度下降优化的权重对外推因素值进行了计算,得出了每个情景下的预测心理健康得分。3. 结果基于词频的因素和人与自然关系的趋势如图2所示。这突显了大多数因素的上升,而人与自然的关系则有所下降。下载:下载高分辨率图像(437KB)下载:下载全尺寸图像图2. 基于词频的因素和人与自然关系的趋势。3.1 词频数据是否是心理健康普及率的有效代理?语言代理验证:如图3所示,词频与现实世界指标有着非常强的一致性。皮尔逊相关性很高:患者护理事件的相关性为r = 0.88,住院和心理健康残疾社会保障索赔的相关性为r = 0.99(Whitaker, 2005)。度量指标表明词频数据与患者护理事件之间的拟合度相当(均方根误差 = 0.175,平均绝对误差 = 0.153)。对于住院和心理健康残疾社会保障索赔的拟合度更好(均方根误差 = 0.062,平均绝对误差 = 0.033)。图4显示残差通常很小且聚集在零附近,表明词频与实证指标之间有很强的一致性。布兰德-阿尔特曼图(Bland-Altman plots)显示两种比较的平均差异很小,一致性范围也较窄,支持了语言代理的有效性。总体而言,这些结果增强了使用词频作为社会心理健康负担代理的信心,同时也指出偶尔的历史差异可能反映了结构上的滞后反应。下载:下载高分辨率图像(279KB)下载:下载全尺寸图像图3. 词频与现实世界普及率指标的趋势。下载:下载高分辨率图像(335KB)下载:下载全尺寸图像图4. 残差和布兰德-阿尔特曼图。3.2 哪些社会经济宏观因素最能解释自1800年以来对心理健康的提及趋势?从网格搜索和梯度下降得到的因素权重见表1。网格搜索得到的最佳权重使得RMSE为0.0248,MAD为0.0204。梯度下降优化后的最终权重使得MAD略有改善。这些结果表明模型拟合度极佳,时间序列上的误差最小。图5显示了预测和实际的心理健康数据。从20世纪开始,心理健康数据呈现出快速上升的趋势。表1. 从网格搜索和梯度下降得到的因素权重和拟合统计。空白单元格人与自然的关系以人类为中心的价值观技术城市化经济环境环境社会公平教育RMSE MAD网格搜索4.900−1.100−2.925−3.5005.6750.2001.3250.2750.02470.0204梯度下降4.900−1.100−2.927−3.4995.6790.2011.3230.2720.02470.0203下载:下载高分辨率图像(405KB)下载:下载全尺寸图像图5. 1820年至2020年的预测和目标心理健康数据。3.2.1 残差分析和解释的方差残差在零附近波动,没有一致的上升或下降趋势,表明没有系统性偏差(见图6)。R2值为0.988,证实模型解释了大约98.8%的心理健康术语使用变化方差,显示出强大的解释能力。下载:下载高分辨率图像(258KB)下载:下载全尺寸图像图6. 预测与目标残差。3.2.2 消融测试完整模型的最佳拟合RMSE为0.0248,权重平衡(例如,人与自然的关系 = +4.9,经济环境 = +5.675,城市化 = −3.5)。相比之下,消融模型的RMSE显著更高,为0.131(见图7)。简化模型中的权重估计值极端(例如,城市化 = −61.1,环境 = +91.9),表明由于省略了某些变量而导致了补偿性扭曲。这些发现表明,排除生态和文化因素会显著降低模型的性能和可解释性。下载:下载高分辨率图像(373KB)下载:下载全尺寸图像图7. 消融模型的预测和目标心理健康数据。3.2.3 外部验证外部验证显示模型的预测性能很强。预测值与七个历史时间点的实际缩放数据非常接近,RMSE为0.115,MAE为0.0849,皮尔逊相关性接近1(r = 0.974,p < 0.001)。在标准化尺度上,MAE <0.10被视为强性能(Chai & Draxler, 2014; Willmott & Matsuura, 2005)。结合MAE、RMSE和相关性可以更全面地了解模型的准确性。RMSE对较大误差的惩罚更重,因此当RMSE接近MAE时,表明误差分布均匀,而不是由极值主导。非常高的相关性进一步证实了模型能够高保真地捕捉现实世界社会保障指标的时间趋势和幅度。图8展示了这种一致性,证实了模型能够再现150年来的心理健康普及率。这些发现支持了模型的稳健性及其预测心理健康结构性决定因素的潜力,超出了语言数据的范围。下载:下载高分辨率图像(282KB)下载:下载全尺寸图像图8. 预测和目标心理健康数据。3.2.4 时间一致性滚动交叉验证确认了模型的时间稳健性(见图9)。在7-4的分割中,训练和测试的RMSE分别为0.029和0.020;在8-3的分割中,分别为0.0277和0.0194。训练和测试误差之间的小差距表明了强大的泛化能力和最小过拟合。这些结果证实了模型能够再现未见的历史趋势,支持其用于探索性预测。下载:下载高分辨率图像(299KB)下载:下载全尺寸图像图9. 跨时间一致性交叉验证的目标和预测心理健康趋势。3.3 基于这些因素可以预测未来的心理健康趋势吗?情景1:基线(趋势延续)预测2050年的心理健康得分为0.9421。这代表了文化对精神疾病关注度的持续增加,表明如果当前趋势持续,社会关注或患病率可能会增加(见图10)。下载:下载高分辨率图像(539KB)下载:下载全尺寸图像图10. 未来情景趋势。情景2:经济关注导致预测的2050年心理健康得分为0.5150。这种显著下降表明,仅靠经济增长可能无法改善心理健康结果,如果不伴随其他领域的改进,可能会加剧困境(见图10)。情景3:以人类为中心的价值观下降导致预测的2050年心理健康得分为0.9421。没有观察到变化,表明仅减少以人类为中心的价值观可能不足以改变心理健康趋势的轨迹(见图10)。情景4:恢复人与自然的关系导致预测的2050年心理健康得分为0.3254。这一显著减少表明,重新连接人与自然可能对心理健康产生显著积极影响,有可能逆转与压力相关语言的上升趋势(见图10)。4. 讨论本研究揭示了两个世纪以来,特别是20世纪中叶以来,文化对心理健康关注度的显著和加速上升。使用词频数据作为社会关注度、意识和普及率的代理,模型表明心理健康话语的纵向变化可以由几个社会经济宏观因素解释。语言验证和外部验证加强了这些发现的信心,表明决定性词频与心理健康负担的历史指标高度一致,并且模型能够有效泛化到现实世界数据。然而,原始心理健康术语频率仍然是最强的预测指标。这一差异反映了语言趋势与文化话语之间的直接关系。模型的目的不是超越这种相关性,而是展示社会文化决定因素可以超越语言,扩展到制度措施,并提供对解释和预测心理健康因素的洞察。经济环境和人与自然的关系显示出特别重要的影响,更紧密的人与自然关系以及对经济环境的更多考虑与心理健康术语普及率的减少相关。建模方法取得了极好的拟合效果,证实了这八个因素的解释力,而消融测试突出了以人类为中心的价值观和人与自然关系等不太明确的维度的重要性。重要的是,交叉验证和基于情景的预测表明可以建模未来的心理健康提及,恢复人与自然的关系提供了最大幅度的困境相关话语减少。这些发现指出了心理健康的结构性基础,这些基础支持了人与自然的共同发展。从20世纪中叶开始,对心理健康的提及显著且加速上升的现象与盎格鲁圈的流行病学研究发现一致,这些研究记录了自1950年代以来心理健康问题的持续增加。例如,Whitaker(2005)报告称1955年至2000年间,因精神疾病致残的美国人增加了五倍,而Twenge(2011)和Botha等人(2023)强调了1980年代和1990年代出生的人际关系的幸福感下降。模型在同一时期心理健康术语频率的增加与这些普及模式一致,表明通过语言捕捉的文化话语反映了更广泛的社会心理健康负担变化。4.1 词频数据是否是心理健康普及率的有效代理?语言验证中观察到的强烈一致性,其中词频趋势与历史指标(如患者护理事件和心理健康相关社会保障数据)紧密对齐,为使用文化话语作为心理健康负担的代理提供了有力证据。这种一致性支持了基于语言的模型可以补充流行病学数据的观点,特别是在缺乏直接普及率测量的长期分析中。一致性指标和两个独立指标之间的高相关性强调了这种方法的稳健性及其为上游干预提供信息的潜力。虽然词频反映了文化关注度而非原始普及率,但它与服务和服务数据的密切对应表明话语反映了潜在的社会压力。综合来看,这些发现表明语言趋势可以作为社会关注度和感知普及率的可靠代理。如果语言模式追踪了普及率趋势,那么接下来研究塑造这些模式的社会经济决定因素就变得可信。这为将文化话语与结构驱动力联系起来提供了信心,并为后续研究问题奠定了基础。4.2 哪些社会经济宏观因素最能解释自1800年以来对心理健康的提及趋势?建模结果表明,心理健康术语的纵向变化最好由社会经济宏观因素的组合来解释,其中许多因素与已建立的心理健康决定因素一致。经济环境被认为是最强的正面贡献因素,这与将财务不稳定和福利结构与心理健康结果联系起来的文献一致(Huggard, 2003; McAllister et al., 2018)。相反,城市化和技术显示出显著的负面权重,反映了它们与社交隔离的增加以及当代评论中越来越被认可的数字压力因素的关联(Pienkowski et al., 2024; Teepe et al., 2023)。以人为中心的价值观,包括个人主义和自主性,也对心理健康讨论产生了负面影响,这反映了人们对个人主义社会中文化脱节和情感素养的担忧(Humphrey & Bliuc, 2021; Scott et al., 2004)。社会公平和教育在提高意识 và 减少污名方面发挥了积极作用,尽管效果较为温和。值得注意的是,人与自然的关系与心理健康相关术语的普遍性之间存在强烈的负相关,这强化了与自然界其他部分建立有意义联系的重要性。这些因素共同提供了一个强有力的解释框架,用以说明心理健康讨论随时间的文化演变。对完整八因素模型和六个更为成熟的因素消融模型的比较分析强调了人与自然联系以及以人为中心的价值观在解释心理健康讨论趋势中的重要作用。消融模型中错误数量的五倍增加和系数的夸张表明,这些额外因素在解释观察到的模式方面做出了重要贡献。这表明,以往往往忽视这些维度的研究可能无法全面反映心理健康趋势。整合这些因素可以更深入地理解社会优先事项和环境关系如何塑造人们对心理健康的关注。

人与自然关系和以人为中心的价值观这些不太成熟的因素因其潜在影响而值得注意,特别是考虑到它们之间的相互作用。自19世纪中叶以来,人与自然关系的历史性衰退似乎受到多种相互影响的历史进程的影响,例如城市化、经济优先事项的变化和技术进步,这些变化影响了人们如何看待、重视和讨论自然(详见Richardson, 2026)。近几十年来,以人为中心的价值观变得越来越重要,并被视为环境可持续性的障碍(Logan & Prescott, 2022)。过分强调人与人的联系可能会将自然置于“外部群体”的位置,从而削弱生态责任行为(Stinus, Shankland, & Berjot, 2024)。虽然像自我表达、宽容和包容这样的以人为中心的价值观看起来与社会责任行为本质上是一致的,但新的证据表明,与自然的联系对于培养促进社会和环境友好的利他价值观来说,比与人类的联系更为重要(Stinus et al., 2024)。这表明,与自然的联系代表了一种更广泛和深刻的联系形式,它涵盖了社会和生态两个领域。事实上,旨在增强与自然联系的干预措施已被证明可以提高超越自我的联系感——一种扩展到其他人、自然和整个生命的归属感(Passmore et al., 2025 a),同时还能持续改善心理健康和福祉(McEwan et al., 2019)。

值得注意的是,在语料库中反映最直接的四角地和英语国家,心理健康问题的增长最为严峻,这些国家往往表现出与自然的关系较为薄弱,这种模式与经济优先事项和关系导向的价值观而非个人主义价值观有关(Richardson et al., 2025)。综合来看,这些发现表明,让人们重新与自然建立联系不仅有助于生态可持续性,还有助于加强社会凝聚力和心理健康。当经济环境成为最具影响力的因素时,这些结果指向了一个令人信服的结论:与其仅仅通过以人为中心的价值观关注个体,不如关注为人类和自然创造共同繁荣的经济条件来奠定心理健康的基础。

4.2.1 外部验证
外部验证结果增强了人们对模型解释框架的信心。在150年的社会保障数据中,模型获得了r = 0.974和RMSE = 0.115的评分,这表明社会文化决定因素可以超越语言数据,适用于独立的制度指标。尽管基于原始心理健康术语频率的模型在社会保障指标上的预测准确性略高(r = 0.99 vs. r = 0.974),但该模型的表现仍然值得注意,因为它仅依赖于社会文化决定因素。这种一致性表明,社会文化决定因素既是语言指标也是制度衡量心理健康负担的基础。该模型表明,社会文化决定因素本身就可以预测制度指标,而不需要依赖心理健康术语的频率。

基于因素的模型与心理健康术语频率几乎相当的表现凸显了其稳健性和理论有效性。此外,成功的外部验证增强了人们对基于语言的模型作为社会福祉代理的信心,并展示了它们将讨论转化为政策相关成果的能力。这里概述的方法为将历史讨论分析与可行的预测联系起来提供了有希望的途径。模型的验证表明,语言趋势反映了结构性弱点。从1800年到2020年的历史语料库模式与自然语言处理分析的结果相呼应,心理健康术语的激增往往与社会或文化变革同时发生,例如疫情引起的隔离加剧了关于抑郁的讨论(Stupinski et al., 2022; Wang et al., 2022)。模型的预测能力表明,经济条件和人与自然关系等宏观因素不仅能够解释语言模式,还能提出可行的干预措施。具体来说,恢复人与自然的关系或解决经济环境问题可以缓解文化讨论的激增和实际患病率,提供了一种整合生态和社会经济福祉的系统级方法。这些发现表明,有可能重新构建心理健康政策,超越症状管理,解决导致困扰的根本结构和关系决定因素。强有力的外部验证结果加强了上述解释框架,因为成功的预测为所提出的解释提供了有力的支持(Kaplan, 1964)。

4.2.2 替代解释和模型稳健性
对于观察到的心理健康讨论增加的一个重要替代解释是精神病学的专业化、正式诊断系统的开发以及心理健康服务的实质性扩展。这些历史进程无疑增加了对精神疾病的可见性和制度记录。然而,本研究的几个特点表明,专业化和服务扩展本身并不能完全解释这些趋势。首先,外部验证表明,八个社会文化因素(不包括任何心理健康术语)在150年间能够准确预测制度负担数据。其次,消融测试显示,去除人与自然关系和以人为中心的价值观(同时保留可能与专业化共变的更成熟因素)会增加模型误差。最后,心理健康指数本身是通过对1800-2020年整个时期的主成分分析(PCA)构建的,这意味着只有那些长期一致性的术语才会被保留,而不是特定时代的临床语言。总体而言,这些分析表明,虽然专业化和制度发展是历史背景的一部分,但更广泛的社会文化和生态系统结构条件,特别是经济环境和人与自然的关系,提供了额外的解释力。

4.3 可以根据这些因素模型预测未来的心理健康趋势吗?
研究结果表明,可以使用已识别的社会经济宏观因素来预测未来的心理健康讨论趋势。通过推断经济发展、城市化、技术和人与自然关系等变量的历史轨迹,模型预测显示,恢复人与自然的关系或关注经济环境可以显著减少预期的心理健康讨论,这表明这些因素不仅是解释性的,也可能是可行的干预措施。事实上,以自然为中心的干预措施已经导致了心理健康的持续改善(例如Choe et al., 2020; McEwan et al., 2019; Muneghina et al., 2021)。虽然词频反映的是文化关注而非直接患病率,但上述结果和讨论支持两者之间的联系。因此,模型的预测能力为实时监测和预测未来的心理健康负担以及指导上游干预提供了潜在工具。

4.4 政策含义
虽然词频并不等同于直接患病率,但方法的严谨性、强大的语言和外部验证以及与既定社会决定因素的一致性表明,这些发现可以为政策提供指导,尤其是在统一人类和自然福祉方面。结果显示,恢复人与自然的关系和解决经济条件是减少文化讨论和实际心理健康负担的最有希望的手段。然而,最近几十年来,对经济环境的关注程度下降(−45%),而对技术的关注(+11%)、教育(+66%)和社会公平(+77%)以及以人为中心的价值观(+48%)有所增长,而对经济环境的关注则下降了。这些变化表明,更显而易见或当前关注的问题,例如“屏幕时间”,可能已经占据了主导地位,可能掩盖了心理健康的根本条件。

重要的是,研究强调了人与自然关系衰退和心理健康问题增加背后的共同结构性驱动因素,特别是在四角地国家,包括经济优先事项、城市化、技术进步和以人为中心的价值观(Richardson et al., 2025)。这种一致性表明,统一人类和自然的福祉具有共同的决定因素,指出需要制定综合策略,创造一个使人类和自然都能繁荣的经济和城市环境。这与“同一健康”模型(Rabinowitz et al., 2018)和IPBES(2024)关于生物多样性丧失根本原因的评估相呼应,其中强调了人与自然的联系作为变革的途径。目前的结果和更广泛的人与自然关系的工作表明,统一人类和自然福祉的结构基础似乎在于创造一个允许人类和自然共同繁荣的经济和城市环境。这促使人们探索以下政策途径:将自然联系纳入福祉政策;促进向自然接触的文化转变;设计促进联系的城市空间;将生物多样性恢复与心理健康目标相结合;建立终身与自然的联系,并制定激励积极城市规划的经济政策,认识到结构性经济条件是心理健康和人与自然关系的基础。最后,模型的预测能力突显了其作为实时监测和预测心理健康趋势的工具的潜力,使政策制定者能够在危机升级之前预见并设计上游干预措施。

4.5 局限性和未来研究
首先,存在语言代理的局限性。词频数据捕捉的是文化显著性而非直接患病率,历史语料库可能在出版趋势、体裁代表和数字化伪影方面引入偏见(Juola, 2013; Younes & Reips, 2019)。虽然外部验证支持有效性,但这些代理无法完全替代流行病学测量。其次,模型有一些假设。预测框架假设宏观因素与心理健康讨论之间的关系具有时间稳定性,并采用加性线性结构。在快速的社会政治或生态变化下,这些假设可能不成立。因此,情景预测应被视为探索性的而非确定性的。未来的工作应该整合多模态语料库和动态反馈模型来解决这些限制。此外,模型权重不应被解释为独立的因果效应,因为预测因子高度相关。尽管如此,当目标是预测而非解释时,这并不一定会降低预测准确性(Pedhazur, 1997; Osborne & Waters, 2002)。即使在存在共线性的情况下,机器学习方法(如网格搜索优化)仍可以实现强大的预测性能(Leeuwenberg et al., 2022)。因此,尽管经济环境和人与自然关系不能作为完全独立的因果驱动因素,但它们的结合在解释长期心理健康讨论趋势方面起着重要作用。

还应该注意的是,使用美国制度指标进行的外部验证并不是为了支持因果推断。这些指标用作独立的历史基准,以评估从语言中得出的社会文化因素轨迹是否能够超越语言数据。由于验证依赖于汇总的国家层面数据,因果方向的问题超出了本研究的范围。这种以预测为导向的方法与心理学中日益增长的呼声一致,即扩大方法工具箱(例如机器学习方法),不再仅仅侧重于因果机制的识别,而是将强大的、可推广的模式视为与理论相关的结果(Kovač et al., 2024; Lee & Gates, 2025; Yarkoni & Westfall, 2017)。另一个局限性涉及文化和语言范围。分析基于英语语料库,其中主要由美国和其他四角地国家的出版物组成。因此,心理健康指数和宏观因素反映了受文化影响的语言使用模式。因此,所识别的术语可能受到以美国为中心和更广泛的四角地规范、价值观和制度背景的影响。虽然这些背景构成了通常被称为“西方”社会的一部分,但它们并不能完全反映西欧的多样性、非英语人口的实际情况或多元文化的语言差异(例如美国境内的西班牙语社区)。尽管存在这一局限性,跨国研究的证据表明,这里讨论的许多潜在趋势,特别是与自然联系相关的趋势,在多个西方和工业化国家中都能观察到(Richardson等人,2025年)。因此,当前的发现应被视为在盎格鲁圈内具有分析基础,虽然具有广泛的参考价值,但并不能直接推广到更大的西方背景下。

5. 结论

本研究提供了一个基于数据的新视角,探讨了心理健康的长期文化动态,表明从1800年到2020年的词汇频率变化不仅反映了社会意识,还揭示了潜在的结构决定因素。通过八个社会经济宏观因素来建模心理健康话语,该研究强调了语言演变如何反映社会压力和心理福祉的变化。语言验证确认了词汇频率与心理健康负担的历史指标相吻合,而外部验证则表明该模型能够超越语言代理指标,适用于现实世界的数据。尽管原始的心理健康术语频率在预测机构指标方面略具更高准确性,但基于因素的模型的表现依然值得注意,因为它仅依赖于社会文化决定因素。消除这些因素的测试进一步强调了人与自然关系以及以人类为中心的价值观的重要性——当这些因素被排除时,模型的准确性显著下降。基于情景的预测表明,未来的心理健康趋势可以通过上游干预措施来预期和潜在地缓解。值得注意的是,恢复人与自然的关系以及改善经济环境成为减少文化话语和实际发病率的有希望的手段,为政策制定提供了可行的途径。同时,研究结果还表明,更当代的问题可能会越来越多地吸引关注,可能会掩盖心理健康的基本条件。该研究还突显了英语国家中心理健康和人与自然关系的问题,以及两者共有的因素,如经济环境、城市化、技术和以人类为中心的价值观。综合来看,这些发现表明,统一人类和自然福祉的结构基础在于创造一个使人类和自然能够共同繁荣的经济和城市环境,这增强了制定整合生态和心理健康政策的需求。

伦理声明

本研究完全基于公开可获取的汇总二手数据。

关于生成式AI和AI辅助技术的声明

在准备这项工作时,作者使用了MS Co-pilot工具来进行Python编码和协助手稿准备(例如提取和格式化结果、撰写概述、综合内容、提高可读性以及使用简洁的语言)。使用这些工具后,作者根据需要对内容进行了审查和编辑,并对发表文章的内容负全部责任。

资金来源

本研究未获得公共部门、商业部门或非营利组织的任何特定资助。

生物通微信公众号
微信
新浪微博


生物通 版权所有