在全球范围内,甲状腺疾病作为最常见的内分泌系统疾病之一,其患病率正以惊人速度攀升。据统计,约有2亿人受到甲状腺功能障碍、结节和癌症的困扰。这种疾病不仅直接影响个人健康——甲状腺激素过量可能导致高输出性心力衰竭、扩张型心肌病和心房颤动,而甲状腺功能减退则可能引发血脂异常和高血压等并发症,更值得关注的是,甲状腺功能障碍与糖尿病、心血管疾病等慢性病存在显著共病关系,进一步加剧了疾病负担。
传统预测模型主要依赖血清生物标志物如促甲状腺激素(TSH)和游离甲状腺素(FT4 )及人口统计学因素,但这些模型通常在甲状腺功能障碍已经明显异常时才有效,难以在亚临床阶段检测早期疾病信号。因此,开发能够更早期预测甲状腺疾病发病的高分辨率分类器迫在眉睫。
日益增多的证据表明,环境化学暴露与甲状腺疾病高度相关。持久性有机污染物(POPs)如多氯联苯(PCBs)、全氟和多氟烷基物质(PFAS),以及双酚A(BPA)等内分泌干扰物(EDCs),通过干扰激素合成、运输和代谢,显著增加甲状腺疾病风险。然而,传统的风险评估和实验设计主要关注单一污染物的孤立毒性,对真实世界场景中混合暴露的累积和交互效应关注不足。
实验证据表明,甲状腺干扰化学物混合物在高暴露水平下表现出协同累积效应,其联合毒性通过激活多种生物通路而超过简单的剂量相加性。这种"1+1>2"的协同效应意味着,环境化学物的混合暴露可能通过多通路交叉对话放大毒性。更关键的是,这些混合物效应并不局限于高暴露场景,即使在个体化学物浓度低于健康指导值的情况下,有机氯农药的联合暴露也能通过"累积内分泌干扰"升高血清TSH水平。
在这项发表于《Ecotoxicology and Environmental Safety》的研究中,研究人员基于美国国家健康与营养调查(NHANES)2011-2014年数据,构建了一个结合加权分位数和(WQS)回归与机器学习模型(XGBoost)的综合分析框架,首次同时评估了三类主要甲状腺干扰化学物(POPs、重金属和EDCs)的混合效应,并应用SHAP交互分析评估了人口水平混合物效应和个体水平预测价值。
研究方法上,研究纳入了1847名参与者,其中138名甲状腺疾病患者。环境化学暴露评估包括PFAS如全氟辛酸(PFOA)、全氟辛烷磺酸(PFOS)等,重金属如血铅和血镉,以及邻苯二甲酸酯代谢物。统计分析采用WQS回归评估混合物效应,并运用贝叶斯优化的XGBoost模型进行预测,通过SHAP框架实现模型可解释性。
3.1 统计描述
研究人群基线特征显示,甲状腺疾病患者平均年龄显著高于非患者组(55.4±20.1岁 vs 41.05±20.0岁),女性患病率更高(72.5%)。甲状腺疾病组在高血压、糖尿病、睡眠障碍患病率上显著更高,而运动频率较低。
3.2 Spearman相关系数热图
Spearman相关热图显示大多数环境化学暴露之间存在正相关,相关系数从弱到中等。血铅和血镉表现出最强的正相关性(r>0.6),PFAS化合物之间存在中等程度的相关性。
3.3 WQS回归结果
WQS回归显示,环境化学混合物与甲状腺疾病风险在粗模型中存在显著正相关(OR=2.74, 95%CI:1.16-6.46)。五种化学物贡献了68%的混合物效应:2-(N-甲基-PFOSA)乙酸盐(权重=0.28)、PFHxS(0.14)、血镉(0.10)、血铅(0.08)和MEOHP(0.08)。调整协变量后关联为边际显著(调整后OR=2.30, 95%CI:0.97-5.47)。
3.4 机器学习性能与解释
贝叶斯优化的XGBoost模型表现出优异的预测性能(AUC=0.978,精确度=0.986,召回率=0.900,F1分数=0.940)。SHAP分析确定WQS指数、年龄和人口统计学因素是最有影响力的预测因子。SHAP交互分析揭示了年龄与环境暴露间的显著效应,年龄与WQS指数的交互作用最强(交互值≈0.027)。当WQS指数超过0.5时,63岁以上个体的预测风险急剧上升,而年轻人曲线保持平坦。
研究结论表明,POPs和EDCs混合暴露与美国成人甲状腺疾病风险增加显著相关。2-(N-甲基-PFOSA)乙酸盐、PFHxS、血镉、血铅和MEOHP是主要驱动因素, collectively贡献了68%的风险。更重要的是,SHAP基于的可解释性分析揭示了年龄与化学混合物暴露之间的显著交互作用,确定63岁以上成年人为特别易感的亚组。
这项研究的重要意义在于倡导环境健康政策从单一化学物风险评估向基于混合物的方法进行范式转变。该方法框架为识别关键风险驱动因素和易感人群提供了替代工具,从而为有针对性的公共卫生干预和未来监管策略提供信息。特别值得注意的是,即使单个污染物的浓度低于当前健康指导值,污染物混合物仍可能引发临床可识别的甲状腺功能障碍,这对现有风险评估体系提出了重要挑战。
打赏