编辑推荐:
为解决传统质量指标无法准确评估超细颗粒物(UFPs)健康风险的问题,研究人员开发了基于堆叠集成机器学习(Stem-PNC)的高分辨率暴露评估框架,整合数据驱动与物理化学模型,首次实现瑞士全国1 km空间/1小时时间分辨率的UFPs暴露图谱。研究发现20%人口(170万)暴露于超过WHO建议限值(104 particles·cm-3)的高浓度UFPs,揭示UFPs与PM2.5空间异质性差异达10倍,为未来UFPs标准制定提供关键科学依据。
空气污染已成为全球公共卫生的重大威胁,其中直径小于100纳米的超细颗粒物(UFPs)因其微小尺寸和高比表面积,能够深入人体组织并引发心血管和呼吸系统疾病。然而,传统基于质量浓度(如PM2.5)的评估方法难以捕捉UFPs的真实风险——尽管UFPs在颗粒物总数中占比极高,但其质量贡献微乎其微。世界卫生组织(WHO)在最新空气质量指南中首次提出以粒子数浓度(PNC)作为UFPs的评估指标,但全球范围内高分辨率暴露数据极度匮乏。这一空白严重阻碍了流行病学研究和精准防控政策的制定。
针对这一挑战,中国辐射防护研究院等机构的研究团队开发了名为Stem-PNC的堆叠集成机器学习框架,通过融合数据驱动模型与物理化学模型,首次实现了瑞士全国范围内1公里空间分辨率和1小时时间分辨率的UFPs暴露精准评估。这项突破性研究发表在《Nature Communications》上,为超细颗粒物的健康风险管理和标准制定提供了里程碑式的科学工具。
研究团队采用四项关键技术:1)基于瑞士国家空气污染监测网络(NABEL)长达15年的标准化PNC监测数据;2)堆叠集成机器学习(Stem-PNC)整合K近邻、决策树、随机森林和LightGBM等算法;3)利用哥白尼大气监测服务(CAMS)和ECMWF再分析数据(ERA5)进行空间降尺度;4)结合Open Transport Map的100米分辨率交通数据构建暴露模型。
数据驱动的粒子数浓度模型
Stem-PNC模型在COVID-19疫情期间仍保持优异性能,小时和月平均预测的R2分别达0.85和0.92。相比深度学习模型,其计算效率提升25倍且硬件需求更低(无需A6000 GPU),而预测偏差(124 particles·cm-3)显著低于随机森林(RF)等单一模型。SHAP分析显示NOX和PM10是PNC最相关特征,但全特征模型(R2=0.845)显著优于单一特征组合(R2=0.679-0.794)。
Stem-PNC的泛化能力
通过五折站点排除交叉验证,模型在伯尔尼(城市路边站)和卢加诺(城市背景站)的预测与实测值高度吻合(R2=0.76-0.91),但在哈金根(高速公路旁)和里吉(海拔>1000米)站点出现偏差。这表明模型对极端环境(如交通源或高山区域)的适应性需通过增加训练数据多样性进一步提升。
瑞士粒子数浓度分布
季节分析显示冬季(JFM和OND)PNC比夏季(AMJ和JAS)高30%-40%,主要归因于大气边界层高度降低和降水减少。全国年均PNC为(9.3±4.7)×103 particles·cm-3,但城乡差异显著:城市中心(1.4×104)>城市集群(8.5×103)>农村地区(5.5×103)。高速公路周边网格的年均PNC偏差达20%,凸显1 km分辨率对局部高排放源的捕捉局限。
超细颗粒物暴露评估
研究发现瑞士24%人口(212万)居住的城市中心区年均PNC超2×104 particles·cm-3。UFPs空间异质性系数(CV=0.38)是PM2.5(CV=0.032)的10.1±12.2倍,其中农村地区差异最大(13.8±15.1倍)。基于WHO指南的暴露分析显示,城市中心居民年均597小时处于1小时高暴露(>2×104),而24小时均值超标天数达239天,两者呈非线性关系(指数0.35),证实两种参考限值不可互换。
这项研究通过机器学习创新性地解决了UFPs暴露评估的三大难题:传统质量指标的局限性、监测数据稀缺性以及空间异质性量化需求。研究不仅首次绘制了瑞士全国高分辨率UFPs暴露图谱,更揭示了WHO两种参考限值的科学差异,为全球UFPs标准制定提供了关键依据。值得注意的是,模型在计算效率(仅需深度学习4%的算力)与预测精度间的平衡,使其特别适合在监测网络薄弱地区推广应用。未来通过整合动态人口移动数据和更高空间分辨率输入,有望进一步提升暴露评估的精准度,为超细颗粒物的健康风险预警和靶向干预开辟新途径。
生物通 版权所有