基于人工智能的微炭识别技术:推动智能自动化在古火重建领域的应用

时间:2026年2月3日
来源:Global Medical Genetics

编辑推荐:

微炭屑与石松属孢子AI识别软件FireFly开发及性能验证,采用YOLOv8算法实现10-200μm微炭屑和石松属孢子的同步自动识别,准确率达94.3%和98.6%,20秒完成全片分析效率提升30倍。

广告
   X   

张子月|王子莎|苗云发|邹亚国|赵永涛|牛盖红|索菲·瓦尔尼
中国科学院西北生态环境资源研究院干旱地区生态安全与可持续发展国家重点实验室,中国兰州730000

摘要

沉积物中的木炭是古火活动的可靠代用指标,在重建过去的火灾活动及其与气候和植被的关联方面发挥着关键作用。然而,传统的手动或半自动化方法在识别微木炭(MC)时存在效率、一致性和稳健性方面的限制。在这项研究中,我们开发了一种基于人工智能的软件工具(FireFly),用于自动识别微木炭,该工具利用了先进的YOLOv8(You Only Look Once,第8版)深度学习算法。这是首个能够同时识别微木炭和标志物Lycopodium clavatum孢子(LYP)的应用,并且还实现了结果的自动计算和导出。该模型在包含21,094个微木炭颗粒、6,214个LYP颗粒以及19,964个杂质颗粒(包括矿物碎片、无定形有机碎屑和其他微化石)的专家验证数据集上进行了训练。在专门的测试数据集和两个长期沉积序列上的性能评估显示,其与手动识别结果的高度一致性分别达到了约94.3%(微木炭)和约98.6%(LYP)。值得注意的是,该软件仅需20秒即可完成整个载玻片上微木炭的识别和量化,与耗时数小时的手动过程相比,效率有了显著提升。这些结果证实了所提出方法的准确性,并且在效率上优于传统方法。此外,它还能够在大空间尺度上重建野火历史,从而为研究野火-生态-气候之间的联系奠定了坚实的基础。

引言

野火在全球范围内频繁发生,被认为是塑造全球生态系统的重要因素,也是气候变化的一个组成部分(Sullivan等人,2022年)。在燃烧过程中,大量温室气体和细颗粒物被排放到大气中,改变了大气成分和气溶胶含量,最终影响了碳循环(Bowman等人,2009年;van der Velde等人,2021年;Zheng等人,2023年)。野火改变了植被和土壤组成,进而影响生态系统结构、功能和生物多样性(Bowman等人,2020年)。长期暴露于野火排放物(如烟雾、颗粒物)也会对人类健康产生负面影响(Chen等人,2021年;Korsiak等人,2022年;Xu等人,2023年)。同时,人类活动也在不断影响火灾模式(Bowman等人,2020年)。预计全球变暖将使易发生火灾的地区面积增加29%,主要集中在北方和温带地区,并显著延长这些地区的潜在火灾季节(Senande-Rivera等人,2022年)。因此,深入理解复杂的火-气候-植被相互作用对于应对全球变暖带来的问题具有重要意义。沉积物中的木炭是生物质燃烧的产物,是重建野火历史的可靠代用指标(Clark,1988年;Mooney和Tinner,2011年;Patterson等人,1987年;Whitlock和Larsen,2001年)。宏观木炭(通常大于200微米)通常在局部沉积,用于重建局部火灾历史(Clark,1988年;Conedera等人,2009年;Whitlock和Larsen,2001年)。相比之下,微木炭(以下简称MC,10–200微米)可以通过风长距离传输,使其成为评估更大空间和时间尺度上区域火灾活动的关键指标(Clark,1988年;Conedera等人,2009年;Patterson等人,1987年)。MC的特性(大小和形态)提供了关于燃料类型和燃烧条件的宝贵信息,而其沉积通量的变化主要反映了区域火灾活动的变化,从而为理解火灾与气候变化之间的相互作用提供了关键证据(Haliuc等人,2023年;Marlon等人,2013年;Marlon等人,2016年;Miao等人,2016年;Miao等人,2022b年;Miao等人,2019年;Turner等人,2008年;Wang等人,2023年)。
准确识别微木炭是野火研究的基础。传统上,MC分析主要依赖于在光学显微镜下的手动操作,分析师需要识别、量化并可能对颗粒进行形态学特征描述。然而,这一手动过程既耗时又容易因主观解释而产生不一致性。例如,单个样本的微木炭手动识别和量化至少需要3小时,即使对于同一样本,不同分析师的统计结果也可能有所不同。因此,近年来开发自动识别微木炭及相关微化石的技术变得越来越受到关注(Bollmann等人,2005年;Charles等人,2008年)。早期的自动化尝试包括将显微镜和相机连接到计算机上,根据分析师识别的特征或灰度强度来测量微木炭或宏观木炭碎片(Asselin和Payette,2005年;Marquer等人,2008年)。这些方法演变为标准的图像处理工作流程,包括数字图像采集、对象-背景分割、手动特征设计和分类。例如,使用多达32个形态学和光学特征(包括大小、形状、纹理和颜色)的逻辑分类器,从透射光显微镜图像中识别类脂质(在形态上类似于微木炭)(Charles等人,2008年;Charles等人,2009年;Kuncheva等人,2008年)。
更现代的自动化方法利用扫描的数字图像和开源软件(如ImageJ)进行进一步分析(Lesven等人,2022年;Zou等人,2025年;Zou等人,2021年)。在这些研究中,分割通常使用灰度阈值法进行,随后基于统计颜色特征(如像素强度的平均值和标准差)进行分类。然而,这些方法严重依赖于基于先验知识的自定义特征,这限制了它们对自然样本中复杂多变形态的微木炭的适应性。此外,设计有效的特征来识别Lycopodium clavatum孢子(LYP)——通常用作定量校准的标志物——仍然特别具有挑战性。这些局限性凸显了迫切需要更先进、自适应的技术来克服手动设计特征以区分目标颗粒和干扰物体的瓶颈,从而提高微木炭和LYP识别的准确性和稳健性。
卷积神经网络(CNN)是一种可以从图像中自动学习目标特征并完成识别任务的算法(Krizhevsky等人,2012年;LeCun等人,2015年;Zhou等人,2016年),因此在自动驾驶、医疗辅助和精准农业等多个领域得到了广泛应用。在古环境研究的背景下,Rehn等人(2019年)使用基于CNN的“识别-分类”框架从图像中提取所有候选化石木炭(大于63微米),并分类木炭的形态,达到了约96%的颗粒识别准确率和约75%的分类准确率。最近的一项研究使用基于CNN的方法检测LYP,平均召回率为75.5%(von Allmen等人,2024年)。这些研究表明了CNN在自动识别微化石(特别是微木炭和LYP)方面的可行性和有效性——这也是本研究的重点。
在这项研究中,我们应用了先进的YOLOv8算法(一种基于人工智能的方法)来自动识别载玻片上的微木炭和标志物孢子LYP。此外,为了促进这一方法的更广泛采用,我们开发了一个名为FireFly的软件工具,该工具能够自动从载玻片图像中分类微木炭和LYP。据我们所知,这是首个在微木炭识别领域成功实现同时识别、计数和分类微木炭和LYP的应用。

样本制备和成像

为了确保模型能够准确识别不同类型沉积物中的微木炭颗粒,我们收集了31个样本(图1A,表1)。这个样本集合涵盖了多种沉积相(如黄土、湖泊、河流和海洋沉积物),并补充了现代材料,包括表层土壤、空气中的花粉和燃烧实验样本。此外,还使用了两个含有大量LYP的载玻片来缓解类别不平衡问题(数量

YOLOv8训练过程和模型性能

YOLOv8训练的超参数通过遗传算法在约30%的微木炭数据集上进行了优化,评估了每个候选超参数集的适应度指标(P、R和mAP的组合),共进行了30次迭代。使用的详细参数列在表S1中。该算法通过选择、交叉和变异优先考虑了收敛速度快且泛化能力强的参数组合。然后,我们采用迁移学习策略,通过初始化模型权重来进行训练

结论

我们开发了一种基于人工智能的方法,用于从数字图像中识别和量化微木炭和LYP,并开发了相应的软件工具来简化操作流程并减少人工干预。该方法依赖于我们构建的数据库,其中包含21,094个微木炭颗粒、6,214个LYP颗粒和19,964个杂质颗粒。该方法已经过准确性验证,在测试集上微木炭的识别准确率为93.8%,LYP的识别准确率为99%。此外,我们还比较了手动和自动

CRediT作者贡献声明

张子月:撰写 – 审稿与编辑,撰写 – 原稿,可视化,软件开发,方法论,数据管理,概念化。王子莎:撰写 – 审稿与编辑,撰写 – 原稿,可视化,软件开发,方法论,数据管理,概念化。苗云发:撰写 – 审稿与编辑,监督,资金获取,概念化。邹亚国:撰写 – 审稿与编辑,方法论。赵永涛:撰写 – 审稿与编辑。牛盖红:撰写 – 审稿与

利益冲突声明

作者声明他们没有已知的财务利益或个人关系可能影响本文所述的工作。

致谢

本研究得到了国家自然科学基金(42325204、42488201、42271176)、中国科学院西部之光项目(xbzgzdsys-202204)、甘肃省领军人才(24RCKB010)、甘肃省顶尖领军人才,青年创新促进协会成员(2022439)的支持。我们感谢中国科学院兰州资源与环境科学仪器中心提供的载玻片扫描仪。同时,我们也感谢编辑和匿名

生物通微信公众号
微信
新浪微博


生物通 版权所有