基于无人机地理空间预测模型识别秘鲁库斯科高地肝片吸虫(Fasciola hepatica)感染风险

时间:2026年2月24日
来源:Infectious Diseases of Poverty

编辑推荐:

本研究报告了一项创新性研究,它综合运用无人机遥感与机器学习技术,在秘鲁安第斯山区的一个农村社区,首次构建了人类与绵羊肝片吸虫(Fasciola hepatica)感染的高分辨率预测模型。该研究不仅揭示了环境(如NDVI、坡度)、地形及气候变量与感染的精细空间关联,更通过随机森林(RF)、XGBoost(XGB)等模型及空间交叉验证策略,展现了该技术方案用于局部地区人兽共患病风险制图与精准干预的可行性,为资源有限地区防控这一被忽视的热带病提供了新工具。

广告
   X   

背景
肝片吸虫病(Fascioliasis)是一种影响全球农业社区的食源性被忽视吸虫感染,由肝片吸虫(Fasciola hepatica)引起。秘鲁安第斯地区是受此病影响最严重的区域之一,其中库斯科地区的儿童感染率在不同社区间存在显著差异(0至20%)。该病是一种人兽共患感染,其生命周期涉及淡水螺作为中间宿主,以及作为感染阶段(囊蚴)载体的水生植物或水体。环境因素如水汇集、植被、牲畜密度、灌溉方式等对疾病的持续存在至关重要,使得控制极为复杂。因此,建立能够预测特定地理位置肝片吸虫病发生的模型,可为制定战略性控制干预措施提供有力工具。
传统风险地图和预测模型多纳入遥感数据,如土地利用、温度和植被指数。无人机(UAV)捕获的高分辨率图像为监测和检测传染病媒介提供了先进能力,能够有效估算土壤温度、湿度和地形等对理解人兽共患病传播至关重要的环境数据。本研究旨在确定利用多光谱和热成像高分辨率图像计算的环境指数所构建的预测模型,能否识别库斯科高地人类和牲畜感染肝片吸虫的家庭。
方法
研究在秘鲁库斯科地区万卡尼(Huancarani)区的瓦伊拉帕塔(Huayllapata)社区进行。该社区海拔约3800米,面积约1平方公里,家庭主要从事小规模农业和牲畜养殖(主要是绵羊)。研究采用横断面设计,收集了家庭人口统计学、社会经济信息和地理定位感染数据。人类和绵羊的肝片吸虫感染通过粪便镜检诊断。人类感染定义为家庭中至少有一人检测阳性,绵羊感染定义为家庭中至少有一只绵羊检测阳性。
环境数据获取方面,研究团队于2023年4月使用配备热成像和多光谱相机的无人机对社区进行了高分辨率测绘。多光谱无人机飞行高度120米,空间分辨率为10.5厘米/像素;热成像无人机飞行高度140米,空间分辨率为33.46厘米/像素。飞行区域覆盖约1平方公里。此外,还从TerraClimate获取了降水、土壤湿度等气候数据,并通过地理加权线性回归模型将其空间分辨率降尺度至10厘米/像素。
数据处理与建模流程包括:首先,使用专业软件从无人机图像生成正射影像、数字高程模型(DEM)和环境指数,如归一化植被指数(NDVI)、增强植被指数(EVI)、归一化差异水体指数(NDWI)、坡度、坡向等。然后,将研究区域划分为50米分辨率的六边形网格,每个网格单元代表一个空间预测单元。人类和绵羊的感染状态被分配到包含其家庭或放牧位置的六边形中。
研究采用了两种变量选择策略来训练预测模型:一是基于文献的选择,保留与肝片吸虫传播有明确机制关联的协变量,如坡度、NDVI、DEM、降水和地表温度;二是基于主成分分析(PCA)的选择,将高度相关的多光谱和地形指数压缩为数量更少、相互正交的主成分。
模型构建方面,应用了逻辑回归(LR)、随机森林(RF)、XGBoost(XGB)和多层感知器深度学习(DL)模型。模型性能通过两种交叉验证方法评估:标准的五折交叉验证和考虑空间自相关的空间交叉验证。性能指标包括准确度、灵敏度和特异度。最终,生成覆盖整个研究区的、空间分辨率为10厘米/像素的连续概率表面地图,以可视化预测的感染风险。
结果
在瓦伊拉帕塔社区,人类肝片吸虫感染的家庭流行率为21.3%,而绵羊感染的家庭流行率高达80%。
人类感染预测:在标准交叉验证下,使用基于文献的变量时,随机森林(RF)模型表现最佳(准确度=0.89,灵敏度=0.99,特异度=0.88);使用基于PCA的变量时,XGBoost(XGB)模型表现最佳(准确度=0.85,灵敏度=0.75,特异度=0.85)。当采用空间交叉验证来考虑空间依赖性时,所有模型的准确度和特异度均有所下降,但灵敏度保持在高水平。例如,基于文献的RF模型在空间验证下准确度降至0.73,特异度降至0.72,而灵敏度仍为0.99。
在变量重要性方面,基于文献的模型中,温度、降水、NDVI、DEM和坡度是最佳预测因子。基于PCA的模型中,地形和植被的第二主成分是关键贡献者。
概率风险图显示,预测的风险在社区内存在明显的空间异质性。对比标准交叉验证和空间交叉验证生成的XGBoost模型概率图可以发现,纳入空间结构后,模型预测的概率范围显著扩大,空间对比更加清晰,高风险区域的位置和范围发生了明显变化。
绵羊感染预测:在标准交叉验证下,使用基于文献的变量时,XGBoost(XGB)模型性能最高(准确度=0.93,灵敏度=0.65,特异度=0.93);使用基于PCA的变量时,随机森林(RF)模型表现最佳(准确度=0.85,灵敏度=0.75,特异度=0.86)。同样,空间交叉验证降低了模型的准确度和特异度,但保持了高灵敏度。例如,基于文献的XGB模型在空间验证下准确度降至0.79,特异度降至0.77,灵敏度高达0.99。
对于绵羊感染,基于文献的模型中,XGB和LR模型赋予植被指数(NDVI)更高重要性,而RF模型则更看重DEM。基于PCA的模型中,植被成分对XGB和LR仍有影响,而RF强调了地形和湿度变量的作用。
绵羊感染的概率图也显示出类似人类感染图的空间模式变化,即考虑空间依赖性后,预测的风险分布变得更加异质化和碎片化。
讨论
本研究整合了高分辨率无人机衍生的地形和环境指数、气候数据及多种建模策略,成功预测了秘鲁安第斯山区家庭层面的肝片吸虫感染。研究强调,植被、水体指数和地形特征等局地尺度的地理空间指标对于估计感染概率至关重要。
从生态学角度看,与未感染家庭所在网格单元相比,包含感染家庭的网格单元在绿光和红光波段具有更高的反射率值,而NDVI值 consistently较低。这可能反映了有利于与肝片吸虫传播相关的中间宿主螺类繁殖的植被类型或地表覆盖的存在。较低的NDVI可能指示植被胁迫或某些在螺类生存所需的潮湿条件下繁茂的植被形式。NDWI值在感染家庭网格单元中略高,这与小型水体或潮湿地形在支持肝片吸虫生命周期中起重要作用的认识相符。此外,较缓的坡度、略低的阴影值也与较高的感染风险相关,因为这些条件有利于积水,创造适合螺类种群的微生境。
在预测算法中,XGBoost(XGB)和随机森林(RF)在两种变量选择策略下均表现出稳健的性能,尤其是在空间交叉验证框架下。尽管深度学习(DL)模型在人类感染预测中达到了99%的灵敏度,但其准确度和特异度较低,这可能是由于在样本量有限、结局不平衡的情况下出现了过拟合。
研究的一个重要方法学启示是,模型的表观性能取决于验证策略。标准交叉验证可能因空间自相关而产生过于乐观的判别估计,而空间交叉验证提供了更保守、更现实的性能评估,这对于将风险外推至社区内未采样区域尤为重要。
本研究的发现可直接应用于识别有感染肝片吸虫病风险的人群。精确定位感染的地理空间热点区域,可以实现有针对性的干预措施,如改善排水、破坏螺类栖息地或进行战略性的驱虫治疗。将无人机衍生指数与机器学习方法相结合的可行性,凸显了在高分辨率遥感难以到达的安第斯社区进行疾病监测的潜力。
局限性与展望
本研究作为初步探索,存在一些影响普适性的重要局限。首先,所有数据均来自单一的安第斯社区,家庭数量,尤其是有绵羊感染的家庭数量有限。因此,模型可能捕捉到瓦伊拉帕塔社区特有的局地环境配置。其次,横断面设计无法评估已识别风险模式的时间稳定性,且无人机指数仅代表单次成像活动,未反映季节动态。再次,尽管包含了广泛的环境和气候协变量,但未直接纳入社会经济或行为决定因素,也未在家庭层面测量螺类丰度或详细的水管理实践等潜在相关因素。最后,模型隐含假设家庭或放牧的六边形网格内存在静态暴露,而人类和绵羊均可能在景观中移动,并在其直接居住地或主要放牧地之外感染。因此,生成的风险表面应被解释为感染的环境适宜性,而非感染发生位置的精确重建。
未来的工作应优先考虑在秘鲁和其他国家不同高海拔环境进行多地点验证、跨季节的重复成像,并整合昆虫学和行为学数据,以确认所提出模型的更广泛适用性,并完善其在常规监测中的应用。
结论
这项试点研究表明,在单个安第斯社区内,将无人机捕获的高分辨率环境指数与地形、气候数据以及先进的机器学习模型相结合,可以生成针对人类和绵羊肝片吸虫感染环境适宜性的精细尺度地图。研究一致强调了NDVI等植被指数、水体相关指标、坡度等地形特征以及降水和温度等气候因素在划定潜在寄生虫热点区域中的重要性。集成方法,特别是XGBoost(XGB)和随机森林(RF),在空间交叉验证下成为最可靠的方法,凸显了灵活的非线性模型在捕捉肝片吸虫生态学中复杂相互作用的优势。尽管研究结果是初步的,并受限于规模和样本量,但该框架提供了一个概念验证。如果在更大规模、多地点、多季节的研究中得到验证,该框架可以为实施对环境影响最小的针对性干预措施提供信息,并支持“一体健康”(One Health)策略,以减少传播并改善脆弱安第斯社区的公共卫生结局。

生物通微信公众号
微信
新浪微博


生物通 版权所有