基于非生物因素,检测日本莱姆病和蜱传脑炎媒介昆虫Ixodes ovatus及Ixodes persulcatus的适宜栖息地

时间:2026年5月16日
来源:Current Research in Parasitology & Vector-Borne Diseases

编辑推荐:

帕特里克·H·凯利 | 哈里森·M·马里克 | 朱莉·戴维斯 | 高野爱 | 吉井健太郎 | 川端广树 | 杉川健太郎 | 佐藤康惠 | 艾丽丝·C·C·刘 | 钱永进 | 安德烈亚斯·皮尔茨 | 奥古斯丁·埃斯特拉达-佩尼亚 | 弗雷德里克·J·安古罗 | 伊藤修平 | 玛乔琳

广告
   X   

帕特里克·H·凯利 | 哈里森·M·马里克 | 朱莉·戴维斯 | 高野爱 | 吉井健太郎 | 川端广树 | 杉川健太郎 | 佐藤康惠 | 艾丽丝·C·C·刘 | 钱永进 | 安德烈亚斯·皮尔茨 | 奥古斯丁·埃斯特拉达-佩尼亚 | 弗雷德里克·J·安古罗 | 伊藤修平 | 玛乔琳·C·莫伊西 | 中山义和
美国辉瑞公司医学事务部、疫苗部门、美国商业部门,宾夕法尼亚州科尔利维尔

**摘要**
在日本,莱姆病和蜱传脑炎(TBE)主要发生在最北部的北海道,该地区的两种主要传播媒介——卵形蜱(Ixodes ovatus)和蛇形蜱(Ixodes persulcatus)数量最多。最近,蜱虫监测活动在日本各地都发现了这两种蜱虫,表明它们所携带的病原体可能会进一步传播。我们利用现有的蜱虫监测和环境数据建立了一个机器学习(ML)模型,以预测卵形蜱和蛇形蜱的适宜栖息地,并识别出日本境内莱姆病和蜱传脑炎的潜在高风险区域。1990年至2023年间有关11种媒介蜱虫出现和数量的数据是通过系统文献检索从两个在线数据库中获取的,或者由当地专家提供的,用于模型开发。经过多次迭代和调整后,分别基于每种蜱虫的出现和数量,使用26个非生物变量(气候和地形因素)训练了针对卵形蜱和蛇形蜱的随机森林(Random Forest)ML算法。从57个来源收集了93,289只蜱虫的数据,这些算法的曲线下面积很高(>0.89)。与气候相关的变量是预测这两种蜱虫分布的最强影响因素(模型重要性超过90%)。研究发现,北海道以及本州中部较凉爽湿润的地区适合这两种蜱虫生存;卵形蜱的生态适用范围比蛇形蜱更广,其在九州中部山区和东京湾周边的适宜程度也较高。我们的ML模型表明,卵形蜱和蛇形蜱的适宜栖息地可能遍布日本,这预示着蜱传病原体带来的风险可能在扩大。

**1. 引言**
蜱虫(Ixodes属)是多种对公共卫生构成重大威胁的病原体的主要传播媒介,包括莱姆病(Eisen, 2020)、蜱传脑炎(TBE)(Dobler et al., 2011)、巴贝西虫病(Zamoto-Niikura et al., 2016)、无形体病(Bakken and Dumler, 2008)和回归热(Krause et al., 2015)。在日本,多种能够传播人类病原体的硬蜱(Ixodidae科)物种是地方性的(Yamaji et al., 2018),其中卵形蜱和蛇形蜱是莱姆病和蜱传脑炎的主要传播媒介。在北海道,这两种蜱虫最为常见,大多数莱姆病和蜱传脑炎病例都发生在该地区(Miyamoto et al., 1992; Yanagihara and Masuzawa, 1997; NIID, 2025)。由于严重发热伴血小板减少综合征(SFTS)的出现,公众对蜱传疾病的认识有所提高,日本每年报告的莱姆病病例数量逐渐增加,自2014年以来感染范围已扩展到北海道以外的地区(NIID, 2025)。最近,在没有旅行史的冲绳、东京和冈山患者中也首次发现了蜱传脑炎病例(Ohira et al., 2023),这凸显了莱姆病和蜱传脑炎对日本其他地区人群的潜在威胁。
气候、栖息地、动物宿主和病原体宿主的可用性之间的相互作用影响着蜱虫及其传播病原体的地方性风险(Humair and Gern, 1998; Moustafa et al., 2016; Sato et al., 2021; Doi et al., 2018; Ito et al., 2024a)。蜱虫是杂食性猎食者,对多种哺乳动物宿主都有捕食行为,这些宿主可以作为蜱传病原体的载体(Kahl and Gray, 2023)。与其他北半球的莱姆病和蜱传脑炎传播媒介相比,卵形蜱和蛇形蜱在寒冷干燥的高海拔环境中具有更强的生存能力,尽管它们在日本不同生态区的地理分布和栖息地适宜性各不相同(Doi et al., 2021a; Ito et al., 2024b; Shimizu et al., 2024)。卵形蜱与多种野生动物宿主相关,广泛分布于日本各地,增加了伯氏疏螺旋体(Borrelia burgdorferi)和蜱传脑炎病毒(TBEV)向人类传播的可能性(Ishiguro et al., 1995; Yoshii, 2017)。随着日本气温持续升高,土地用途的变化(如栖息地破碎化和农业/狩猎社区的减少)促进了新蜱传病原体(如叶藏病毒(Yezo virus)的出现,增加了重要蜱虫宿主和载体的数量和适宜栖息地,从而促进了卵形蜱和蛇形蜱的地理扩散(Doi et al., 2018; Yamaji et al., 2018)。历史上,这两种蜱虫曾在北海道、本州西部(如新潟和福井)、中部(岐阜、长野和福岛)以及四国和九州(爱媛和高知)的高海拔地区(>1700米)被记录到,但其数量随时间有所变化(Takada, 1990; Ishiguro et al., 1992; Miyamoto et al., 1992; Takada et al., 1994; Nakao et al., 1996; Hashimoto et al., 2002; Sato et al., 2021; Ikeda et al., 2025)。最近的蜱虫监测和多项哺乳动物血清学研究也记录了卵形蜱和蛇形蜱以及莱姆病螺旋体和蜱传脑炎病毒在日本境内外的地理分布(Doi et al., 2021a, b; Zamoto-Niikura et al., 2023; Ito et al., 2024a, b)。因此,评估日本其他地区莱姆病和蜱传脑病的潜在地方性状态,并向高风险人群提供更多信息至关重要。
预测建模和机器学习(ML)算法是将流行病学监测与地理空间环境数据相结合的强大工具,可用于预测蜱虫及其相关病原体的潜在分布(Burtis et al., 2022; Kelly et al., 2025; Dagostin et al., 2026)。一些研究已经开发了预测模型来确定日本蜱传疾病的潜在风险区域(Matsuyama et al., 2020; Ogawa et al., 2024),但很少有研究关注卵形蜱或蛇形蜱及其相关病原体,或使用ML方法(Doi et al., 2021a; Ito et al., 2024b)。本研究旨在利用历史蜱虫监测数据和公开的非生物变量,预测日本境内卵形蜱和蛇形蜱的适宜栖息地。本研究的主要目标是:(i)确定每种蜱虫的新潜在地理分布并比较它们的不同生态位;(ii)深入了解哪些地区和人群可能面临更高的莱姆病和蜱传脑炎风险。最终,我们希望帮助识别人们接触受感染蜱虫的风险,以应对日本日益严重的蜱传疾病威胁。

**2. 材料与方法**
2.1. 文献回顾和数据检索
2023年9月1日至2025年2月7日期间,在PubMed和Web of Science数据库中进行了系统文献检索,根据《系统评价和元分析优先报告条目》(Page et al., 2021)的标准,筛选出包含相关蜱虫监测数据的公开研究。使用以下英文和日文关键词字符串检索了1990年1月1日之后发表的日本蜱虫监测研究:(“Japan”[tiab])AND(“Ixodes”[tiab] OR “Ixodid”[tiab] OR “tick”[tiab] OR “ticks”[tiab] OR “persulcatus”[tiab] OR “ovatus”[tiab])。去除重复研究后,由两位独立研究人员评估论文标题和摘要的相关性和全文审查资格。在全文审查过程中还发现了其他参考文献中的蜱虫监测数据。此外,还咨询了日本学术专家以获取更多监测数据。学术专家表示,直到2013年日本首次发现SFTS之前,可用的蜱虫监测数据非常有限。
2.2. 研究纳入标准和数据提取
由两位独立研究人员根据其对公共卫生的重要性、生物学特征、生活史和摄食行为,挑选出包含蜱虫监测数据的符合条件的研究,用于模型构建:卵形蜱(Ixodes ovatus)、蛇形蜱(Ixodes persulcatus)、熊足蜱(Amblyomma testudinarium)、台湾蜱(Dermacentor bellulus)、台湾犬蜱(Dermacentor taiwanensis)、巨刺蜱(Haemaphysalis megaspinosa)、台湾血红蜱(Haemaphysalis formosensis)、黄蜱(Haemaphysalis flava)、日本血红蜱(Haemaphysalis japonica)、山鼠蜱(Haemaphysalis hystricis)、北冈蜱(Haemaphysalis kitaokai)和道格拉斯蜱(Haemaphysalis douglasi)。如果蜱虫通过主动监测(如拖拽或标记相关脊椎动物宿主,或捕捉重要的人类病原体储存宿主的大型哺乳动物)或被动监测(如通过道路尸体或捕捉)获得,则其幼虫或成虫数据被纳入研究。以下情况的研究被排除:(i)监测活动发生在1990年之前;(ii)未提供具体的地点信息(如村庄、城镇、城市或市镇);(iii)无法验证收集时的具体位置;(iv)数据不完整或错误无法纠正。
原始研究和数据来源收集的蜱虫总数(因变量)被提取到一个新的Excel数据文件中,包括以下变量:蜱虫种类、蜱虫生命周期阶段、收集年份、收集方法、收集地点的GPS坐标(如有的话)、城市/市镇以及 prefecture。用于研究的全部数据文件见补充表S1。对于未提供蜱虫监测地点纬度/经度或任何详细信息的研究,通过比较地图中的位置或原始研究报告中最小行政单位的重心(如城市、村庄、区等),手动提取GPS坐标(使用Google Maps)。尽管数据文件中报告的蜱虫收集地点的地理坐标精度不同,但这种方法通过纳入更多的存在/缺失数据和更广泛的地理观察,弥补了潜在的数据异质性,确保了模型训练的充分覆盖率和样本量。
收集了26个与卵形蜱或蛇形蜱生命周期及蜱传病原体地方性传播相关的非生物环境因子的数据,这些数据来自公开数据库,用作模型训练的解释性预测变量(Doi et al., 2018; Doi et al., 2021a; Hoshi et al., 2025; Iijima et al., 2025; Ito et al., 2024b; Shimizu et al., 2024)。日本气象协会提供了1990–2022年的每日天气数据(分辨率1000米;Japan Weather Association, 2024)。日本国土规划与区域政策局提供了1000米分辨率的国家空间规划与区域政策局国家土地数字数据(Japan Meteorological Agency, 2012)。日本环境省的第七次自然环境调查(2005–2009)提供了500米分辨率的14个土地覆盖和栖息地变量(Ministry of the Environment of Japan, 2023)。所有用于模型训练的非生物变量均根据原始数据集中的预定义类别进行分类;没有使用其他分类指标。表1列出了用于开发随机森林机器学习模型以预测日本卵形蜱和蛇形蜱适宜栖息地的26个非生物变量及其来源。

**表1. 用于预测日本卵形蜱和蛇形蜱栖息地适宜性的26个非生物变量及其来源**
**类别** | **子类别** | **变量** | **预测指标** | **时间范围** | **尺度(米)**
| --- | --- | --- | --- | --- | --- | --- | --- | --- |
| 气候 | 年平均全球太阳辐射 | 1990–2022 | 1000 | 年平均总日照小时 | 1990–2022 | 1000 |
| 降水 | 年降水量 | 1990–2022 | 1000 | 12月最大降雪量 | 1990–2022 | 1000 |
| 温度 | 年最高温度 | 1990–2022 | 1000 | 年最低温度 | 1990–2022 | 1000 |
| 3月平均温度 | 1990–2022 | 1000 | 1月最低温度 | 1990–2022 | 1000 |
| 年平均温度 | 1990–2022 | 1000 | 6月最高温度 | 1990–2022 | 1000 |
| 地形 | 海拔 | 2012 | 1000 | 土地覆盖 | 2005–2009 | 500– |
| – 建筑区 | 2005–2009 | 500– | – 常绿针叶林 | 2005–2009 | 500– |
| – 落叶阔叶林 | 2005–2009 | 500– | – 常绿阔叶林 | 2005–2009 | 500– |
| – 农田 | 2005–2009 | 500– | – 水田 | 2005–2009 | 500– |
| – 草地 | 2005–2009 | 500– | – 落叶针叶林 | 2005–2009 | 500– |
| – 裸地 | 2005–2009 | 500– | – 水体 | 2005–2009 | 500– |
| – 竹林 | 2005–2009 | 500– | – 太阳能板 | 2005–2009 | 500– |
| – 无数据 | 2005–2009 | 500– | – 未分类 | 2005–2009 | 500– |
2.3. 数据处理和机器学习算法开发
提取的蜱虫种类相关地理坐标被整理并绘制到相应的市镇上,然后根据原始研究中的报告坐标验证其准确性。如果这些坐标仍被认为是错误报告的,那么这些坐标将被映射到市政区和县中心点土地坐标的正确位置。所有与26个解释变量相对应的环境栅格文件在特征提取之前都被统一到一个共同的目标网格上。我们使用了0.005°(约500米)的目标分辨率和一个覆盖整个日本的共同地理范围。对于最初以较粗分辨率(例如1000米气候/地形)获得的预测因子,通过将每个目标单元格的值设置为最近源单元格的值(最近邻)来将其映射到目标网格上。这种方法保留了原始值,并避免了引入插值极端值,同时确保所有预测因子都在同一网格上对齐以进行模型训练。所有的数据协调和可视化都是使用Python 3.9(2020年10月5日发布;https://www.python.org/downloads/release/python-390/)完成的。我们采用了随机森林机器学习模型,因为它在处理来自多个来源的具有异构数据的解释变量特征之间的非线性关系和交互方面具有鲁棒性(Auret和Aldrich,2012年)。具体来说,随机森林机器学习模型通过聚合在自举子集上训练的多个决策树的预测结果来帮助减轻对特定数据集或研究的过拟合风险,从而减少任何单一数据源的影响,并与其他无法处理非线性关联的预测建模方法相比提高泛化能力。为了考虑它们与日本气候和景观的独特关系,分别为I. ovatus和I. persulcatus开发了单独的模型。所有机器学习模型的开发,包括特征缩放、随机森林分类、超参数调整和空间输出投影,都是使用Python 3.9和scikit-learn(版本1.2.2;https://scikit-learn.org)(Pedrogosa等人,2011年)完成的。为了考虑提取的出现地点分布不均和每种蜱虫数量的不同,我们在模型开发过程中引入了伪缺失点。伪缺失是预测建模研究中的一种常见分析方法,它可以更均匀地空间分布数据集并更好地平衡训练数据集,从而减少对报告存在地点的过拟合并提高模型性能(Walter等人,2020年;Noll等人,2023年;Kelly等人,2025年)。在日本各地随机分布了伪缺失点,使得“伪缺失”点的数量等于提取的I. ovatus或I. persulcatus“出现”点的数量,以最小化任何蜱虫监测数据观察报告的数量增加所带来的过拟合风险。对于I. ovatus或I. persulcatus,伪缺失点是从没有记录到该物种个体的网格单元格中选出的。这种方法允许模型对没有报告该蜱虫物种出现的位置进行采样,并确保分类器学会区分存在和不存在的位置,同时尽可能减少监测偏差的影响。然后根据26个环境变量和(i)与每个地点相关的每种蜱虫的“出现”数据;以及(ii)在该地点收集的蜱虫观察数量,使用随机森林机器学习算法在500米的空间分辨率下进行I. ovatus或I. persulcatus的预测空间适宜性评估,以便X个蜱虫的观察在这些GPS位置被发现,从而在模型训练期间使观察到的蜱虫数量成比例地贡献(例如,每种蜱虫在出现地点的存在量);相对于模型中引入的伪缺失点。训练过程包括超参数调整,其中调整了模型深度,以平衡整体复杂性和泛化能力,确保与未见数据的最优泛化(例如,预测栖息地适宜性与解释变量之间的非线性关联)。我们重点调整了最大树深度的超参数,因为这是影响随机森林模型过拟合和欠拟合的主要因素(Schratz等人,2019年)。最小样本出现/数量阈值以分割节点的超参数、最小树的数量以及在每次分割时考虑的最大特征数量保持默认值,因为超过某个阈值的树数量通常会带来递减收益,同时显著增加计算成本(Probst等人,2019年)。通过限制树的深度,我们旨在减少过拟合的可能性,同时保持强大的预测准确性。

2.4. 特征选择、预测输出和算法性能评估
特征选择对于提高模型的可解释性和减少解释变量之间的多重共线性偏差至关重要。用于建模的最终变量子集是使用皮尔逊相关系数阈值R = 0.95和统计显著性阈值P = 0.01来确定的,以识别相关的成对解释变量。计算特征重要性的一种主要方法是基于随机森林树中特征的平均分裂增益的平均纯度降低(MDI)。排列重要性被用作次要特征重要性指标,以评估通过MDI确定的变量排名的一致性。整个特征选择过程确保只有最相关的预测因子对最终分类有贡献。通过将土地覆盖和栖息地变量进行编码,将它们在后处理中聚合成单独的“分类”土地覆盖变量,并计算与每个类别频率成比例的加权平均分数来评估特征重要性。这种方法仅用于报告特征重要性的总体贡献,同时将类别级别的预测因子保留在模型中。任何具有特征重要性分数=0的变量都被从模型中删除。训练好的模型生成了概率分数,指示不同地理区域对蜱虫存在的适宜性。使用分布在日本的200,000个点的子样本来为每个模型生成基于点的热图。

为了减少由于空间自相关导致的性能膨胀,我们使用了空间分层的交叉验证,其中行政区被视为一个组(Pascoe等人,2019年)。将行政区划分为十个(10%)折叠,在每次迭代中,保留的折叠中的所有出现记录都从模型拟合中省略,仅用于评估。这种基于组的分割减少了测试和训练之间的空间泄漏,因为同一行政区内的相邻点不会被分配到不同的折叠中。主要的评估指标是曲线下面积(AUC),它评估了模型区分目标物种存在和不存在位置的能力。AUC在行政区级别计算,如果一个行政区至少有30只蜱虫存在,则定义该行政区为Ixodes spp.的适宜区(Estrada-Peña等人,2018年)。为了构建AUC,我们使用10折交叉验证将每个行政区的状态与该行政区内最大的预测风险值进行比较,以保持空间精度并避免由于数据有限而导致的过拟合。这种行政区级别的方法有助于减轻空间自相关,并减少了监测偏差的影响,其中未采样的点可能被错误地视为真正的缺失。我们将预测结果汇总到行政区级别进行评估,因为这种空间尺度提供了一个实用且可操作的空间单元,并减少了点级采样密度和监测异质性的敏感性。

最后,为了评估模型稳定性并考虑到基于MDI的相关变量之间特征重要性排名的潜在稀释(由于它们的特征重要性贡献可能分布在多个变量上)(Pudjihartono等人,2022年),我们使用不同的随机种子重新运行了完整的建模流程十次,同时保持相同的特征集和交叉验证策略。在多次重复中,我们总结了AUC的变异性(平均值和范围和/或标准差)并评估了预测因子重要性排名的一致性(例如,特征重要性向量在运行中的Spearman等级相关性)。我们还定性地比较了结果中的适宜性表面,以确认高适宜性区域对自助抽样和树构建的随机变化具有鲁棒性。

3. 结果
3.1. 数据摘要
系统文献回顾的结果提供在(图1)中。在去除重复项后,通过搜索字符串从在线数据库中检索到了1089项研究;其中,40项符合纳入标准。另外从25项研究中或由当地专家提供的记录中提取了17项研究的数据,总共包括57项研究(补充表S2)。从1991年到2023年收集了总共93,829只来自11个物种的蜱虫(表2,图2A)。收集到的最丰富的物种是H. flava(n = 45,198),其次是I. ovatus(n = 18,210)和I. persulcatus(n = 11,000)(图2A)。数据集中超过一半的蜱虫是成虫(n = 58,710),相对于若虫(n = 32,891)(表2)。几乎所有(96.1%)的蜱虫是通过主动拖拽或标记(n = 55,865)或动物诱捕(n = 34,350)收集的,而其余的(n = 3614)是通过被动动物收集的,包括路杀(n = 471)或动物诱捕(n = 3143)(表3)。日本47个县中有32个(68%)被包括在内,其中神奈川县(n = 32,129)和北海道县(n = 24,878)的蜱虫总数最多(表4)。从29个县收集了I. ovatus的数据,从14个县收集了I. persulcatus的数据;这两个物种在北海道的总数最多,分别为11,070只和8,839只。为模型提取的I. ovatus和I. persulcatus的地点和数量分别如图2B所示,另外还提供了提取的九种非Ixodes物种的出现情况作为补充信息(补充图S1)。

下载:下载高分辨率图片(492KB)
下载:下载全尺寸图片

图1. 系统文献回顾的研究和数据来源开发流程图。

表2. 为分析提取的每个生命周期阶段和物种的蜱虫个体总数。
物种 若虫 成虫 未报告
Ixodes ovatus 60 17,211 93 18,210
Ixodes persulcatus 14 44 86 87 11,000
Haemaphysalis flava 19 42 26,156–45,198
Haemaphysalis formosensis 8 10 68 9–89 15
Haemaphysalis megaspinosa 29 49 128 91 100
Haemaphysalis kitaokai–24 18 24 18
Haemaphysalis japonica 43 51 64 21 18
Haemaphysalis hystricis 31 23 31–64 3
Haemaphysalis douglasi 13 12 10 24 2
Amblyomma testudinarium 54 98–63 8
Dermacentor taiwanensis 24 5–47 3
总计 32,891 58,710 22 89 3,829

下载:下载高分辨率图片(483KB)
下载:下载全尺寸图片

图2. 1990–2023年通过系统文献回顾提取的日本11种蜱虫媒介物种的监测数据摘要。数据被汇总到一个数据库中,用于预测Ixodes ovatus和Ixodes persulcatus的栖息地适宜性。A. 提供了在随机森林机器学习(ML)算法开发过程中为每个物种提取的个体蜱虫总数。B. 显示了作为ML输入的Ixodes ovatus(蓝色)和Ixodes persulcatus(红色)的出现和数量数据(数据可能不准确)。注意:圆圈的中心对应于蜱虫监测收集地点的大致位置,圆圈的大小表示与收集和分析的蜱虫总数相关的大致数量。

表3. 通过主动和被动监测方法为十一种媒介物种收集的个体蜱虫总数。
蜱虫物种 主动 被动 总计
拖拽/标记 动物诱捕 总计 动物诱捕 路杀
Ixodes ovatus 15,494 22 73 17,767 44 43 18,210
Ixodes persulcatus 10,289 17 11 46 54 54 11,000
Haemaphysalis flava 13,189 31 58 44 77 31 44 25 45,198
Haemaphysalis formosensis 8 89 13 89 15
Haemaphysalis megaspinosa 29 49 12 89 10 33 8
Haemaphysalis kitaokai 24 18 24 18 24
Haemaphysalis japonica 43 51 64 21 18 18
Haemaphysalis hystricis 31 23 31–64 3
Haemaphysalis douglasi 13 12 10 24 24
Amblyomma testudinarium 54 98–63 8 63 8

表4. 1990–2023年从日本各县提取的每种蜱虫的个体总数。
县 I. ovatus I. persulcatus H. flava H. formosensis H. megaspinosa H. kitaokai H. japonica H. hystricis H. douglasi A. testudinarium
神奈川 14 73 1,601 30 55 62 11 13 22 12 14 72 19
北海道 11 10 37 96 51 19 13 14 72 24 83 27 24
长崎 9 11 37 59 65 19 13 12 14 72 25 18
新潟 13 44 25 29 26 37 24 32 9
鹿儿岛 27 11 61 96 19 13 12 14 72 24
佐贺 19 67 34 23 12 18 11 60 34 18 11 42
长野 10 26 11 37 56 10 37 18 18 42
东京 24 78 11 73 16 54 19 16 54
茨城县 41 52 16 62 71 16 19 27 16 29 14
岛根 21 53 68 27 26 29 14 84
福冈 10 53 33 13 8 9 21 9 13 64 12 9
福井 25 91 10 83 72 11 65 17 11 29 35
奈良 22 40 65 9 18 47 89 15
熊本 23 43 67 18 34 21 9 19 13 29 38
宫城县 10 25 92 79 21 19 24 79 21 32
山口 28 92 67 12 49 19 24 79 21 35
大分 19 35 61 13 22 19 24 78 15 22 19
京都 88 53 61 13 10 30 31 36 14 93 82
福岛 92 12 17 13 29 12 9 14 29 12 93 89

3.2. 模型性能和与适宜性相关的变量
为每个Ixodes蜱虫物种开发了四个随机森林模型,采用不同的数据纳入标准和算法训练程序来确定最适合栖息地适宜性预测的模型。仅包括存在数据的模型表现最差(AUC < 0.76),而同时包括存在和数量数据的模型表现更好(AUC > 0.81)(补充表S3)。最终,选择的表现最好的模型结合了所有潜在收集方法(蜱虫拖拽或标记、动物诱捕和被动所有与气候相关的预测因子(n = 11)在模型中的适宜性排名上均超过了与土地覆盖相关的预测因子(n = 8)(基于MDI和排列重要性两种特征重要性指标)。然而,对于每种物种来说,排名和模型贡献度有所不同(见补充表S4)。温度相关变量(n = 7)占了排名前七的六个位置,并为I. persulcatus的适宜性模型贡献了近三分之二的预测能力(0.640),但在I. ovatus的模型贡献中占比不到一半(0.477)(见图3A)。相反,降水变量(n = 3)和日照变量(n = 2)对I. ovatus适宜性模型的贡献更大(分别为0.286和0.150),而对I. persulcatus的贡献则较小(分别为0.188和0.120)(见图3A)。单独来看,I. persulcatus适宜性的最高排名预测因子是“6月最高温度”(0.177),而在I. ovatus中这一预测因子的排名最低(第12位,0.049)(见图3B)。“年降水量”(0.146)是I. ovatus的最佳预测因子,其次是“1月最低温度”(0.116)和“年最高温度”(0.099)。“海拔”在两个模型中的预测能力都较低(< 0.055),同样,集体土地覆盖变量(n = 7)的预测能力也较低(< 0.035)(见图3A和B)。关于所有非生物变量对I. ovatus和I. persulcatus栖息地适宜性的特征重要性的详细结果,请参阅补充信息(补充表S4)。

下载:下载高分辨率图片(376KB)
下载:下载全尺寸图片
图3. Ixodes ovatus和Ixodes persulcatus适宜性的个体(A)和分类(B)非生物特征重要性。最终模型中包含的19个非生物变量根据它们在随机森林机器学习算法中的特征重要性进行了排序。在特征选择过程中被排除或未对最终模型做出贡献的变量未显示。

3.3. 日本I. ovatus和I. persulcatus的预测栖息地适宜性
对于I. ovatus,模型预测其在北海道南部和东部地区、本州中部以及新潟和富山北部地区以及岐阜北部周围的石川和长野的山区具有高度适宜的栖息地(见图4A)。此外,在神奈川和千叶以外的横滨县和静冈县也预测到了零星适宜区域。对于I. ovatus,在本州南部沿海的兵库、鸟取和岛根以及九州中部的大分、熊本和宫崎之间也预测到了中等适宜性(见图4A)。对于I. persulcatus,模型预测其在北海道大部分地区具有高度适宜性,而在札幌南部半岛则有中等适宜性(见图4B)。长野中部山区以及岐阜和富山之间的交界地区以及山梨北部也有较高的适宜性预测值,这些地区的适宜性分布较为分散(见图4B)。

下载:下载高分辨率图片(747KB)
下载:下载全尺寸图片
图4. 日本Ixodes ovatus(A)和Ixodes persulcatus(B)的预测栖息地适宜性。输出结果是根据19个非生物变量使用随机森林机器学习算法得出的。

4. 讨论
4.1. 结果总结
我们利用机器学习算法预测了I. ovatus和I. persulcatus的适宜栖息地,并确定了预测其适宜栖息地的非生物因素。我们的分析表明,I. ovatus在北海道以外的地区也有适宜的栖息地,其分布范围更广,主要分布在本州东海岸温度较高、降水量较大的地区;而I. persulcatus则更偏好本州中部海拔较高、气候较冷且干燥的环境。I. ovatus更可能出现在九州的热带地区,这一点得到了大分县首次报告的莱姆病和鞑靼蜱病病例的支持(Ohira等人,2023年;NIID,2025年;Ohira等人,2025年)。我们的结果表明,I. ovatus和I. persulcatus可能在日本更广泛分布,从而将莱姆病和鞑靼蜱病的风险扩展到北海道以外的其他县。全球范围内,Ixodes属蜱虫主要栖息在森林中,在炎热、干燥的气候条件下极易干燥死亡,这限制了它们在低纬度地区的生存,只能在云量较多、温度较低的较高海拔地区生存(Kahl和Gray,2023年)。我们的模型进一步证实了这一生物学特性:在北海道(日本最冷的地区)和本州中部的高海拔山区,这两种蜱虫的适宜性均超过60%。在长野县,随着云量增加和温度降低,适宜性也有所提高;在富山和新潟,尽管I. persulcatus的种群在当地较为常见,但适宜性预测值较低(Miyamoto等人,2000年;Ishiguro等人,2005年)。然而,我们的模型在九州的热带地区也发现了I. ovatus的适宜栖息地,这与近年来报道的莱姆病病例增加有关(Ohira等人,2023年;Hoshi等人,2025年;Ohira等人,2025年)。此外,神奈川、东京和千叶县的海岸线这些预计适宜性高于预期的地区也属于I. ovatus的适宜栖息地,这与另一项使用气候、土地覆盖和宿主物种变量开发的最大熵(MaxEnt)模型的预测结果相似(Doi等人,2021a)。这三个县此前也报告了人类感染莱姆病的病例,表明当地存在并持续存在B. burgdorferi感染的蜱虫媒介(NIID,2025年)。I. ovatus在日本的广泛适宜性表明其生态位更广,相对于I. persulcatus具有潜在的竞争优势。最近的研究表明,由于气候变化,近二十年来在北海道被I. ovatus叮咬的莱姆病患者比例正在增加(Hashimoto等人,2002年;Sasaki等人,2021年)。总体而言,这些结果强调了理解I. ovatus和I. persulcatus的地理分布和生物学差异对于更好地开展日本蜱传疾病公共卫生监测的重要性。

4.2. 蜱虫媒介和蜱传疾病在日本的发展潜力
I. ovatus和I. persulcatus在日本分布范围的扩大也得到了其他蜱传疾病(如日本斑点热)的扩散以及多种新型蜱传病原体的出现的支持(Matsumoto等人,2018年;Sasaki等人,2021年;Ohira等人,2023年;Kumar等人,2024年;Ogawa等人,2024年;Ikeda等人,2025年)。其中最值得注意的是SFTS病毒(SFTSV),该病毒在2013年至2017年间导致了303例SFTS病例,病死率接近30%(Kobayashi等人,2020年)。本研究提取了几种携带SFTSV的蜱虫物种的数据,如A. testudinarium、H. flava和H. megaspinosa。然而,由于H. longicornis主要以家养动物为食,与其他潜在媒介以及I. ovatus和I. persulcatus的饮食习惯不符(Hayasaka等人,2015年;Matsumoto等人,2018年),因此没有收集到关于该物种的数据。重要的是,像SFTS和日本斑点热这样的潜在致命蜱传疾病的出现使得公众意识到了蜱传疾病的重要性,突显了长期监测蜱虫物种地理分布和数量变化的重要性,以便及时发现新的威胁。随着全球气候变化导致的温度升高,重要的蜱虫媒介(如北美莱姆病的主要媒介Ixodes scapularis)的活跃觅食期可能会延长,从而增加其生存机会或加速生命周期(Ogden等人,2018年)。破碎的森林和特定的栖息地生态过渡带也可能间接促进蜱传疾病的流行,因为它们为具有高病原体载量的动物(如小型啮齿动物)提供了理想的栖息地,从而加剧了蜱传病原体的传播(Moustafa等人,2016年;Takano等人,2011年)。随着气候变化在日本的持续,这些趋势可能会加剧,导致蜱传疾病的地理范围和发病率增加。需要在日本持续进行长期和区域的I. ovatus和I. persulcatus监测,以了解生态变化如何影响蜱传疾病的地理分布和流行情况,从而支持适应性的公共卫生策略。

4.3. 利用预测算法评估蜱传疾病风险
蜱传疾病发病率的增加突显了持续监测和公众教育的重要性,以减少人类与感染蜱虫的接触和疾病传播。许多蜱虫监测数据(如公民科学活动收集的数据)和人类病例(由公共卫生部门报告的数据)是滞后指标,无法实时提供风险和疾病负担的信息。预测模型有时可以更高效、更可靠地捕捉重要蜱虫媒介及其相关蜱传病原体的时空趋势,从而优先安排监测工作,识别潜在的风险区域(Bisanzio等人,2020年;Boligarla等人,2023年;Kiryluk等人,2024年)。大多数证明预测模型在识别与蜱传疾病相关的生态特征方面有效的研究都集中在可能导致严重疾病的蜱传病原体上,如SFTSV或Yezo病毒(Ito等人,2024a;Ogawa等人,2024年;Iijima等人,2025年),而较少有研究探讨了Ixodes媒介物种与莱姆病或鞑靼蜱病的环境关联。一些预测蜱虫适宜性的模型可能更倾向于使用多重混合回归或MaxEnt等方法,这些方法因其简单性、有效性和可解释性而受到青睐(Warren和Seifert,2011年;Barbet-Massin等人,2012年;Estrada-Peña和de la Fuente,2024年;Kelly等人,2025年)。我们选择使用随机森林机器学习方法,因为它能够更好地处理来自不同地区的数据带来的潜在偏差,并且能够测量高维数据中的非线性关系,降低过拟合风险。作为一种集成方法,随机森林方法通过平均多棵树的预测结果来减少过拟合并平衡不同输入之间的“噪声”。虽然我们没有使用明确的加权方案,但强大的AUC分数表明模型具有良好的泛化能力,即使数据在空间和时间上存在异质性也是如此。我们通过重新拟合模型来进一步证明随机森林模型的有效性,表明模型具有鲁棒性,不受相关特征存在的影响,从而增强了变量选择过程和模型结果的可靠性。尽管我们的机器学习模型提供了基于各特征重要性的解释性预测因子的排名,但随机森林算法本身不支持线性模型中的正负关联系数。虽然随机森林模型与MaxEnt相比具有优势,但在计算上可能较为复杂。然而,这些方法已被有效用于预测蜱虫媒介的空间分布,突显了每种方法的实用性和局限性(Doi等人,2021a;Kelly等人,2025年)。

4.4. 局限性
尽管如此,我们的分析也存在一些局限性。首先,我们意识到用于模型开发的数据集存在数据异质性和方差增大,这在元分析中是常见的(Kriston,2013年)。用于模型训练的蜱虫监测数据是由多项研究在较长时间内使用不同方法收集的。尽管通过在线数据库的广泛搜索词、参考文献回顾以及项目合作伙伴提供的数据进行了研究识别,但仍有可能遗漏相关数据。在日本交通不便的地区,如本州北部(该地区被认为是I. persulcatus的适宜栖息地,NIID,2025年),可用的蜱虫监测数据较为匮乏,这导致模型在预测全国类似栖息地的适宜性时存在局限性。此外,一些原始研究未能满足纳入标准,因为尽管某些研究提供了地理坐标,但我们无法验证这些蜱虫监测的收集地点,而这些坐标本可以提高模型的精确度。模型偏差也可能由于将I. ovatus或I. persulcatus误识别为其他蜱虫物种(如Ixodes nipponensis)而产生,后者具有不同的生态偏好和宿主 feeding 习惯(Kitaoka和Saito,1967年)。另外,一些关于I. ovatus或I. persulcatus的提取数据来自并不适合这两种蜱虫生存的地区,例如东京大都市区较热的气候环境,因此需要通过更多的蜱虫监测研究来确认当地是否存在繁殖的蜱虫种群。我们的机器学习算法也可能受益于结合其他蜱虫物种的流行病学监测数据以及人类莱姆病和蜱传脑炎(TBE)的病例报告。由于临床检测试剂盒在诊断TBE或莱姆病方面的能力不足,人类流行病学监测数据的获取受到限制,这增加了在全国范围内开展监测的难度,并降低了我们对这两种疾病地理分布的了解(Ohira等人,2023年,2025年)。然而,我们注意到,当排除那些与I. ovatus和I. persulcatus在物候特征、寻找宿主行为和 feeding 偏好方面差异较大的其他蜱虫物种相关的输入数据时,模型的表现仍然较好(Kitaoka和Saito,1967年;Yamane等人,2006年)。我们认识到,仅凭蜱虫的存在数据就可以预测动物物种的栖息地适宜性,而不需要考虑其出现比例,这可以减少数据偏差,但由于缺乏足够的I. ovatus和I. persulcatus数据,我们的模型无法进行准确的预测。此外,我们的模型使用的数据在空间尺度上不一致,且提取的地理坐标精度也有差异,这些数据基于原始研究中提供的信息。重要的是,我们成功协调了不同变量和研究之间的数据,因为在涉及欧洲(Kelly等人,2025年)和美国(Burtis等人,2022年)等广阔地区的蜱传疾病预测研究中,通常会纳入具有不同空间尺度的变量和数据作为输入。尽管这些模型输出可能存在不确定性增加的风险,但我们认为结合来自多个研究的数据(这些研究具有不同的收集方法、空间和时间尺度)是一个实际可行的折中方案,因为它能够在训练机器学习算法时确保足够的地理覆盖范围和样本量,从而克服数据偏差带来的潜在问题。最后,尽管非生物变量对蜱虫生态系统很重要并且适合作为预测变量,但由于日本环境部提供的哺乳动物物种分布数据的空间尺度较大(25平方公里的网格单元),我们没有纳入生物变量(如蜱虫的脊椎动物宿主和宿主库的分布),因为我们认为这种分辨率不足以纳入模型。然而,我们也认识到,如其他关于日本蜱传疾病的研究所示(Ito等人,2024a,b),纳入生物变量可能会大大增强模型的预测能力。不同的蜱虫媒介物种具有不同的宿主偏好和 feeding 习惯,因此我们希望在模型开发中纳入某些宿主物种的预期分布。未来的模型迭代将同时考虑重要蜱虫宿主和宿主库物种的时间动态预期分布以及相关非生物变量,以进一步提高对I. ovatus、I. persulcatus及其他重要蜱虫媒介物种的栖息地适宜性的预测能力。

**结论**

总之,这项研究表明,日本适合蜱虫媒介的栖息地可能比之前认为的更为广泛,表明它们仍在持续地理扩张。我们的发现体现了机器学习方法在理解I. ovatus和I. persulcatus的分布和生态驱动因素方面的价值。继续开展跨学科研究对于应对日益严重的蜱传疾病挑战至关重要,特别是在气候变化的情况下。加强预测建模和公共卫生响应可以提高风险评估、准备工作和预防措施,从而更好地控制莱姆病、蜱传脑炎等蜱传疾病在日本的发生。

**未引用的参考文献**
日本环境省,2023年。

**伦理批准**
不适用。

**作者贡献声明**
Patrick H. Kelly:概念构思、初稿撰写、审稿与编辑、数据分析、数据可视化。
Harrison M. Marick:数据分析、数据可视化、审稿与编辑。
Julie Davis:数据管理、审稿与编辑。
Ai Takano:数据管理、概念构思、分析设计、审稿与编辑。
Kentaro Yoshii:概念构思、审稿与编辑。
Hiroki Kawabata:数据管理、分析设计、审稿与编辑。
Kentaro Itokawa:数据管理、审稿与编辑。
Kozue Sato:数据管理、审稿与编辑。
Alice C.C. Lau:数据管理、审稿与编辑。
Yongjin Qiu:数据管理、审稿与编辑。
Frederick J. Angulo:审稿与编辑。
Andreas Pilz:监督、资金获取、审稿与编辑。
Agustín Estrada-Peña:分析设计、审稿与编辑、数据可视化。
Shuhei Ito:概念构思、审稿与编辑。
Jennifer C. Moïsi:资金获取、监督、审稿与编辑。
Yoshikazu Nakayama:概念构思、数据管理、初稿撰写、审稿与编辑。

**数据可用性**
本研究使用的所有数据均在文章及其补充文件中进行了描述和提供。

**利益冲突声明**
Patrick H. Kelly、Andreas Pilz、Frederick J. Angulo、Shuhei Ito、Jennifer C. Moïsi和Yoshikazu Nakayama是辉瑞公司的员工,可能持有该公司的股票和/或期权。Harrison M. Marick、Agustín Estrada-Peña和Julie Davis是辉瑞公司的受薪顾问,参与了本手稿的编写工作。辉瑞公司拥有一种蜱传脑炎疫苗(FSME-IMMUN©/Ticovac©)。其他作者声明他们没有已知的财务利益或个人关系可能会影响本文的研究结果。作为联合编辑,Agustín Estrada-Peña未参与本文的同行评审,并未获取有关其同行评审的信息。本文的整个编辑过程由Aneta Kostadinova教授负责。

**资助**
本研究由辉瑞公司赞助。

生物通微信公众号
微信
新浪微博


生物通 版权所有