**1. 引言** 蜱虫(Ixodes属)是多种对公共卫生构成重大威胁的病原体的主要传播媒介,包括莱姆病(Eisen, 2020)、蜱传脑炎(TBE)(Dobler et al., 2011)、巴贝西虫病(Zamoto-Niikura et al., 2016)、无形体病(Bakken and Dumler, 2008)和回归热(Krause et al., 2015)。在日本,多种能够传播人类病原体的硬蜱(Ixodidae科)物种是地方性的(Yamaji et al., 2018),其中卵形蜱和蛇形蜱是莱姆病和蜱传脑炎的主要传播媒介。在北海道,这两种蜱虫最为常见,大多数莱姆病和蜱传脑炎病例都发生在该地区(Miyamoto et al., 1992; Yanagihara and Masuzawa, 1997; NIID, 2025)。由于严重发热伴血小板减少综合征(SFTS)的出现,公众对蜱传疾病的认识有所提高,日本每年报告的莱姆病病例数量逐渐增加,自2014年以来感染范围已扩展到北海道以外的地区(NIID, 2025)。最近,在没有旅行史的冲绳、东京和冈山患者中也首次发现了蜱传脑炎病例(Ohira et al., 2023),这凸显了莱姆病和蜱传脑炎对日本其他地区人群的潜在威胁。 气候、栖息地、动物宿主和病原体宿主的可用性之间的相互作用影响着蜱虫及其传播病原体的地方性风险(Humair and Gern, 1998; Moustafa et al., 2016; Sato et al., 2021; Doi et al., 2018; Ito et al., 2024a)。蜱虫是杂食性猎食者,对多种哺乳动物宿主都有捕食行为,这些宿主可以作为蜱传病原体的载体(Kahl and Gray, 2023)。与其他北半球的莱姆病和蜱传脑炎传播媒介相比,卵形蜱和蛇形蜱在寒冷干燥的高海拔环境中具有更强的生存能力,尽管它们在日本不同生态区的地理分布和栖息地适宜性各不相同(Doi et al., 2021a; Ito et al., 2024b; Shimizu et al., 2024)。卵形蜱与多种野生动物宿主相关,广泛分布于日本各地,增加了伯氏疏螺旋体(Borrelia burgdorferi)和蜱传脑炎病毒(TBEV)向人类传播的可能性(Ishiguro et al., 1995; Yoshii, 2017)。随着日本气温持续升高,土地用途的变化(如栖息地破碎化和农业/狩猎社区的减少)促进了新蜱传病原体(如叶藏病毒(Yezo virus)的出现,增加了重要蜱虫宿主和载体的数量和适宜栖息地,从而促进了卵形蜱和蛇形蜱的地理扩散(Doi et al., 2018; Yamaji et al., 2018)。历史上,这两种蜱虫曾在北海道、本州西部(如新潟和福井)、中部(岐阜、长野和福岛)以及四国和九州(爱媛和高知)的高海拔地区(>1700米)被记录到,但其数量随时间有所变化(Takada, 1990; Ishiguro et al., 1992; Miyamoto et al., 1992; Takada et al., 1994; Nakao et al., 1996; Hashimoto et al., 2002; Sato et al., 2021; Ikeda et al., 2025)。最近的蜱虫监测和多项哺乳动物血清学研究也记录了卵形蜱和蛇形蜱以及莱姆病螺旋体和蜱传脑炎病毒在日本境内外的地理分布(Doi et al., 2021a, b; Zamoto-Niikura et al., 2023; Ito et al., 2024a, b)。因此,评估日本其他地区莱姆病和蜱传脑病的潜在地方性状态,并向高风险人群提供更多信息至关重要。 预测建模和机器学习(ML)算法是将流行病学监测与地理空间环境数据相结合的强大工具,可用于预测蜱虫及其相关病原体的潜在分布(Burtis et al., 2022; Kelly et al., 2025; Dagostin et al., 2026)。一些研究已经开发了预测模型来确定日本蜱传疾病的潜在风险区域(Matsuyama et al., 2020; Ogawa et al., 2024),但很少有研究关注卵形蜱或蛇形蜱及其相关病原体,或使用ML方法(Doi et al., 2021a; Ito et al., 2024b)。本研究旨在利用历史蜱虫监测数据和公开的非生物变量,预测日本境内卵形蜱和蛇形蜱的适宜栖息地。本研究的主要目标是:(i)确定每种蜱虫的新潜在地理分布并比较它们的不同生态位;(ii)深入了解哪些地区和人群可能面临更高的莱姆病和蜱传脑炎风险。最终,我们希望帮助识别人们接触受感染蜱虫的风险,以应对日本日益严重的蜱传疾病威胁。
**2. 材料与方法** 2.1. 文献回顾和数据检索 2023年9月1日至2025年2月7日期间,在PubMed和Web of Science数据库中进行了系统文献检索,根据《系统评价和元分析优先报告条目》(Page et al., 2021)的标准,筛选出包含相关蜱虫监测数据的公开研究。使用以下英文和日文关键词字符串检索了1990年1月1日之后发表的日本蜱虫监测研究:(“Japan”[tiab])AND(“Ixodes”[tiab] OR “Ixodid”[tiab] OR “tick”[tiab] OR “ticks”[tiab] OR “persulcatus”[tiab] OR “ovatus”[tiab])。去除重复研究后,由两位独立研究人员评估论文标题和摘要的相关性和全文审查资格。在全文审查过程中还发现了其他参考文献中的蜱虫监测数据。此外,还咨询了日本学术专家以获取更多监测数据。学术专家表示,直到2013年日本首次发现SFTS之前,可用的蜱虫监测数据非常有限。 2.2. 研究纳入标准和数据提取 由两位独立研究人员根据其对公共卫生的重要性、生物学特征、生活史和摄食行为,挑选出包含蜱虫监测数据的符合条件的研究,用于模型构建:卵形蜱(Ixodes ovatus)、蛇形蜱(Ixodes persulcatus)、熊足蜱(Amblyomma testudinarium)、台湾蜱(Dermacentor bellulus)、台湾犬蜱(Dermacentor taiwanensis)、巨刺蜱(Haemaphysalis megaspinosa)、台湾血红蜱(Haemaphysalis formosensis)、黄蜱(Haemaphysalis flava)、日本血红蜱(Haemaphysalis japonica)、山鼠蜱(Haemaphysalis hystricis)、北冈蜱(Haemaphysalis kitaokai)和道格拉斯蜱(Haemaphysalis douglasi)。如果蜱虫通过主动监测(如拖拽或标记相关脊椎动物宿主,或捕捉重要的人类病原体储存宿主的大型哺乳动物)或被动监测(如通过道路尸体或捕捉)获得,则其幼虫或成虫数据被纳入研究。以下情况的研究被排除:(i)监测活动发生在1990年之前;(ii)未提供具体的地点信息(如村庄、城镇、城市或市镇);(iii)无法验证收集时的具体位置;(iv)数据不完整或错误无法纠正。 原始研究和数据来源收集的蜱虫总数(因变量)被提取到一个新的Excel数据文件中,包括以下变量:蜱虫种类、蜱虫生命周期阶段、收集年份、收集方法、收集地点的GPS坐标(如有的话)、城市/市镇以及 prefecture。用于研究的全部数据文件见补充表S1。对于未提供蜱虫监测地点纬度/经度或任何详细信息的研究,通过比较地图中的位置或原始研究报告中最小行政单位的重心(如城市、村庄、区等),手动提取GPS坐标(使用Google Maps)。尽管数据文件中报告的蜱虫收集地点的地理坐标精度不同,但这种方法通过纳入更多的存在/缺失数据和更广泛的地理观察,弥补了潜在的数据异质性,确保了模型训练的充分覆盖率和样本量。 收集了26个与卵形蜱或蛇形蜱生命周期及蜱传病原体地方性传播相关的非生物环境因子的数据,这些数据来自公开数据库,用作模型训练的解释性预测变量(Doi et al., 2018; Doi et al., 2021a; Hoshi et al., 2025; Iijima et al., 2025; Ito et al., 2024b; Shimizu et al., 2024)。日本气象协会提供了1990–2022年的每日天气数据(分辨率1000米;Japan Weather Association, 2024)。日本国土规划与区域政策局提供了1000米分辨率的国家空间规划与区域政策局国家土地数字数据(Japan Meteorological Agency, 2012)。日本环境省的第七次自然环境调查(2005–2009)提供了500米分辨率的14个土地覆盖和栖息地变量(Ministry of the Environment of Japan, 2023)。所有用于模型训练的非生物变量均根据原始数据集中的预定义类别进行分类;没有使用其他分类指标。表1列出了用于开发随机森林机器学习模型以预测日本卵形蜱和蛇形蜱适宜栖息地的26个非生物变量及其来源。
4.3. 利用预测算法评估蜱传疾病风险 蜱传疾病发病率的增加突显了持续监测和公众教育的重要性,以减少人类与感染蜱虫的接触和疾病传播。许多蜱虫监测数据(如公民科学活动收集的数据)和人类病例(由公共卫生部门报告的数据)是滞后指标,无法实时提供风险和疾病负担的信息。预测模型有时可以更高效、更可靠地捕捉重要蜱虫媒介及其相关蜱传病原体的时空趋势,从而优先安排监测工作,识别潜在的风险区域(Bisanzio等人,2020年;Boligarla等人,2023年;Kiryluk等人,2024年)。大多数证明预测模型在识别与蜱传疾病相关的生态特征方面有效的研究都集中在可能导致严重疾病的蜱传病原体上,如SFTSV或Yezo病毒(Ito等人,2024a;Ogawa等人,2024年;Iijima等人,2025年),而较少有研究探讨了Ixodes媒介物种与莱姆病或鞑靼蜱病的环境关联。一些预测蜱虫适宜性的模型可能更倾向于使用多重混合回归或MaxEnt等方法,这些方法因其简单性、有效性和可解释性而受到青睐(Warren和Seifert,2011年;Barbet-Massin等人,2012年;Estrada-Peña和de la Fuente,2024年;Kelly等人,2025年)。我们选择使用随机森林机器学习方法,因为它能够更好地处理来自不同地区的数据带来的潜在偏差,并且能够测量高维数据中的非线性关系,降低过拟合风险。作为一种集成方法,随机森林方法通过平均多棵树的预测结果来减少过拟合并平衡不同输入之间的“噪声”。虽然我们没有使用明确的加权方案,但强大的AUC分数表明模型具有良好的泛化能力,即使数据在空间和时间上存在异质性也是如此。我们通过重新拟合模型来进一步证明随机森林模型的有效性,表明模型具有鲁棒性,不受相关特征存在的影响,从而增强了变量选择过程和模型结果的可靠性。尽管我们的机器学习模型提供了基于各特征重要性的解释性预测因子的排名,但随机森林算法本身不支持线性模型中的正负关联系数。虽然随机森林模型与MaxEnt相比具有优势,但在计算上可能较为复杂。然而,这些方法已被有效用于预测蜱虫媒介的空间分布,突显了每种方法的实用性和局限性(Doi等人,2021a;Kelly等人,2025年)。
**作者贡献声明** Patrick H. Kelly:概念构思、初稿撰写、审稿与编辑、数据分析、数据可视化。 Harrison M. Marick:数据分析、数据可视化、审稿与编辑。 Julie Davis:数据管理、审稿与编辑。 Ai Takano:数据管理、概念构思、分析设计、审稿与编辑。 Kentaro Yoshii:概念构思、审稿与编辑。 Hiroki Kawabata:数据管理、分析设计、审稿与编辑。 Kentaro Itokawa:数据管理、审稿与编辑。 Kozue Sato:数据管理、审稿与编辑。 Alice C.C. Lau:数据管理、审稿与编辑。 Yongjin Qiu:数据管理、审稿与编辑。 Frederick J. Angulo:审稿与编辑。 Andreas Pilz:监督、资金获取、审稿与编辑。 Agustín Estrada-Peña:分析设计、审稿与编辑、数据可视化。 Shuhei Ito:概念构思、审稿与编辑。 Jennifer C. Moïsi:资金获取、监督、审稿与编辑。 Yoshikazu Nakayama:概念构思、数据管理、初稿撰写、审稿与编辑。