综述:通过社交媒体数据和机器学习预测急性呼吸道感染:一项系统评价

时间:2026年2月25日
来源:BMC Medical Informatics and Decision Making

编辑推荐:

本研究系统综述社交媒体数据与机器学习结合预测急性呼吸道感染(ARI)的应用。通过PRISMA指南检索文献,分析数据源、特征提取、算法及评估指标,发现Twitter等平台数据结合回归、支持向量机、集成方法及深度学习可提升预测性能,但存在数据噪声、样本偏差及泛化不足挑战,需进一步优化模型并跨区域验证。

广告
   X   

摘要

背景

急性呼吸道感染(ARI)是全球主要的公共卫生负担,需要及时监测和早期发现以减轻其影响。传统的流行病学监测系统往往存在报告延迟的问题,这促使人们探索结合机器学习技术的替代数据来源,如社交媒体。

方法

本研究对使用社交媒体数据和机器学习模型进行急性呼吸道感染预测的相关文献进行了系统回顾。根据PRISMA(系统评价和荟萃分析的优先报告项目)制定的指南,通过主要科学数据库的结构化搜索来识别相关研究。所选研究被分为四个复杂程度级别,并随后从数据来源、特征提取策略、机器学习算法、评估指标和预测目标等方面进行了分析。

结果

回顾的研究表明,社交媒体平台,特别是Twitter(现名为X),能够提供与急性呼吸道感染发病率相关的有价值信号。研究采用了多种机器学习方法,包括回归模型、支持向量机、集成方法和深度学习方法。总体而言,结果表明,利用社交媒体数据的机器学习模型能够实现具有竞争力的预测性能,通常能够补充或增强传统的监测系统。然而,数据噪声、人口偏差和模型泛化等方面仍存在挑战。

结论

研究结果突显了整合社交媒体数据和机器学习技术用于急性呼吸道感染预测和公共卫生监测的潜力。尽管前景广阔,未来的研究应重点改进数据质量、模型可解释性及鲁棒性,并在不同地理区域和呼吸道疾病中验证这些方法的有效性。

背景

急性呼吸道感染(ARI)是全球主要的公共卫生负担,需要及时监测和早期发现以减轻其影响。传统的流行病学监测系统往往存在报告延迟的问题,这促使人们探索结合机器学习技术的替代数据来源,如社交媒体。

方法

本研究对使用社交媒体数据和机器学习模型进行急性呼吸道感染预测的相关文献进行了系统回顾。根据PRISMA(系统评价和荟萃分析的优先报告项目)制定的指南,通过主要科学数据库的结构化搜索来识别相关研究。所选研究被分为四个复杂程度级别,并随后从数据来源、特征提取策略、机器学习算法、评估指标和预测目标等方面进行了分析。

结果

回顾的研究表明,社交媒体平台,特别是Twitter(现名为X),能够提供与急性呼吸道感染发病率相关的有价值信号。研究采用了多种机器学习方法,包括回归模型、支持向量机、集成方法和深度学习方法。总体而言,结果表明,利用社交媒体数据的机器学习模型能够实现具有竞争力的预测性能,通常能够补充或增强传统的监测系统。然而,数据噪声、人口偏差和模型泛化等方面仍存在挑战。

结论

研究结果突显了整合社交媒体数据和机器学习技术用于急性呼吸道感染预测和公共卫生监测的潜力。尽管前景广阔,未来的研究应重点改进数据质量、模型可解释性及鲁棒性,并在不同地理区域和呼吸道疾病中验证这些方法的有效性。

生物通微信公众号
微信
新浪微博


生物通 版权所有