低成本传感器数据融合:系统性文献综述

时间:2026年1月19日
来源:Information Fusion

编辑推荐:

本文针对环境监测中低成本传感器(LCS)数据融合这一新兴领域,首次进行了系统性文献综述。研究团队遵循PRISMA框架,分析了82篇同行评审文献,系统梳理了当前主流的融合方法(如地统计和机器学习)、主要应用场景(以空气质量监测为主)及面临的关键挑战(如不确定性量化)。该综述为资源受限环境下实现高精度环境监测提供了方法论指导,对推动公民科学和智慧城市发展具有重要意义。

广告
   X   

在城市化进程加速和气候变化挑战日益严峻的背景下,对城市环境进行高精度、广覆盖的监测变得至关重要。传统环境监测依赖于数量有限、成本高昂的法规级监测站,虽然数据质量高,但空间分辨率粗糙,难以支撑社区级别的暴露评估,限制了其在精细化环境管理中的应用。近年来,随着计算技术、传感器技术和无线通信技术的进步,低成本传感器(Low-Cost Sensor, LCS)应运而生。这些传感器价格低廉、易于部署,使得大规模、高密度的环境监测网络成为可能,为公民科学和社区参与环境治理打开了新的大门。然而,LCS也面临着数据质量不稳定、易受环境干扰、存在校准漂移等挑战。单个LCS的数据往往可靠性不足,如何有效整合来自LCS、法规级站点、卫星遥感、社交媒体等多源异构数据,形成可靠、统一的环境态势感知,成为亟待解决的关键科学问题。数据融合(Data Fusion, DF)技术正是解决这一挑战的核心手段,它致力于研究如何自动或半自动地转换来自不同来源、不同时间点的信息,以支持人类或自动化决策。尽管数据融合技术本身已在众多领域得到广泛应用,但针对LCS数据融合,尤其是其在环境监测中应用的系统性总结尚属空白。为了填补这一空白,由Gabriel Oduori、Chaira Cocco、Payam Sajadi和Francesco Pilla组成的研究团队,来自爱尔兰都柏林大学(University College Dublin)建筑、规划与环境政策学院及空间动力学实验室,在《Information Fusion》上发表了一项系统性文献综述,首次对LCS数据融合的研究现状、方法、应用及未来方向进行了全面梳理与展望。
为全面把握该领域的研究脉络,研究团队严格遵循PRISMA(Preferred Reporting Items for Systematic reviews and Meta-Analyses)框架,在2023年10月21日和2025年4月14日分两个阶段对Scopus、ScienceDirect和Web of Science三大权威数据库进行了系统性检索,检索策略聚焦于“数据融合”、“环境监测”和“低成本传感器”等核心关键词。经过严格的去重、标题摘要筛选和全文 eligibility 评估,最终纳入了82项符合条件的研究(其中75篇为期刊论文),时间跨度为2017年1月至2025年4月。研究团队构建了详细的数据提取矩阵,对每篇文献的研究主题、地理背景、应用领域、所用数据、融合方法、算法及未来研究方向等信息进行了系统编码和分析。
研究结果分析
1. 融合方法学格局
通过对纳入文献的梳理,研究发现LCS数据融合的方法主要可分为五大类,且一项研究可能采用多种方法(多标签编码)。数据显示,数据驱动方法(包括机器学习和深度学习)占据主导地位(34%),其中传统机器学习(Machine Learning, ML)如随机森林(Random Forest, RF)、支持向量机(Support Vector Machine, SVM)等应用更为广泛(24%),深度学习(Deep Learning, DL)如卷积神经网络(Convolutional Neural Network, CNN)、长短期记忆网络(Long Short-Term Memory, LSTM)等占10%。地统计方法(Geostatistical Methods)(15%)和概率方法(Probabilistic Methods)(15%)并驾齐驱,前者如克里金法(Kriging)、反距离权重(Inverse Distance Weighting, IDW)等擅长空间插值和不确定性估计,后者如卡尔曼滤波(Kalman Filter)、高斯过程(Gaussian Process, GP)等专注于动态系统状态估计和不确定性传播。混合方法(Hybrid Approaches)(11%)通过结合不同方法的优势(如克里金法与随机森林结合)展现出解决复杂问题的潜力,但应用尚不普遍。知识驱动方法(Knowledge-based Methods)(6%)如模糊逻辑、规则库系统,侧重于融入领域知识,但应用相对较少。
2. 融合层次分布
研究还根据融合发生的层次进行了分析。传感器级融合(Sensor-level fusion)最为常见(37%),直接对原始传感器数据进行整合,以提升数据准确性和可靠性。特征级融合(Feature-level fusion)(26%)则先提取各数据源的特征,再进行融合,适用于处理异构数据。决策级融合(Decision-level fusion)(24%)是最高层次的融合,将来自不同模型或传感器的独立输出结果进行聚合,形成最终决策或估计。此外,还有部分研究(约15%)采用了跨越多层次的融合策略,体现了融合架构的复杂性日益增加。
3. 主要应用领域
在应用领域方面,LCS数据融合呈现出高度集中的态势。空气质量监测是绝对的主流,占据了约70%的研究,涉及PM2.5、NO2等多种污染物的监测、校准和时空分布预测。土壤水分监测是第二大应用领域(约14%),主要服务于精准农业和水文研究。其他应用包括建筑 occupancy 检测、城市热岛效应分析、噪声监测和水质监测等,但占比相对较小(合计约16%)。这表明LCS数据融合技术在空气质量监测领域已相对成熟,而在其他环境参数监测方面具有广阔的拓展空间。
4. 挑战与局限性分析
研究深入剖析了当前LCS数据融合面临的挑战。首先,数据质量是核心问题,LCS普遍存在噪声大、校准漂移、受温湿度等环境因素交叉敏感性影响等问题,对融合前的数据预处理和质量控制提出了极高要求。其次,传感器校准是一个持续且复杂的过程,传统线性校准模型效果有限,而基于机器学习(如随机森林、人工神经网络)的动态校准方法虽有效但可迁移性差,且大规模传感器网络的定期重校准面临 logistical 挑战。第三,不确定性量化(Uncertainty Quantification)在许多研究中未被充分重视,地统计和概率方法能提供较好的不确定性估计,但许多机器学习模型仅输出点估计,缺乏对预测置信度的评估,限制了其在风险决策中的应用。第四,实际部署中还存在数据传输可靠性(尤其在偏远地区)、计算资源需求(如克里金法在大规模网络中的计算开销)以及隐私安全(如移动众感数据的位置隐私)等实际问题。此外,研究指出,现有文献在验证策略上(如缺乏时空块交叉验证以防范数据泄露)、校准协议描述的完整性等方面存在不足,影响了结果的可重复性和普适性。
5. 未来研究方向
基于对现状和挑战的分析,研究指出了未来值得关注的方向。混合融合框架将继续发展,通过结合地统计、概率和机器学习的优势,以平衡可解释性、预测精度和不确定性量化能力。人工智能与物联网(Internet of Things, IoT)边缘计算的结合是一个重要趋势,旨在实现数据在采集端的本地预处理和轻量级融合,减轻传输和云端计算压力。隐私保护数据融合技术(如差分隐私、联邦学习)对于涉及个人或位置数据的应用至关重要。开发更高效、可解释的不确定性量化方法并将其深度集成到融合流程中,是提升结果可靠性和决策支持价值的关键。最后,将LCS数据融合技术更广泛地应用于水质、噪声、生态等目前研究较少的领域,并推动标准化基准数据集和验证流程的建立,将极大地促进该领域的健康发展。
结论与展望
这项由都柏林大学团队完成的系统性综述首次清晰地勾勒出低成本传感器数据融合领域的研究全景。研究表明,该领域正处于快速发展阶段,地统计和机器学习方法是当前实践的主流,空气质量监测是核心应用场景。然而,在数据质量、校准、不确定性量化、模型可解释性以及实际部署的稳健性方面仍存在显著挑战。未来研究应致力于发展更稳健、自适应、不确定性感知的混合融合方法,加强数据预处理和质量控制的标准化,并拓展其在更广泛环境监测场景中的应用。随着技术的不断成熟和跨学科合作的深入,LCS数据融合有望在环境感知、公共健康保护和可持续发展决策中发挥越来越重要的作用,为构建更智慧、更具韧性的城市和环境提供关键技术支撑。

生物通微信公众号
微信
新浪微博


生物通 版权所有