活火山对周边社区构成重大危害,需要持续可靠的监测。虽然地震信号是主要信息源,但每座火山产生的海量数据集难以人工处理与解释。因此,自动识别与定位(Localization)系统对火山活动的实时检测与评估至关重要。本文对火山地震微事件(Microearthquake)(如长周期(Long Period, LP)、火山构造(Volcano Tectonic, VT)、震颤(Tremor)等)自动识别与定位系统的研究现状进行了系统性图谱(Systematic Mapping)分析。研究人员综述了可被识别的不同类型火山地震事件,并分析了所采用的主要计算方法——从经典信号处理、统计方法到现代机器学习(Machine Learning, ML)与深度学习(Deep Learning, DL)方法。特别地,本研究阐述了这些技术如何应用于火山地震事件的检测(Detection)、分类(Classification)与定位(Localization)。此外,研究人员确定了全球被研究最多的火山作为测试这些系统的参考点。最后,研究人员讨论了当前挑战、对可扩展实时解决方案的需求,并概述了应对这些挑战的可能未来研究方向。
论文解读:《Systematic mapping study: automatic recognition and localization of volcanic seismic events》发表于《Frontiers in Earth Science》
一、研究背景与意义
活火山是周边人口的永久隐患,全球约三分之一的活火山受连续监测。地震学通过布设密集台网获取火山内部动态信息,但火山监测网络产生海量连续数据,传统依赖专家人工分析存在劳动强度大、易受疲劳影响及信噪比(Signal to Noise Ratio, SNR)低导致误判等问题。已有证据表明喷发前数小时长周期(Long Period, LP)事件频次显著升高,故实时处理大数据流对缩短决策时间、完善早期预警系统(Early Warning System, EWS)至关重要。此外,震源定位(Hypocenter Localization)可揭示火山内部结构。尽管已有大量单一算法研究,但缺乏对整个领域趋势与局限性的整合分析,因此研究人员开展了此项系统性图谱(Systematic Mapping Study)研究,旨在梳理自动识别(检测与分类)与定位技术的演进、数据集特征及研究缺口。
二、主要关键技术方法
研究人员依据Petersen等人提出的系统性图谱方法,在Scopus数据库中以指定检索式(含Microearthquake、volcan、recogn /detec/classif 、locat*等)检索,初检3220篇。自动过滤学科(地球科学、工程、计算机)、语言(英文)、文献类型(期刊/会议)及出版阶段后剩余2646篇。通过Cadima工具去重后人工按纳入标准(使用真实地震信号、报告自动识别或定位机制、含计算智能方法)进行标题、摘要及全文筛选,最终纳入77篇文献(1992—2025年)。提取字段含研究阶段(检测/分类/定位)、事件类型、方法类别(数字信号处理(Digital Signal Processing, DSP)/机器学习(Machine Learning, ML)/深度学习(Deep Learning, DL))、性能指标、使用火山及数据集特征,并进行编码分析与可视化。
三、研究结果
4.1 RQ 1. 已报道的火山地震事件识别所用自动计算智能机制
分析显示ML类方法占比最高(50%),其次为DL(31.25%),传统DSP占18.75%。DL指利用深度神经网络直接从原始或时频表示中自动学习特征(如CNN处理频谱图、LSTM处理序列),与需手动提取特征(如线性预测编码(Linear Prediction Coding, LPC)、Mel频率倒谱系数(Mel Frequency Cepstral Coefficients, MFCC))的ML区分开。ML中常用多层感知器(Multilayer Perceptron, MLP)、支持向量机(Support Vector Machine, SVM)结合多线性主成分分析(Multilinear Principal Component Analysis, MPCA)降维、决策树(Decision Tree, DTC)与随机森林(Random Decision Forest, RDF)、高斯混合模型(Gaussian Mixture Model, GMM)、贝叶斯神经网络(Bayesian Neural Network, BNN)及隐马尔可夫模型(Hidden Markov Model, HMM);DSP常用互相关、中心频率与波形因子分析。
4.1.1 RQ 1.1. 识别各阶段(检测与分类)所用自动机制
• 分类(Classification)阶段 :DSP用谱图互相关系数或中心频率+形状因子;ML用MLP(输入LPC或时域段)、SVM(输入MFCC+MPCA)、RDF、GMM、BNN、HMM;DL用卷积神经网络(Convolutional Neural Network, CNN)输入预处理后频谱图、深度神经网络(Deep Neural Network, DNN)输入时域/频域段、循环神经网络(Recurrent Neural Network, RNN)或长短期记忆网络(Long Short-Term Memory, LSTM)输入序列。现有标注多分内部火山事件(LP、VT、混合型(Hybrid, HYB)、Tornillos(TOR)、震颤(Tremor, TRE))、外部火山过程(塌陷(Collapse, COL)、泥石流(Lahar, LAH)、爆炸(Explosion, EXP)、冰震(Icequake, ICE))及非火山信号(雷电(Thunder, THU)、岩石坠落等),但LP亚类(深LP/浅LP)及ICE识别研究不足。
• 检测(Detection)阶段 :DSP用改良短时长平均/长时平均(Short Term Average/Long Term Average, STA/LTA)、语音活性检测(Voice Active Detection)或频带+信号包络法;ML与DL均在分类基础上增设噪声(Noise)标签,判定是否存在事件。
4.2 RQ 2. 估计震源或源位置所用的自动机制
仅7篇(15.6%)涉及定位,多因需高密度台网。DSP方法含基于振幅的联合反演及波束形成(Beamforming);未检索到纯ML定位方法;DL方法用CNN或LSTM直接回归源坐标。空间聚类可用于区分不同深部震源区。
4.3 RQ 3. 识别系统评价指标
分类阶段最常用准确率(Accuracy, TP + TN / N × 100% ),辅以灵敏度(Sensitivity)、特异度(Specificity)、F1值、平衡错误率(Balance Error Rate, BER)及受试者工作特征曲线(Receiver Operating Characteristic curve, ROC)。检测阶段若基于分类用准确率,若基于检测理论用检测概率(Probability of Detection)并结合SNR评估。标注类别数影响准确率(2类LP-VT约97%,9类混合事件约81.4%)。
4.4 RQ 4. 定位系统评价指标
主要用震中距均方根误差(Root Mean Square Error, RMSE)及绝对距离误差(三维经纬度深度),辅以发震时刻误差(Origin Time Error)。因数据集与评价法不同,结果难直接比较。
4.5 RQ 5. 数据集特征
公开数据集稀少,较大标注集如内瓦多德尔鲁伊斯火山(Nevado del Ruiz)9206事件、别济米扬内火山(Bezymianny)9393事件、科托帕希火山(Cotopaxi)1187事件等;无标注连续记录可达数十万事件用于无监督或预训练。
4.6 RQ 6. 主要研究火山地理分布
28座火山被用作案例,南美环太平洋火山带(尤其厄瓜多尔科托帕希Cotopaxi与智利莱马Llaima各11篇)及意大利(斯特龙博利Stromboli 6篇)研究最集中,因其人口威胁与研究基础。
四、讨论与结论总结
讨论指出五大趋势与缺口:(1)火山非平稳性致概念漂移(Concept Drift),建议用主动学习(Active Learning)、视觉变换器(Vision Transformer, ViT)或自监督学习(SimCLR)结合迁移学习提升适应性;(2)检测–分类–定位全流程无缝集成是难点,精确P波到时拾取对低能微震至关重要,未来可用多任务学习(Multi-task Learning)联合建模;(3)缺乏开放基准库与跨火山泛化验证,需推行迁移学习与域适应(Domain Adaptation)做跨火山(Cross-Volcano)训练;(4)罕见类样本不平衡可用生成对抗网络(Generative Adversarial Network, GAN)合成数据增广;(5)南美高危区需发展实时系统支撑EWS。
结论:本研究通过系统性图谱阐明火山地震事件自动识别(检测、分类)与微震定位的研究现状,发现当前瓶颈多为结构性——缺标准化基准与公开数据。未来需跨多火山验证以克服站点特异性,融入注意力机制(Attention Mechanism)融合领域知识,用生成模型合成罕见事件数据,并对LP/VT亚类做无监督聚类细化分类体系。深度学习定位正复兴,其与识别机制的集成是实现火山内部动态"X光"实时成像的关键前沿。
[citation:用户上传论文全文]
打赏