该研究发表于《Nature and Science of Sleep》,围绕睡眠呼吸暂停低通气综合征(sleep apnea–hypopnea syndrome,SAHS)的无创筛查与分级诊断问题展开。SAHS是常见的睡眠相关呼吸障碍,其核心病理特征为睡眠过程中反复出现的上气道阻塞,进而导致间歇性低氧血症、睡眠片段化以及日间嗜睡,并与高血压、冠心病、心力衰竭、心房颤动和脑卒中等心脑血管疾病密切相关。既有流行病学资料显示,中国成年人SAHS患病负担较重,因此建立可推广、低负担且具有临床可用性的筛查方法具有明确现实意义。当前,多导睡眠监测(polysomnography,PSG)仍是SAHS诊断金标准,能够综合记录气流、呼吸努力和血氧饱和度等多维生理信号,但其流程复杂、成本较高、资源依赖性强,难以满足大规模筛查需求。相比之下,智能可穿戴设备便于居家使用,但由于缺乏对气流和觉醒事件的直接测量,其诊断精度仍受限制。鼾声作为SAHS最具代表性的临床表现之一,源于上气道内气流湍流和软组织振动,其声学特征可反映气道阻塞的部位与程度。基于这一生理基础,研究人员尝试利用人工智能(AI)对鼾声进行自动识别与量化评估,以探索一种非接触、可扩展的SAHS辅助诊断路径。
研究流程(Workflow of the Study) 研究在3家协作机构开展,所有受试者在PSG检查当晚同步进行鼾声音频记录和可穿戴设备信号采集。研究人员明确指出,数据脱落主要来自3类质量控制问题:PSG伪差或睡眠时间不足、鼾声音频信噪比过低,以及可穿戴设备佩戴不当或同步不完整。经质量控制后,最终有效数据包括144例PSG记录、121例鼾声记录和107例可穿戴设备记录。分析时,各模态均基于可用的有效记录分别纳入,而非仅限于三种数据均完整的受试者。该设计反映出研究重视真实临床采集条件下的数据可用性,也说明不同技术路径在现实应用中的数据完整性存在差异。
鼾声分析模型算法(Snoring Analysis Model Algorithm) 该模型首先对原始音频进行预处理和分段,并将每一段转换为STFT频谱图作为输入。网络结构采用多尺度神经架构,由编码器-注意力-解码器组成;并行的不同扩张率深度可分离卷积分支用于提取多尺度时间特征,通道注意力模块用于自适应强调重要表征,随后通过轻量化解码器完成多尺度特征融合与最终分类。研究人员说明,该AI模型在本研究开展前已完成预训练,当前多中心数据集仅用于性能验证,未进一步训练或调参。这一处理有助于评估模型在独立临床队列中的泛化能力。
研究队列的人口学特征(Demographics of the Study Cohort) 共134例受试者进入人口学分析,其中重度SAHS占比最高,为55.2%。男性占80.6%,且男性比例随疾病严重程度增加而显著升高。BMI同样随着病情加重而递增。高血压是最常见共病,占20.9%。呼吸事件类型方面,以阻塞性事件为主,占78.5%,混合型和仅低通气型较少,中枢型罕见。与此同时,最长呼吸暂停持续时间随严重程度升高而延长,最低血氧饱和度与平均SpO2则呈进行性下降,而总睡眠时间在各组间无显著差异。PSG-derived AHI、Wearable Device_AHI与Snoring Analysis_AHI均随疾病分层升高,提示两种替代方法均能在一定程度上反映疾病负担。
鼾声模型、可穿戴设备与PSG之间的一致性和相关性(Agreement and Correlation Between Snoring-Sound–Based Model, Wearable Device Model, and Polysomnography) 以PSG为参照时,鼾声模型所得AHI与PSG-derived AHI呈强正相关,相关系数r = 0.79,而可穿戴设备仅为中等相关,r = 0.68。进一步一致性分析显示,鼾声模型与PSG之间的组内相关系数(ICC)为0.753,提示具有较高一致性。Bland–Altman分析显示,两者平均偏倚为–9.12次/小时,95%一致性界限为–41.25至23次/小时,表明鼾声模型相较PSG略有低估AHI的系统性趋势,但总体一致性良好。基于这些结果,研究人员认为鼾声分析可为AHI提供有效且可靠的估计。
鼾声模型与可穿戴设备模型的诊断性能(Diagnostic Performance of Snoring-Sound–Based Model and Wearable Device Model) 研究采用一对其余(one-vs-rest,OVR)ROC框架,对不同PSG定义的严重程度进行分类评估。对于识别无SAHS者(AHI < 5次/小时),鼾声模型AUC为0.83,可穿戴设备为0.75。对于轻度SAHS,鼾声模型AUC为0.87,高于可穿戴设备的0.73。对于中度SAHS,两者表现相近,分别为0.80和0.82。对于重度SAHS,两种方法均表现优异,鼾声模型AUC为0.96,可穿戴设备为0.90。整体上,两种方法均具备良好至优异的分辨能力,但鼾声模型在较低严重度区间呈现更高的数值表现。
鼾声模型表现相当且AUC数值更高(Snoring-Sound–Based Model Shows Comparable Performance with Numerically Higher AUCs) 在配对样本中,研究人员使用DeLong检验直接比较两种方法的ROC曲线。结果显示,鼾声模型在多数类别中的AUC高于可穿戴设备,但差异均未达到统计学显著性。对于无SAHS者,鼾声模型AUC为0.82,可穿戴设备为0.75;轻度SAHS分别为0.83和0.72,p = 0.07,提示存在未达显著性的优势趋势。中度SAHS中,可穿戴设备略高于鼾声模型;重度SAHS中,两者均保持高区分能力。该部分结果支持这样一个结论:鼾声模型与可穿戴设备总体性能相当,但在识别无SAHS和轻度SAHS方面更具潜在价值。
诊断性能的亚组分析(Subgroup Analysis of Diagnostic Performance) 按性别、年龄和BMI进行的一对其余分类亚组分析显示,两种方法总体模式较为一致。对于无SAHS识别,各亚组AUC大致处于中等至良好水平,但部分亚组置信区间较宽,提示样本量受限。对于轻度SAHS,鼾声模型在多数亚组中均显示更高AUC,尤其在男性、年龄<40岁以及不同BMI分层中均呈现数值优势。对于中度SAHS,两种方法表现接近,且不同亚组间相对优势并不一致。对于重度SAHS,两种方法在各亚组中均维持较高AUC。总体而言,鼾声模型在不同临床亚组中表现较稳定,而其在轻度疾病阶段的相对优势更加突出。