结构性心脏病(structural heart disease, SHD)涵盖左心室收缩功能障碍、瓣膜性心脏病、肥厚型心肌病(hypertrophic cardiomyopathy, HCM)、心脏淀粉样变性及肺动脉高压等多种异质性疾病,尽管疾病修饰治疗的可及性不断提升,其漏诊率仍居高不下。超声心动图是目前确诊的主要检查手段,但受限于成像容量、成本及转诊效率,难以作为大规模筛查工具广泛应用。本综述系统评估了人工智能赋能的12导联心电图(artificial intelligence-enabled 12-lead electrocardiography, AI-ECG)作为SHD超声前分诊工具的价值。研究人员汇总了针对射血分数降低型心力衰竭、瓣膜性心脏病、肥厚型心肌病、心脏淀粉样变性、肺动脉高压及复合SHD模型的现有证据,并区分了两种预期应用场景:安全网筛查(safety-net screening),即AI-ECG阳性结果作为触发确诊评估的补充信号;守门人分诊(gatekeeper triage),即AI-ECG阴性或低风险结果在特定低风险人群中支持延迟或降级超声心动图检查。现有证据最有力地支持低左心室射血分数(left ventricular ejection fraction, LVEF)的检测,该领域已具备实用型随机实施数据及初步卫生经济学证据。瓣膜性及复合SHD模型在优化转诊富集方面前景良好,而肥厚型心肌病、心脏淀粉样变性和肺动脉高压仍处于早期或通路不完善的探索阶段。综述同时探讨了假阳性解读、结合床旁超声的分步确认流程、阈值选择、工作流整合、公平性、监管及卫生经济学等关键问题。总体而言,AI-ECG当前最适合定位为超声心动图上游的补充性安全网工具,用于提升病例发现能力;守门人式应用仍属研究探索阶段,需经过前瞻性通路级验证、校准及运营保障后,方可支持常规影像学检查的延迟决策。
引言
结构性心脏病的未确诊负担
结构性心脏病(SHD)包含左心室收缩功能障碍、瓣膜性心脏病、肥厚型心肌病、心脏淀粉样变性及肺动脉高压等多种异质性疾病表型,部分类型常见或识别不足,且致残率与死亡率较高。早期检测具有重要临床意义,但基于影像的广泛筛查始终受限于超声心动图的成本与可及性。无症状左心室收缩功能障碍在普通人群中的患病率约为3–6%,且进展为显性心力衰竭的风险显著升高。主动脉瓣狭窄是发达国家最常见的瓣膜性心脏病,常隐匿多年无症状,一旦出现症状则预后急剧恶化。心脏淀粉样变性曾被认为罕见,现已被确认为射血分数保留型心力衰竭的重要且未被充分识别的病因,诊断延迟仍普遍存在。鉴于阻塞性HCM及转甲状腺素蛋白淀粉样心肌病等特定SHD表型已有有效疾病修饰治疗可用,及时诊断的临床价值进一步提升。超声心动图仍是大多数SHD的首选确诊影像学手段,但广泛的转诊策略难以规模化推广,因成像容量、专业能力及患者选择均制约效率,导致许多患者在疾病晚期才获确诊。在此背景下,基于心电图的预测模型有望以更有针对性的方式,将转诊富集至高风险的SHD患者群体。
重构心电图的结构筛查角色
12导联心电图是全球应用最广泛的心血管检查之一。传统上,其临床作用集中于心律、传导、缺血及心室重构的间接征象,而非专门用于SHD筛查。深度学习研究表明,心电图波形中包含超越人工视觉解读的结构表型潜在信息。2019年一项里程碑研究证实,人工智能心电图可从常规12导联记录中识别射血分数降低型左心室功能障碍,判别性能优异,确立了低成本、广覆盖的检查可作为超声心动图确诊异常的上游筛查工具这一核心理念。EchoNext深度学习模型进一步明确了AI-ECG的部署谱系:从“安全网”策略——触发额外超声心动图检查,到“守门人”策略——旨在减少不必要的影像学检查。在操作层面,安全网应用属于补充性病例发现,即AI-ECG阳性结果促使临床医生对可能被遗漏的患者进行复核及确诊成像;守门人应用则属于排除或降级策略,仅在没有独立影像学指征的特定患者中,AI-ECG阴性或低风险结果可支持延迟超声心动图检查。这一框架将关注点从孤立的AI-ECG诊断分类器,转向嵌入临床路径的超声前分诊工具。
研究目标、创新性与现实相关性
本综述旨在系统汇总AI-ECG作为SHD超声前分诊工具的现有证据,评估哪些领域已具备安全网部署条件,哪些领域尚不足以支持守门人应用。现有综述已概述了AI增强心电图在心血管疾病管理中的演进,近期述评也强调了可扩展AI-ECG筛查SHD的前景。在此基础上,本综述聚焦于AI-ECG作为超声前分诊干预措施,将讨论从单纯的模型判别性能延伸至通路级临床应用:何时AI-ECG阳性应触发确诊评估,何时阴性或低风险结果可支持延迟成像,以及不同预期用途所需的验证标准。综述同时通过安全网与守门人的双重视角,系统梳理了该领域的核心转化挑战,包括证据标准、校准与阈值设定、工作流责任归属、公平性与可迁移性、全生命周期治理等,并按证据成熟度、转诊获益、前瞻性验证、阈值影响及部署准备度,对比分析了低LVEF、瓣膜性心脏病、肥厚型心肌病、心脏淀粉样变性、肺动脉高压及复合SHD模型。其现实意义在于,AI-ECG并非要取代超声心动图,而是通过优化患者选择、优先配置有限的成像资源、识别可能被遗漏的患者,从而影响临床实践。本综述因此将AI-ECG定位为超声心动图上游的临床工作流干预,并阐明了安全网筛查与守门人分诊在证据要求上的不对称性。
证据识别与证据图谱
为提高方法学透明度并明确证据基础范围,研究人员开展了结构化证据图谱检索,聚焦评估AI-ECG用于超声可检测SHD或超声前分诊的同行评议研究。检索来源包括PubMed、Embase、Web of Science数据库,辅以Google Scholar及相关文献追踪。经去重及标题、摘要、全文逐级筛选,最终纳入26篇核心证据文献进行定性证据合成。这些核心文献直接评估了AI-ECG的模型性能、外部验证、前瞻性/随机实施、转诊富集、卫生经济学评价、纵向监测或SHD分诊的通路级影响,覆盖低LVEF、瓣膜性心脏病、肥厚型心肌病、心脏淀粉样变性、肺动脉高压、复合SHD模型及分步确认工作流等领域。流行病学背景、治疗背景、叙述性综述、方法学论文、公平性与监管文献及非AI-ECG相关研究仅作为背景引用,不计入核心证据文献。
概念框架:安全网与守门人应用
现有文献表明,AI-ECG不应仅被视为诊断分类器,而应理解为超声心动图上游的工作流工具。EchoNext提出的“安全网”与“守门人”更应被解读为预期应用导向,而非固定的模型类别,这一区分为下文证据合成提供了组织框架。在安全网路径中,核心问题是AI-ECG阳性能否通过触发原本可能遗漏的确诊评估来提高检出率;在守门人路径中,核心问题则更为严苛:AI-ECG阴性或低风险结果能否安全地支持延迟或降级超声心动图检查。同一算法可能作为触发额外成像的临床可接受工具,但仍不足以作为延迟成像的依据。
安全网应用
本综述中,安全网部署指补充性应用场景:在常规诊疗中已获取的心电图中应用AI-ECG,识别那些可能离院而未接受超声心动图评估的患者。其作用在于富集转诊并支持早期识别,而非推翻已有的成像指征。此场景下,AI-ECG阳性应被解释为结构化触发信号,而非确诊依据。根据疾病表型与诊疗场景,下游路径可包括临床医生评估症状与既往影像、确诊经胸超声心动图、聚焦性床旁心脏超声作为中间富集步骤,或成像确诊后的疾病特异性转诊。这是当前证据最明确支持的部署逻辑。在低射血分数检测领域,包括EAGLE在内的随机与实用型研究,主要评估的是AI-ECG在常规工作流中作为确诊超声心动图的提示,而非取消成像的工具。对于安全网应用,模型性能的评判应侧重于灵敏度、阳性预测值、转诊负担与随访完成情况的平衡,而非单一的判别能力。
守门人应用
相比之下,守门人部署意味着AI-ECG参与决定延迟、降级或取消原本可能被安排的超声心动图检查。这是更具挑战性的角色,因为错误的后果不仅是过度检查,还可能是假阴性带来的错误安全感与SHD漏诊。在此路径中,AI-ECG阴性或低风险结果仅适用于预检概率足够低且无独立临床指征的患者,如心衰症状、可疑杂音、已知结构性心脏病、异常生物标志物或高风险疾病特定背景。守门人应用不仅需要高判别能力,还需可靠的校准、在目标人群中极高的灵敏度与阴性预测值、前瞻性通路级验证、选定操作阈值的决策曲线证据,以及明确的临床医生否决与随访机制。基于现有证据,这一标准尚未在广泛的SHD筛查中得到确立。
实用框架
因此,安全网与守门人应用不应仅是标签,而应作为判断转化成熟度的框架。关键问题在于:AI-ECG是否能切实富集超声心动图转诊,该转诊路径是否已在临床工作流中接受过前瞻性测试,以及工作流是否已足够成熟以支持部署。按此标准,安全网筛查是最成熟的近期角色,而守门人分诊仍需更强的前瞻性证据支持,仍属愿景阶段。阈值选择、权衡取舍与工作流设计并非次要细节,而是决定可部署性的核心要素。
跨SHD领域的证据合成
本节不再仅以模型性能衡量疾病特异性证据,而是按转化成熟度组织。核心研究层面的证据已汇总于前述表格,此处按相同通路导向维度评估各应用:疾病患病率、验证深度、前瞻性通路证据、转诊获益、下游可操作性,以及安全网与守门人部署的准备度。各领域成熟度对比亦已汇总,其中低LVEF作为基准适应证,瓣膜性与复合SHD模型为中期转诊富集领域,更罕见或异质性更高的表型则处于更早的通路开发阶段。
低LVEF:基准领域
低LVEF检测是AI-ECG引导超声分诊中证据最成熟的领域。该领域由Attia等在2019年奠基,其研究显示卷积神经网络检测LVEF ≤35%的受试者工作特征曲线下面积(area under receiver operating characteristic curve, AUROC)达0.93,阴性预测值为98.7%;且无基线室壁运动障碍但AI-ECG筛查阳性的患者,未来发生室壁运动障碍的风险是阴性者的4倍,提示AI-ECG不仅能识别现患疾病,还可能识别更高风险的临床前状态。随后的EAGLE试验(ECG AI-Guided Screening for Low Ejection Fraction)将该算法转化为实用型临床干预:45家诊所或医院的120个初级保健团队按聚类随机分配至干预组(可访问AI结果,181名临床医生)或对照组(常规护理,177名临床医生),共纳入22641名无既往心衰史的成人,主要终点为心电图后90天内新诊断低EF(≤50%)。试验达到预设终点,新诊断率从对照组的1.6%提升至干预组的2.1%(比值比1.32,95%置信区间1.01–1.61;P=0.007),相当于较常规护理相对增加32%。重要的是,AI赋能的检测提高了病例发现率,却未显著增加总体超声心动图使用量,提示是转诊重定向而非无差别扩大成像。即便如此,门诊AI阳性患者中仅约半数接受了后续成像,后期住院实用数据同样显示,从算法标记到下游临床行动仍存在持续差距。除推导与初级保健随机化外,低LVEF领域还在不同临床场景中推进了前瞻性测试,例如在尼日利亚产科试验中,显著诊断获益主要来自数字听诊器路径,12导联AI-ECG组仅呈一致性但无统计学意义的效应趋势;在中国台湾的实用型住院随机试验中,则在不增加总体超声使用的前提下提高了低EF检出率。综上,关键问题已不再是AI-ECG能否检测低LVEF,而是其是否展现了足够的转诊富集、前瞻性通路验证及工作流准备度以支持超声前部署。现有证据表明,低LVEF最明确地满足了前两项标准,并在第三项上进展最快,是当前近期部署的最佳基准安全网适应证。尚未被证实的不是检测能力,而是AI-ECG阴性或低风险结果能否安全支持超声心动图延迟。
瓣膜性心脏病
在非LVEF应用中,瓣膜性心脏病——尤其是主动脉瓣狭窄(aortic stenosis, AS)——是AI-ECG筛查相对成熟的领域。AS患病率随年龄显著上升,65岁以上成人约为1–2%,75岁以上约为12%,而确诊与严重程度分级仍依赖超声心动图。多个团队独立开发了AS检测的AI-ECG算法:梅奥诊所研究显示,卷积神经网络检测中重度AS的AUROC为0.85,且基线AI-ECG阳性但无中重度AS的患者,后续发生有临床意义AS的长期风险升高2.18倍;Kwon等采用多层感知机联合卷积神经网络的架构,内部与外部验证AUROC分别达0.884与0.861。哥伦比亚大学牵头的ValveNet研究将AI-ECG筛查扩展至更广泛的左侧瓣膜病框架,在77163名患者中,模型对AS、主动脉瓣反流(aortic regurgitation, AR)及二尖瓣反流(mitral regurgitation, MR)的AUROC分别为0.88、0.77与0.83,外部验证中总体准确度相似;Mount Sinai五家医院的多中心研究基于617338对心电图–超声数据,同样证实基于深度学习的心电图可检测MR与AS,外部验证AUROC分别为0.81与0.86。除判别能力外,瓣膜AI-ECG(尤其是AS)似乎还能识别出一部分AI阳性/超声阴性的患者,其纵向风险升高。但从部署角度看,瓣膜AI-ECG已超越概念验证并显示出有意义的转诊富集,但前瞻性通路验证仍然有限,因此更适合视为转化前景良好的转诊工具,而非可直接部署的超声前标准。
肥厚型心肌病与心脏淀粉样变性
肥厚型心肌病在普通人群中的患病率约为1/500,常被临床忽视,且与包括年轻人在内的心源性猝死相关。梅奥诊所Ko等开发了首个HCM检测的AI-ECG模型,独立测试队列AUROC达0.96,在预设阈值下灵敏度87%、特异度90%,且在年轻患者、心电图定义的左心室肥厚患者甚至心电图正常者中均保持良好性能。《循环》杂志的一项跨国研究应用联邦学习训练HCM检测模型,覆盖美国与日本的三个学术中心,其跨中心泛化能力明显优于单中心模型,并提升了HCM与其他肥厚病因的鉴别能力;随后在伯尔尼、牛津与首尔的外部验证证实了梅奥心电图模型的总体良好性能,但也存在明显的中心间差异,而非一致的可迁移性。Sangha等近期报道,基于心电图图像(而非原始波形文件)的深度学习模型检测HCM的内部测试集AUROC为0.95,三个外部数据集AUROC分别为0.94、0.92与0.91,支持了一种可能更易部署的基于图像的筛查路径。心脏淀粉样变性的筛查场景则不同,因其患病率低,真实世界阳性预测值(positive predictive value, PPV)天然受限。既往研究在富集队列中报告了对心脏淀粉样变性的良好判别能力,提示基于心电图的筛查有助于富集下游诊断疑诊,但证据仍受限于病例富集设计、有限的外部验证及低患病率带来的部署挑战。所报告的0.86 PPV来自匹配的病例对照测试集,不应被表述为人群筛查层面的PPV。Goto等随后报道了互补的心电图–超声心动图联合通路,在多中心队列中,心电图C统计量达0.85–0.91,超声心动图为0.89–1.00;在部署模拟中,心电图预筛查将下游超声筛查的PPV从33%提升至74–77%(召回率67%)。对心脏淀粉样变性而言,主要转化挑战不是信号缺失,而是低患病率下的部署问题,因为真实世界PPV将远低于富集病例对照数据集中的表现。现有研究表明AI-ECG可富集疑诊并提高下游超声工作检出率,但外部验证仍有限,证据尚不足以支持常规人群水平的超声前分诊。综上,HCM与心脏淀粉样变性应被视为临床重要但通路不完整的领域,而非可与低LVEF AI-ECG相提并论的成熟筛查适应证。
肺动脉高压与右心功能障碍
AI-ECG检测肺动脉高压(pulmonary hypertension, PH)与右心功能障碍的证据相对较早。已发表研究仍以回顾性为主,尽管内部与外部验证队列中报告的判别能力令人鼓舞,AUROC约为0.86–0.92。EchoNext也将右侧表型纳入了更广泛的复合SHD框架,提示PH相关信号可被捕获于转诊导向的筛查中。总体而言,PH仍是早期信号检测领域,而非成熟的超声心动图转诊路径:判别能力令人鼓舞,但文献仍以回顾性为主,且下游路径不如左侧SHD标准化。
复合SHD模型
一个关键的概念进展是开发可同时筛查多种SHD实体的模型,生成单一输出——即患者存在任一超声可检测结构性疾病的估计概率——这更贴近“是否需要开具超声心动图”这一临床问题。Geisinger的Ulloa-Cerna等开发的rECHOmmend平台,基于484765名成人的220万份心电图训练复合模型,预测七种超声确诊疾病,仅使用年龄、性别与心电图波形即实现AUROC 0.91,在90%灵敏度下PPV为42%,且在实用转诊获益上优于相应的单病种模型;单病种模型AUROC为0.86–0.93,但PPV仅为1–31%,显示复合方法提升了实用价值。EchoNext将复合SHD筛查扩展至多中心、人口学多样化的八家医院队列,证明广泛的转诊导向检测可在学术与社区环境中泛化;前瞻性试点数据同样显示,不同风险层的既往未识别SHD患病率呈梯度分布,支持转诊富集而非二元排除。Dhingra等开发的PRESENT-SHD集成XGBoost模型基于心电图图像而非原始波形,在美国四家医院与前瞻性ELSA-Brasil队列中均保持性能稳定,并可适应新型心电图格式及智能手机拍摄的屏幕或纸质图像。复合模型因提升富集能力,最符合真实世界转诊需求,但当前证据仍支持转诊优先级排序而非成像延迟,主要权衡在于病变特异性可解释性的降低。总体而言,证据基础在临床上前景良好,但在转化成熟度上不均衡。低LVEF仍是基准适应证,已从回顾性验证进展至实用型随机实施、随访采用研究与早期经济评估;瓣膜病与复合SHD模型是领先的转诊富集领域,具备令人鼓舞的回顾性、外部验证与新兴纵向证据,但前瞻性通路测试有限;HCM、心脏淀粉样变性与PH保留了强烈的生物学与临床兴趣,但其低患病率、表型异质性与较不标准的下游路径限制了广泛筛查的准备度。这种分阶段解读将疾病特异性证据与后续的落地问题相衔接:阳性结果应如何触发随访、阈值应如何选择,以及为何守门人应用比安全网部署要求更高。
从
打赏