综述：人工智能在唇腭裂诊疗中的应用：诊断、治疗与预测结果的叙述性综述

时间：2026年5月28日

来源：Egyptian Pediatric Association Gazette

编辑推荐：

唇腭裂（Cleft lip and palate, CLP）是全球最常见的先天性颅面畸形，约占活产新生儿的1/700。涵盖深度学习（Deep learning, DL）、机器学习（Machine learning, ML）及先进计算分析的人工智能（Artifi

唇腭裂（Cleft lip and palate, CLP）是全球最常见的先天性颅面畸形，约占活产新生儿的1/700。涵盖深度学习（Deep learning, DL）、机器学习（Machine learning, ML）及先进计算分析的人工智能（Artificial intelligence, AI）技术，已成为贯穿唇腭裂全病程诊疗的潜在变革性工具。本叙述性综述评估了当前关于人工智能在唇腭裂管理中应用的证据，涵盖诊断精度、手术规划、结果评估及医疗资源优化。研究团队在PubMed、Scopus、Web of Science、IEEE Xplore、Google Scholar及UpToDate数据库中进行了全面检索，时间截至2026年4月。本综述并非系统评价或基于研究方案，未注册相应协议，故采用选择性综合方法，系统识别了探究人工智能在唇腭裂诊断、预测、手术规划、言语评估、美学评价、术前矫治及经济影响等方面应用的相关研究。研究分析侧重于包括准确性、敏感度、特异度、受试者工作特征曲线下面积（Area under the receiver operating characteristic curve, AUC）及F1分数在内的定量性能指标。对于预测模型研究，在适用时采用PROBAST + AI标准进行质量评估。作为叙述性综述，未遵循PRISMA指南，也未对所有纳入研究进行正式的风险偏倚评估。结果显示，当代人工智能系统在多个临床领域表现出良好性能。用于诊断成像的深度学习模型在特定研究中达到0.93—0.95的AUC值，部分模型在受控环境中的性能可与放射科医师媲美甚至超越。利用多层感知机（Multilayer perceptrons）的产前预测模型在特定验证队列中报告的准确率高达92.6%，AUC达0.98。一项单中心研究显示，基于人工智能的产前超声检查采用YOLOv5模型，对标准冠状鼻唇切面的检测AUC达到0.971。基于机器学习的遗传风险评估在特定人群研究中显示出94%—99%的准确率。采用U-Net架构的三维体积评估在研究环境下分割准确率高达96%。自动化言语分析系统在验证研究中与专家临床医师的一致性率为0.797—0.975。基于Vision Transformer的分类模型在有限数据集上识别唇腭裂亚型的准确率高达86.6%。经济学分析表明，在特定项目背景下，每避免一个伤残调整生命年（Disability-adjusted life year, DALY）的成本效益比可低至62.8美元。结论认为，人工智能技术在提升唇腭裂全病程诊疗的临床效用方面展现出巨大潜力，初步证据表明其在诊断准确性、治疗规划和结果评估方面均有改善。然而，在临床验证、监管审批、与现有医疗系统整合及公平可及性方面仍面临重大挑战。可解释人工智能算法、先进成像模态与精准医学方法的融合，有望在坚持以获得最佳结局所需的多学科、以患者为中心的框架下，促进高质量唇腭裂诊疗的普及化。未来的研究应优先开展多机构验证、纳入多样化人群代表并进行前瞻性临床试验，以确立其在真实世界中的有效性。

**引言**
唇腭裂（Cleft lip and palate, CLP）构成了全球最常见的先天性颅面畸形，影响约1/700的活产新生儿，并带来了巨大的医疗、心理及社会经济负担，需要对患者进行贯穿其一生的全面多学科诊疗。该病的临床表现谱系广泛，从单纯唇裂到完全性双侧唇腭裂不等，其患病率在不同种族人群中存在差异，亚洲人群最高，其次是高加索人群和非洲人群。根据美国国立卫生研究院的数据，全球唇腭裂的估计患病人数约为460万，其中亚类数据显示每1600名儿童中有一名患有唇腭裂，每2800名中有一名患有单纯唇裂，每1700名中有一名患有单纯腭裂。唇腭裂显著增加了全球口腔健康负担，不仅影响解剖结构和美观，还导致言语、听力和喂养功能障碍，共同降低患者的生活质量。人工智能（Artificial intelligence, AI）的出现为诊断准确性、治疗优化和结果预测引入了新的能力，可能提升唇腭裂的诊疗水平。当代人工智能应用包括复杂的深度学习（Deep learning, DL）算法、机器学习（Machine learning, ML）模型和先进的计算分析，这些技术在临床诊断、手术规划和结果评估中展现出超越90%准确率的前景。现代人工智能架构，如卷积神经网络（Convolutional neural networks, CNNs）、深度神经网络（Deep neural networks, DNNs）、视觉Transformer（Vision Transformers, ViTs）、生成对抗网络（Generative adversarial networks, GANs）以及专门的三维模型（如3D U-Net），在增强结局测量、预测建模和标准化唇腭裂全程干预护理方面显示出潜力。近期范围综述表明，人工智能技术可能提高诊断准确性、治疗规划和手术精度，从而实现更个性化的干预和改善的康复结局。Barreto Zambrano等人于2025年发表的一项综合范围综述分析了2014年至2024年发表的25项研究，确定了人工智能在唇腭裂中的六个应用子类别——诊断、预测、治疗、美学评估、教育及通用方法——其中深度学习是应用最频繁的方法学（占研究的44%），其次是机器学习。一项基于BERTopic的唇腭裂文献（2000—2025）分析确定了29个主题集群，其中“生活质量与心理社会影响”和“术前鼻牙槽骨塑形技术”成为热点，凸显了人工智能与以患者为中心的结果研究日益增长的交叉点。本叙述性综述的主要目的是综合当前关于人工智能在唇腭裂全病程管理中应用的证据，评估定量性能指标、临床效用和实施考量。本综述涵盖了至2026年4月的诊断成像、手术结果预测、牙槽骨移植评估、美学和功能结果评估、言语分析、遗传风险评估、术前矫治、经济影响建模和新兴技术。通过整合这一快速扩展领域的证据，本叙述性综述旨在为临床医生、研究人员和政策制定者提供人工智能赋能唇腭裂诊疗创新的全面概述，突出成就及需要进一步研究的差距。

**方法学**
本叙述性综述综合了截至2026年4月关于人工智能在唇腭裂诊疗中应用的当前证据。未注册本综述的研究方案，这与未设计为系统评价或基于方案研究的叙述性综述标准实践一致。所采用的方法学为选择性综合方法，系统检索了PubMed、Scopus、Web of Science、IEEE Xplore、Google Scholar和UpToDate数据库，使用的关键词包括：人工智能、机器学习、深度学习、神经网络、唇裂、腭裂、颅面畸形、诊断、预测、治疗、术前矫治和结局。**研究选择**：研究小组识别并分析了探究人工智能在唇腭裂诊断、预测、手术规划、言语评估、美学评估和经济影响中应用的研究。重点放在包括准确性、敏感度、特异度、AUC和F1分数在内的定量性能指标上。最初考虑了同行评审出版物和预印本；然而，为得出临床结论，优先选择同行评审文章。**质量评估**：对于预测模型研究，使用PROBAST + AI标准进行质量评估，该标准评估四个领域：参与者与数据来源、预测因子、结局和分析。该工具区分了模型开发质量与模型评估中的偏倚风险。基于这些领域的信号问题，研究被分类为具有低、高或不明确的偏倚风险。**方法学局限性**：作为叙述性综述，本综合不遵循如PRISMA等系统评价方案，也未注册研究方案。未采用具有双人独立筛选的正式纳入/排除标准。未对所有纳入研究统一应用偏倚风险评估。选择性综合方法优先考虑不同人工智能应用领域的代表性研究，而非纳入所有已发表研究的全面包含。检索范围有意放宽，以捕捉唇腭裂全病程中多样化的人工智能应用。在解释本文呈现的结果时，应考虑这些局限性。

**手术结果预测与规划**
准确的术前评估和手术规划是唇腭裂修复结果的关键决定因素。人工智能技术为提高诊断精度、预测手术结果和优化治疗途径提供了潜在可能。本节考察了人工智能在术前评估、产前诊断和正畸规划中应用的证据。**深度学习在术前评估与诊断中的应用**：人工智能驱动的手术规划系统在预测唇腭裂手术结果和优化治疗途径方面展现出良好的性能。利用先进卷积神经网络的深度学习算法在研究环境中对正颌手术预测的敏感度为78%—99%，特异度为74.1%—87%。Kuwada等人利用深度学习技术开发了一种计算机辅助诊断模型，在检测全景X光片上的唇腭裂窝洞时，AUC大于0.9，显著超越了同一研究中放射科医师0.7的AUC值。他们用于腭裂识别的检测模型报告的召回率和精确率均达到1.00，AUC值始终在0.93至0.95之间。Agarwal及其同事利用CNN特征结合支持向量机分类器，在识别双侧唇腭裂、正常和单侧唇腭裂照片时，平均准确率达到95%，其中单侧唇腭裂为92%，正常病例为99%。McCullough等人在800张单侧唇裂患者术前图像上训练了五个用于地标检测和严重程度分级的CNN模型，使用残差网络模型准确率达到89%，使用移动设备兼容的网络MobileNet准确率达到86%。**人工智能赋能的产前诊断**：利用多层感知机（Multilayer perceptrons）的产前唇腭裂预测在特定验证队列中已达到高达92.6%的准确率和0.98的AUC值，可能实现早期干预策略。Chen等人最近的一项研究评估了一种基于YOLOv5的人工智能模型，用于在700例胎儿中自动识别妊娠中期（孕20—24周）胎儿唇部和腭部的标准超声横断面图像。该人工智能模型对鼻唇标准冠状切面的AUC达到0.971，优于同一研究中的中级超声医师（AUC 0.935）和初级超声医师（AUC 0.905）。对于次腭的标准轴位切面，该人工智能模型达到敏感度0.960，特异度0.985，准确度0.980。产前人工智能应用的重要考量包括：（1）数据集特征——Chen等人的研究使用了来自单中心的700例胎儿；（2）验证类型——进行了内部验证，但需要在不同人群和设备上进行外部验证；（3）临床背景——与超声医师的比较在受控条件下进行，可能无法反映真实世界的临床实践；（4）可重复性——模型在不同超声机器和不同操作员下的性能需要进一步研究。**几何深度学习与三维形态计量分析**：几何深度学习的进展展示了自动标点能力，在唇腭裂新生儿获取的三维模型上，准确率达到94.44%，绝对平均误差为1.676 ± 0.959 mm。该流程可作为快速、准确和可靠的上颌牙弓形态特征量化工具，并代表了向完全自动化牙科治疗流程迈进的关键一步。该系统无需大型训练数据集即可准确运行的能力，使其在标注数据稀缺的特殊唇腭裂人群中尤其有价值。**人工智能在唇腭裂患者牙齿检测中的应用**：Arslan等人（2024年）评估了基于人工智能的软件（Diagnocat）在100例6—15岁唇腭裂患者全景X光片上的自动牙齿检测和编号。该系统显示出较高的整体敏感度（0.98 ± 0.03）、精确率（0.96 ± 0.04）和F1分数（0.97 ± 0.03），不同年龄组间性能无统计学显著差异（p > 0.05）。在上颌左侧区域发现了挑战，假阳性率（21号牙为16%）和假阴性率（62号牙为11%）较高，这与左侧单侧唇裂的患病率相关。**基于视觉Transformer的分类**：已开发出整合视觉Transformer（ViTs）和孪生神经网络的新方法，用于从UltraSuite CLEFT数据集（包括捕获言语期间舌部运动的超声视频序列和同步音频记录）中进行唇腭裂分类。初始模型独特地融合了超声图像的解剖数据和言语声谱图的功能数据，区分双侧、单侧和单纯腭裂类型的分类准确率为82.76%，F1分数为80%—86%。一个整合了SigLIP 2（一种最先进的多语言视觉语言编码器）的增强模型显示出统计学上的显著改善，整体准确率达到86.6%，所有唇腭裂亚型的F1分数均有提高。这些进展凸显了多模态人工智能在更早、更准确诊断方面的潜力。**风险分层与正畸规划**：正畸治疗规划中的机器学习模型在预测拔牙需求方面准确率高达94%。Li及其同事报告，人工神经网络在预测拔牙需求方面准确率达到94%，支抗模式准确率接近92.8%，并确定Spee曲线、ANB角和上颌牙弓拥挤度是最具影响力的预测特征。Jung和Kim开发的模型对需要拔牙患者的识别准确率为93%，对综合拔牙规划的总体准确率为84%。Choi等人在区分手术与非手术方法方面达到97%的准确率，在II类和III类错颌畸形中成功率达到100%。Shin等人使用基于CNN的头影测量分析，在预测正颌手术需求方面达到了95.4%的诊断准确率、84.4%的敏感度和99.3%的特异度。2025年的一项系统评价和荟萃分析专门研究了头影测量参数作为单侧唇腭裂患者正颌手术预测因素的作用。该荟萃分析纳入了10项研究，揭示了手术组和非手术组在SNA角（5—8岁年龄组平均差异2.25度 [95% CI 1.12—3.39]，9—14岁年龄组平均差异2.65度 [95% CI 1.44—3.86]）和ANB角（平均差异分别为3度 [95% CI 1.86—4.15] 和 5.54度 [95% CI 3.66—7.42]）上的显著差异。这些发现为人工智能驱动的预测模型提供了基于证据的头影测量阈值。

**牙槽骨移植评估与三维结果评价**
牙槽骨移植是唇腭裂管理的关键组成部分，需要精确评估缺损严重程度并进行体积分析。传统的评估方法依赖于影像学的主观解读，可能引入变异性。人工智能技术为牙槽植骨缺损和移植物结果的标准化、可重复评估提供了可能。**自动化缺损严重性分级与体积分析**：通过可解释的人工智能算法，利用先进的三维表面建模技术分析缺损严重性，推进了牙槽骨缺损的评估和分级。Miranda等人（2023年）利用锥形束计算机断层扫描（Cone-beam computed tomography, CBCT）开发了一种新型Fly-by-CNN分类器，用于194例唇腭裂患者的扫描。该算法从不同视角渲染三维表面模型，捕获二维图像快照输入CNN，并利用注意力层（Attention Layers）聚合特征进行分类决策。该系统精确率、召回率和F1分数分别达到0.823、0.816和0.817，评级者间一致性在严重性指数一个组内差异范围内为97.4%—100%。可解释人工智能组件提供了分类过程中考虑特征的全面图形化显示。Zhang等人研究了三维U-Net模型，在估计移植物体积方面平均准确率达到92%，分割准确率达到96%。他们的分析揭示，牙槽骨移植一年后，在唇侧与非唇侧出现了不对称生长模式，唇侧上颌骨长度从34.64 ± 2.48显著增加至35.67 ± 2.45 mm，而上颌骨前部和后部宽度仅在非唇侧显示出显著增加。Wang等人使用深度学习算法应用于CBCT，对三维上颌骨分析的分割准确率达到96%，超越了手工方法，并揭示了唇侧在梨状孔和牙槽嵴区域存在显著发育不全。**临床决策支持系统**：将人工智能整合到临床决策支持系统（Clinical decision support systems, CDSS）中，在诊断和治疗规划方面与传统的二维图像分析相比，总体改善了43%的治疗反应。这些系统结合了影像分析、遗传风险评估、预测建模和循证方案，提供数据驱动的建议。开发具有透明决策过程的可解释人工智能，是建立临床医生信任、理解人工智能输出和促进更广泛临床应用的关键进展。

**美学与功能结果评估**
术后美学结果显著影响患者的生活质量和社会心理健康。由于人工评估的主观变异性，美学结果的客观、可重复评估一直具有挑战性。人工智能技术，包括深度学习和生成对抗网络，为标准化的美学评估和结果可视化提供了可能。**基于深度学习的唇部对称性分析**：术后美学评估已通过基于深度学习的对比学习技术得到推进。Rosero等人（2025年）开发了一个人工智能系统，用于测量左右唇表示之间的相似性，加权分类准确率达到75%，与医学专家评估的皮尔逊相关系数为0.31。该系统将患者图像分为五个不同的不对称等级。Patcas等人（2019年）采用神经网络算法对唇腭裂患者进行面部吸引力评分，显示出与传统评估组相当的一致性。Boyaci等人（2020年）开发了个性化面部正常度量化模型以指导手术规划。**用于结果可视化的生成对抗网络**：CleftLipGAN在生成结构连贯的唇部重建同时保留精细纹理细节以进行术后可视化方面表现出优越性能。CleftGAN通过迁移学习利用StyleGAN-ADA生成高保真合成唇裂图像，解决了训练数据集有限的问题，同时保护了患者隐私。INCLG框架实施了一种多任务架构，同时预测无唇裂面部图像和面部地标，经专家外科医生评估后表现出增强的性能。Lau等人（2022年）的一项可行性研究表明，基于深度学习的图像修复可以覆盖唇裂并生成逼真的无唇裂外观，专家外科医生确认了该方法的临床效用。**自动鼻唇及鼻部评估**：Sayadi等人（2022年）采用HRNet架构构建了一个人工智能模型，能够识别唇解剖结构并自动化鼻唇标记放置以进行手术设计。结合人工智能的眼动追踪技术已成为客观美学评估的新方向，推荐采用包括固定5秒显示时间和基于比例指标在内的标准化方案。使用ResNet架构的鼻部美学评估自动框架与耳鼻喉科医师的评分高度相关，为术前规划和术后评估提供了工具。**美学评估方法的比较分析**：不同的人工智能方法为美学评估提供了不同的优势。基于GAN的方法（CleftLipGAN， CleftGAN）为患者教育提供了视觉结果模拟，但需要与实际结果仔细验证。对比学习方法能够实现客观的对称性量化，但可能无法捕捉所有临床相关的美学维度。结合人工智能的眼动追踪提供了观察者注意力模式的见解，但需要标准化方案以确保可重复性。方法的选择应考虑具体的临床应用：患者咨询可能受益于GAN可视化，而结果研究可能优先考虑标准化的对称性指标。

**言语与功能结果评估**
言语结果是唇腭裂诊疗中的关键功能指标，咽闭合功能直接影响沟通质量。传统的言语评估依赖于专家感知评估，耗时且存在评估者间变异性。基于人工智能的自动化言语分析为可扩展的、客观评估高鼻音和构音功能提供了可能。**咽闭合功能评估**：深度学习算法已被评估用于从视频透视图像中诊断咽闭合功能不全（Velopharyngeal insufficiency, VPI），包括VGGNet、ResNet、Xception、ResNext、DenseNet和SENet在内的模型在留出验证中AUC值为0.8758—0.9468，在五折交叉验证中为0.7992—0.8574。Xception显示出优越的留出验证性能（93.06%准确率，100%特异度），而ResNext在交叉验证中达到了最佳性能（86.978%准确率）。机器学习进展在前瞻性测试中实现了88.89%的敏感度和100%的精确率来检测咽闭合功能障碍（Velopharyngeal dysfunction, VPD），证明了其在资源有限环境中进行电话筛查的潜力。高级言语病理学家的敏感度为92.70%，特异度为96.12%，强调了需要整合影像和发声数据的混合人工智能。**自动化高鼻音检测**：与专家言语语言病理学家的一致性率方面，特征独立的深度学习算法达到0.797—0.975（平均0.91）。客观高鼻音测量（Objective hypernasality measure, OHM）在美国裂（Americleft）数据库中的相关系数r = 0.797，在新墨西哥腭裂中心数据库中为r = 0.713。自动化构音评估的F1分数在高鼻音方面为0.89，在紧张度方面为0.83，自注意力分析增强了模型的可解释性。包括OpenAI Whisper在内的大语言模型在腭裂患者咽闭合功能障碍的可扩展自动化检测方面显示出前景。

**遗传风险评估与预测模型**
遗传因素在唇腭裂病因中起重要作用，多个基因和环境相互作用共同影响风险。机器学习方法为整合复杂的遗传数据以改善风险预测和为受唇腭裂影响或有风险的家庭提供咨询提供了可能。**机器学习用于遗传风险预测**：机器学习在非综合征型唇腭裂（Non-syndromic CLP, NSCL/P）的遗传风险评估中展现出前景。在巴西人群中，Machado等人使用随机森林模型对13个单核苷酸多态性（Single nucleotide polymorphisms, SNPs）进行分析，达到94.5%的准确率来区分NSCL/P患者，并识别出FGF12（rs11717284， rs1875735）、GRHL3（rs41268753）和MTHFR（rs2274976）中的关键变异。神经网络方法在遗传风险预测方面展示了94%的整体准确率。Kang等人（2023年）开发了GANNE技术，分析143名韩国NSCL/P患者的92个SNPs，在10-SNP模型中AUC达到88.2%——比多基因风险评分提高了23%，比标准神经网络提高了17%。关键基因包括IRF6、RUNX2、MTHFR、PVRL1、TGFB3和TBX22。Dai等人（2024年）开发了DeepFace，这是一种基于深度神经网络的软件，用于分析颅面发育过程中与面裂相关的遗传变异，预测这些畸形特征性变异的功能影响。多路基因相互作用分析在中国人群中确定了CDH1、CDH2和CTNNA2之间的显著关联，而WNT基因研究确定了WNT5B和MAFB是亚洲和欧洲人群中最主要的SNPs。上述遗传风险模型在特定人群（巴西、韩国）内进行了验证。基于SNP的遗传风险模型由于等位基因频率差异以及不同种族群体间唇腭裂遗传结构的差异，需要在多样化人群中进行验证。人群验证的关键考量包括：（1）等位基因频率差异可能影响模型性能；（2）基因-环境相互作用在不同地理区域可能不同；（3）临床表型在严重程度和表现上可能存在差异；（4）在代表性不足的人群中进行验证对于公平的临床应用至关重要。现有证据表明，在一个群体上训练的模型在不进行重新校准或再训练的情况下，可能无法推广到其他群体。

**并发症预测与治疗优化**
机器学习模型在预测术后全身性感染方面达到98.7%的准确率，在预测失血量方面的误差率为7.4 mL。人工智能驱动的风险评估工具整合了唇裂类型、唇部分离严重程度、缺失牙齿、头影测量数据和人口统计学信息，以高敏感度预测二次干预需求。这些预测能力直接应对了表3中总结的手术并发症模式，实现了主动的风险缓解策略。表4中呈现的长期结果统计数据进一步说明了这些人工智能驱动预测工具的临床意义。

**经济影响与医疗保健交付**
经济考量在唇腭裂诊疗中日益重要，尤其是在疾病负担最重的资源有限环境中。人工智能技术可能通过提高效率、减少并发症和增强获取专业专业知识的机会，为具有成本效益的医疗服务提供做出贡献。**成本效益分析**：经济评估表明，在多种医疗服务提供模式中存在显著的成本效益收益。初级唇腭裂修复达到了该国人均GDP 51%的成本效益阈值。Amref Health Africa-Smile Train项目以1300万美元的总成本避免了207,879个DALY，产生每避免一个DALY的平均成本为62.8美元。使用人力资本法进行手术矫正带来了2.92亿美元的经济效益，使用统计生命价值法（Value of Statistical Life）则带来了24亿美元的经济效益。Smile Train的全球项目在25年内贡献了估计690亿美元的经济影响，单次手术成本约400美元，可为当地经济带来高达60,000美元的回报——投资回报率超过150倍。最新分析表明，通过避免DALY，恢复了总计1200万年的生命年，印度和印度尼西亚的集体影响超过220亿美元。**远程医疗与数字化转型**：Santos等人（2024年）验证了智能手机扫描应用程序用于三维腭部模型重建，表明KIRI Engine扫描（无镜）与专业口内扫描仪（0.14 ± 0.13 mm；p = 0.653）相比，在单侧唇腭裂模型上偏离真值的程度（0.22 ± 0.03 mm）具有可比性。该机器学习工具成功预测了地标并自动生成高精度术前矫治板。自动化术前矫治板计算流程在不到3分钟内生成紧密贴合的矫治板，在12个病例中全部获得唇腭裂护理专业人员的批准，19名患者在两家医院的临床实施中接受了治疗。综合临床决策支持系统（CDSS）整合了人工智能算法，结合影像分析、遗传风险评估、预测建模和循证方案，提供超越传统评估的数据驱动建议。利用智能手机扫描和机器学习的人工智能增强诊断系统展示了与传统方法相当的准确性，同时显著减少了处理时间和对专科医生的需求。当代证据强调了将人工智能与传统临床判断相结合的混合方法的重要性，一致显示出优于任一单独方法的性能。

**人工智能在术前矫治及基于智能手机工作流程中的应用**
数字工作流程的最新进展已将人工智能应用扩展到唇腭裂的术前矫治，特别强调了智能手机赋能的技术，这些技术解决了资源有限环境中的障碍。这些创新代表了人工智能角色从诊断和结果预测向新生儿期积极治疗干预的重要扩展。**智能手机扫描与自动化矫治板制作**：Nalabothu等人（2025年）提出了一项开创性的临床工作流程，将基于智能手机的三维扫描与机器学习相结合，用于唇腭裂新生儿术前矫治板的自动化制作。该方案使用标准智能手机上的开源移动应用程序（Scaniverse）捕获门诊环境下无需全身麻醉的腭部印模高分辨率三维扫描。生成的三维模型通过自定义机器学习工具（DiffusionNet模型）进行处理，该工具作为插件托管在Blender中，可自动预测解剖地标并生成带有鼻支撑的术前被动矫治板。在临床实施中，新生儿在整个术前矫治板治疗至手术前平均仅需5次就诊，而传统方法需要11—14次就诊。3D打印矫治板的首次适配即成功，无需修剪，这与传统方法每次就诊都需要显著修改形成鲜明对比。基于此工作，Nalabothu等人（2025年）报告了一项针对20名连续患有非综合征型完全性单侧唇腭裂新生儿的回顾性探索性队列研究，采用智能手机和人工智能辅助的工作流程。治疗开始于10.8 ± 5.7日龄，持续113.5 ± 15.6天，平均需要五次就诊。前部裂隙宽度和裂隙面积分别减少了56.8%和40.8%，上颌骨段生长显著。这些发现证明了这种方法在安全、高效的术前矫治板制作和治疗方面的临床可行性。**对低资源环境的意义**：基于智能手机的扫描结合机器学习对于低资源唇腭裂中心尤为重要。该技术消除了对昂贵口内扫描仪和石膏模型的需求，转而使用易于获得的智能手机和开源应用程序。Santos等人（2024/2025年）证明，KIRI Engine扫描（无镜）在单侧唇腭裂模型上偏离真值的程度（0.22 ± 0.03 mm）与专业口内扫描仪（0.14 ± 0.13 mm；p = 0.653）具有可比性。自动化术前矫治板计算流程在不到3分钟内生成紧密贴合的矫治板，在12个病例中全部获得唇腭裂护理专业人员的批准，19名患者在两家医院的临床实施中接受了治疗。这些进展共同代表了向普及术前矫治护理的范式转变，特别是在专科唇腭裂中心和昂贵设备不可用的地区。

**讨论**
本叙述性综述综合了关于人工智能在唇腭裂全病程诊疗中应用的证据，从产前检测到长期结果评估。研究结果在多个领域取得了实质性进展，同时突出了需要针对性研究关注的持续差距。**唇腭裂全病程中人工智能应用的综合**：本综述综合的证据表明，唇腭裂诊疗中的人工智能应用已从概念验证研究发展为具有已证明性能指标的临床相关工具。用于诊断成像的深度学习模型现在达到0.93—0.971的AUC值，特定应用如基于YOLOv5的产前超声模型在受控环境中超越了经验丰富的超声医师。自动化言语分析系统与专家临床医师的一致性率为0.797—0.975，表明其在资源有限环境中进行可扩展筛查的潜力。基于智能手机的人工智能工作流程在术前矫治中的出现是一个特别重要的发展，解决了临床效率和全球卫生公平性问题。这些进展共同表明，人工智能正从实验性应用转变为具有切实临床效用的工具。**与以往综述的比较**：本叙述性综述的发现与以往的系统分析一致并有所扩展。Huqh等人（2022年）在其关于儿童唇腭裂人工智能应用的系统评价中，确定了12项研究，显示诊断和预测应用的准确率为85%—95.6%，但指出缺乏前瞻性多中心验证。Barreto Zambrano等人（2025年）在对25项研究的范围综述中，确定深度学习是应用最频繁的方法学（44%），并将人工智能应用分为六个领域。当前的叙述性综述扩展了这一框架，纳入了智能手机工作流程、Vision Transformer架构和大语言模型方面的最新进展，这些在早期综述中未被体现。Shah等人（2025年）在使用改良PROBAST工具对25项研究进行系统评价后得出结论，与手工方法相比，人工智能表现出可变的可靠性，在广泛应用前需要进一步发展。这一结论与本综述中呈现的质量评估结果一致，即预测模型研究在开发方面主要表现为低偏倚风险，但外部验证有限。与Almoammar（2024年）的综述（该综述对从诊断到治疗的人工智能应用进行了全面分析）相比，当前的叙述性综述增加了截至2026年4月的更新证据，包括PROBAST + AI质量评估框架和经济影响分析，后者为实施可行性提供了背景。Dhillon等人（2021年）的范围综述主要关注诊断和言语评估应用；当前的综述显著拓宽了范围，包括美学评估、遗传风险预测、经济建模和术前矫治。这些比较表明，该领域正在快速发展，出现了早期综述未涵盖的新应用和方法学。**新兴创新与全球卫生意义**：本综述中确定的几项新兴创新因其解决唇腭裂诊疗全球差异的潜力而值得特别关注。Nalabothu等人（2025年）开发的用于术前矫治板制作的基于智能手机的人工智能工作流程代表了一种范式转变，通过消除对昂贵口内扫描仪的需求并能够在资源有限的环境中进行现场治疗。该创新将所需临床就诊次数从11—14次减少到平均5次，同时保持临床疗效，直接解决了限制低资源环境可及性的诊疗负担。自动化矫治板计算（处理时间低于3分钟）、3D打印和智能手机扫描的融合创造了一个完整的数字化工作流程，可以使术前矫治护理的普及化。这些进展与经济分析相吻合，后者表明唇腭裂修复干预措施具有非常有利的成本效益比（每避免一个DALY 62.8美元），这意味着人工智能增强的工作流程可能通过减少专科医生时间和设备成本来进一步提高投资回报率。

尽管在研究环境中取得了有希望的结果，但在人工智能技术能够广泛应用于唇腭裂诊疗临床实践之前，必须解决几个显著的局限性和实施挑战。**数据集局限性与质量**：唇腭裂诊疗中大多数人工智能研究受限于小样本量，许多研究用于模型开发的患者少于500人。类别不平衡很常见，某些唇裂类型（如双侧唇腭裂）代表性不足。人口多样性经常受限，60%的已发表研究在亚洲人群中进行。数据质量顾虑包括：（1）回顾性数据收集引入选择偏倚；（2）成像协议和设备的变异性；（3）不完整的随访数据；（4）缺失的结局标注。这些局限性影响了模型的泛化能力，并可能导致在应用于不同人群或临床环境时性能下降。**验证与可重复性**：唇腭裂人工智能文献中外部验证仍然有限。2025年的一项系统评价发现，只有34%的FDA批准的人工智能成像产品经过多机构验证。关键的可重复性挑战包括：（1）由于隐私问题，公开的唇腭裂数据集可用性有限；（2）开源代码共享不频繁；（3）超参数优化策略的变异性；（4）对硬件依赖性（GPU类型、超声机器型号、三维扫描仪平台）报告不足。这些因素限制了对报告结果的独立验证，并阻碍了协作模型开发。**临床部署障碍**：有几个障碍阻碍了人工智能研究向临床实践的转化：监管挑战：基于人工智能的医疗器械在临床部署前需要获得监管机构（FDA， CE， NMPA）的批准。当前的监管途径是为传统医疗器械设计的，可能无法完全解决人工智能特有的考量，例如持续学习算法。只有有限数量的唇腭裂人工智能应用获得了监管许可。与医疗保健系统的整合：与现有医院信息系统（HIS/PACS）的整合需要大量的技术基础设施和互操作性标准。许多医疗机构，特别是资源有限的环境，缺乏无缝整合人工智能所需的IT基础设施。模型可解释性：虽然一些用于唇腭裂的人工智能模型提供了可解释的输出（例如，注意力图），但许多深度学习方法仍然是黑匣子，不解释其决策过程。这限制了临床医生的信任，并且在人工智能建议与临床判断不同时可能引发伦理问题。数据隐私与安全：人工智能系统需要访问敏感患者数据以进行训练和操作。在确保符合数据保护法规（GDPR， HIPAA）的同时支持模型开发，仍然存在挑战。对数据泄露的担忧可能会限制机构采用人工智能技术的意愿。成本和资源要求：人工智能系统的实施需要大量投资于硬件、软件、培训和持续维护。这些成本对于较小的机构或资源有限的环境可能难以承受，可能加剧医疗保健差异。

**未来方向与新兴技术**
未来唇腭裂诊疗中的人工智能研究应解决该领域特有的挑战，超越通用人工智能应用，开发考虑到唇腭裂管理复杂性、纵向特性的专业化解决方案。**具有多时间点随访的高质量三维唇腭裂数据**：亟需建立标准化的、高质量的三维成像数据集，并具有纵向随访标注。此类数据集应包括：（1）术前、术后即刻及长期随访成像；（2）用于唇腭裂严重程度、手术结果和并发症的标准化标注协议；（3）多样化人群代表性；（4）与功能结果（言语、听力、生活质量）的相关性。建立此类数据集将能够开发长期结果预测模型，并促进多机构验证。**人工智能临床试验设计**：需要前瞻性临床试验来评估人工智能对长期面部生长、言语发展和生活质量等硬终点的影响。试验设计应结合：（1）人工智能辅助治疗与标准治疗的随机对照比较；（2）跨中心的标准化结果测量；（3）长期随访以捕捉延迟效应；（4）成本效益分析；（5）患者报告的结果指标。人工智能临床试验的监管框架需要制定，以解决诸如试验期间算法更新等独特考量。**用于多机构协作的联邦学习**：联邦学习方法可能解决数据稀缺和隐私问题，同时促进跨机构的协作模型开发。这种方法允许在分布式数据集上进行模型训练，而无需集中敏感的患者数据，可能在保持隐私保护的同时加速进展。

**结论**
本叙述性综述表明，人工智能已成为贯穿唇腭裂全病程诊疗的变革性力量，从产前检测到长期结果评估。当前证据表明，深度学习模型在受控环境中达到了与专科临床医生相当或超越的诊断性能（AUC 0.93—0.971），而基于智能手机的人工智能工作流程正在普及资源有限环境中术前矫治护理的可及性。机器学习方法在遗传风险分层、自动化言语评估和唇腭裂诊疗交付的经济优化方面展现出前景。然而，从研究到临床实践的转化仍受限于有限的外部验证、小规模且人口同质化的数据集、监管不确定性以及与现有医疗保健信息系统整合的不足。为了充分发挥人工智能在唇腭裂诊疗中的潜力，未来的努力必须优先在不同人群中进行多机构前瞻性验证，建立标准化的报告框架，开发基于人工智能的医疗器械的监管途径，以及解决全球专科唇腭裂服务可及性差异的公平部署策略。可解释的人工智能算法、先进的成像模态、便携式数字技术和精准医学方法的融合，在坚持获得全面唇腭裂诊疗所需的多学科、以患者为中心的框架下，为改善结果提供了巨大希望。

引领行业 | 聚焦麦特绘谱代谢组学整体解决方案>>

揭秘单细胞测序-深入了解这项正在改变我们开展科学研究的技术>>

对同一细胞中的转录组和表观基因组进行同时分析（使用细胞核分离试剂盒简化样本制备工作流程）>>

「大小鼠繁育与健康管理」指导海报，点击即可免费领取电子版或实体海报>>

热点排行

生物通微信公众号

在线客服

微信

新浪微博

我要投稿

返回顶部