自动化根尖病变分割与基于面积的根尖周指数（PAI）评估：一项针对根尖X光片的深度学习对比研究

时间：2026年5月19日

来源：BMC Oral Health

编辑推荐：

摘要背景人工智能可以标准化根尖区域的评估，但很少有研究能够将像素级别的分割结果映射到基于统一协议的临床可解释的根尖指数（PAI）分类中。方法我们回顾性地收集了900张经过匿名处理的根尖X光片，并添加了专家标记以及患者级别的数据划分（训练集/验证集/测试集：594/145/161）

摘要

背景

人工智能可以标准化根尖区域的评估，但很少有研究能够将像素级别的分割结果映射到基于统一协议的临床可解释的根尖指数（PAI）分类中。

方法

我们回顾性地收集了900张经过匿名处理的根尖X光片，并添加了专家标记以及患者级别的数据划分（训练集/验证集/测试集：594/145/161）。四种模型（U-Net、ResUNet34、DeepLabV3、HRNet）在相同的预处理、数据增强以及二元交叉熵（BCE）+ Dice损失函数下进行了训练。在独立的测试集上，我们在预先指定的操作点计算了分割结果和图像级别的检测指标（灵敏度、特异性、精确度、F1分数、AUC）。基于面积的PAI评分（aPAI）是通过使用预设的阈值来计算病变区域与图像区域的比例得出的，它为传统的PAI分类提供了一个定量的、基于大小的替代指标，而不需要考虑边缘定义或小梁结构变化等定性放射学特征。

结果

DeepLabV3在检测效果上最为平衡（准确率为90.1%，灵敏度为92.8%，F1分数为91.8%），而HRNet的特异性（87.5%）和精确度（91.4%）最高。Friedman/Wilcoxon分析显示模型之间存在显著差异。经过Bonferroni校正后（调整后的α值=0.0083），只有DeepLabV3与U-Net之间的比较在二元病变检测和aPAI分类方面仍然具有统计学意义（p值均<0.0012）；其他模型对之间的差异均未达到校正后的显著性阈值。aPAI分类的准确率范围为72.7%（U-Net）到84.5%（DeepLabV3）。