人工智能辅助判读标准化皮肤点刺试验:提升过敏诊断准确性与效率的创新方法

时间:2025年10月3日
来源:Nature Communications

编辑推荐:

针对皮肤点刺试验(SPT)判读存在操作者依赖性强、变异性大的问题,研究人员开发了人工智能(AI)辅助判读方法用于皮肤点刺自动化试验(SPAT)结果评估。研究表明AI测量与医师测量高度相关(Pearson r=0.83),特异性达98.4%,敏感性85.0%,显著降低观察者间/内变异性,读片时间减少3.7倍,为过敏诊断提供了标准化解决方案。

广告
   X   

在全球范围内,约30%的人口患有气传过敏原引起的过敏性疾病,其中花粉和屋尘螨过敏是最常见的类型。过敏性疾病由对特定过敏原的致敏反应驱动,这一过程中B细胞产生特异性免疫球蛋白E(IgE),后者与肥大细胞上的Fce受体结合,引起受体交联和局部组胺释放。
皮肤点刺试验(SPT)自1959年首次引入以来,部分模拟了这一系列事件,通过将少量过敏原注入皮肤引发局部反应,从而为识别过敏性致敏提供了诊断工具。尽管近年来有一些技术进步,SPT仍然是诊断过敏性疾病的金标准, alongside血清特异性IgE测量。然而,SPT的准确性高度依赖于操作者的专业知识、使用的设备和测试溶液,多项研究强调了这些因素导致的显著变异性。美国多个过敏协会的联合工作组呼吁SPT程序的标准化和一致性,德国过敏学学会的调查也强调了德国不同医院和诊所之间SPT执行的巨大差异。
最近,一种自动化设备——皮肤点刺自动化试验(SPAT)被开发出来,以提高一致性和减少操作者依赖性变异。SPAT设备同时执行12个表皮点刺,施加固定量的过敏原和控制点刺力于患者前臂。15分钟后,捕获前臂图像,以便从业者数字测量和解释风团反应。两项独立验证研究表明,与传统SPT相比,SPAT具有较低的受试者内变异性,并提供更一致的测试结果。这些进步现已应用于多个临床实践,为患者提供标准化过敏测试。
为了进一步标准化SPT过程的完整链条,本研究旨在训练和验证一种使用人工智能(AI)的判读方法,以检测和测量SPAT图像上的风团,从而支持从业者判读测试结果。
研究团队招募了897名患者用于AI算法的训练和临床验证,最终868名患者被随机分配到训练队列(651人,75%)和验证队列(217人,25%)。AI算法训练使用了7812个风团(651名患者)的手动标注数据。为了验证AI测量,将治疗医师测量的2604个风团(217名患者)的最长风团直径与AI测量进行比较。此外,在一个单独的测试队列(95名患者,1140个风团)上验证了AI辅助判读。
研究表明,AI测量的最长风团直径与医师测量显示强相关性(Pearson r=0.83;p<0.0001)。AI与医师测量之间的绝对差异中位数为0.2毫米(95% CI:0.1-0.2),相对差异中位数为-2.8%(95% CI:-5.1至-0.8)。基于阳性(≥4.5毫米)和阴性(<4.5毫米)测试结果的数量评估准确性,所有2604个风团(过敏原和对照)的特异性为98.4%,敏感性为85.0%,阳性预测值(PPV)为93.3%,阴性预测值(NPV)为96.2%。仅考虑过敏原风团时,敏感性较低(77.4%),而特异性(98.6%)、PPV(90.7%)和NPV(96.1%)均保持在90%以上。
假阳性和假阴性测试结果分别占1.2%和3.4%,准确度为95.4%。不准确的主要原因包括疤痕、色素沉着、深色皮肤和多毛前臂。通过对测试队列的分析显示,在1140个风团中,5.8%的AI测量被治疗医师调整(调整风团的中位数变化和四分位距:-1.4毫米(-2.1毫米至-0.8毫米)),调整导致测试结果解释(阳阴性转换)改变的仅占0.5%。
研究还评估了观察者间和观察者内变异性。三名医师对100名患者(1200个风团)的评估显示,观察者间变异性的变异系数(CoV)中位数为19.8%(IQR:11.7-29.8%)。CoV在甘油对照风团中最高(24.2%,IQR:14.8-40.6%),其次是过敏原风团(20.3%,IQR:12.0-30.2%),组胺风团最低(12.3%,IQR:7.8-18.1%)。当三名医师使用AI辅助判读评估这些风团时,CoV显著降低(p<0.0001和p=0.002)。观察者内变异性评估显示,每位医师测量30名患者(720个风团)两次,变异系数分别为:医师1为12.9%(IQR:5.5-23.9%),医师2为9.4%(IQR:3.4-22.3%),医师3为6.5%(IQR:3.3-11.4%)。使用AI辅助判读后,CoV显著降低(p<0.0001)。
此外,研究评估了医师手动判读或使用SPAT AI辅助判读皮肤反应所需的时间。发现医师使用AI辅助判读完成判读的速度比手动判读快3.7倍(中位数:23.9秒,IQR:11.3-58.5秒 vs 中位数:88.5秒,IQR:57.3-154.5秒)(p<0.0001和p=0.0008)。
研究中未报告不良事件。
主要技术方法包括:使用SPAT设备进行自动化皮肤点刺测试,采集35张数字图像;基于U-net分割模型和传统白盒算法的AI辅助判读软件开发;使用Feret最大直径算法测量最长风团直径;多中心前瞻性研究设计,纳入比利时5家医院和德国1家医院的963名患者(11,556个风团)进行训练、验证和测试。
analyzed by comparing the coefficient of variation of the longest wheal diameter measured twice by three physicians with or without support from the Al-assisted readout(n=30 patients randomly selected from the validation cohort). Data are presented as Tukey box and whiskers, including median with interquartile range.Repeated measures ANOVA and Sidak's multiple comparison test were performed to compare AI-assisted readout to manual readout.
研究结论表明,AI辅助判读方法用于SPT结果解释显示出显著的准确性,减少了观察者间和观察者内变异性,并缩短了判读所需时间。这些创新将有助于更高效、准确地诊断过敏,对常规临床实践和研究都有益处。SPAT设备和AI技术提供的增强精度和加速结果不仅简化了工作流程,而且通过更快、更可靠地识别过敏皮肤反应, potentially改善患者结局。这种创新方法代表了过敏诊断领域向前迈出的有希望的一步。
讨论部分指出,AI辅助判读的高性能可能是因为应用了专利成像技术,使用2D相机和改变照明角度结合U-net分割模型和额外的基于规则的算法来测量最长风团直径,从而克服了过去其他人可能面临的许多挑战。研究的优势在于使用大量真实案例训练和验证AI算法,包括对照和过敏原诱导的风团,并在两个独立队列中进行临床验证。研究的局限性在于AI辅助判读仅依赖于通过SPAT设备对皮肤反应进行成像,外部有效性需要确认,因为当前数据集中疤痕、色素沉着、深色皮肤、过多毛发和纹身的前臂有限。为了解决AI算法在这些情况下可能性能较低的问题,未来训练队列的数据集将丰富这些案例。此外,在真实世界设置中与其他医院的案例进行外部验证将进一步证明AI辅助判读方法的稳健性。
该研究发表在《Nature Communications》杂志,为过敏诊断领域提供了重要的技术进步,通过AI辅助标准化判读过程,显著提高了诊断的准确性和效率,为全球过敏患者的诊断和管理提供了新的解决方案。

生物通微信公众号
微信
新浪微博


生物通 版权所有