编辑推荐:
骨龄评估在儿科生长 disorders 诊断中至关重要,AI系统较传统方法在准确性和可重复性上更具优势。本研究纳入203例患儿(平均9岁),比较骨龄AI软件(BoneView)与Greulich-Pyle(GP)和Tanner-Whitehouse 2型(TW2)评估的准确性,结果显示AI MAE(1.38年)与GP(1.30年)相当且优于TW2(2.86年),AI与TW2相关性较弱(r=0.857 vs 0.490)。研究证实AI可提升骨龄评估一致性,但需在多元族群中进一步验证。
骨龄评估在评估儿童生长障碍方面至关重要。与传统方法相比,人工智能(AI)系统在准确性和重复性方面具有潜在的优势。
比较一种市售的基于人工智能的软件(BoneView BoneAge,法国巴黎Gleamer公司开发)与两种人工评估方法——Greulich-Pyle(GP)图谱和Tanner-Whitehouse第2版(TW2)在儿童群体中的表现。
这项概念验证研究包括了203名儿童患者(平均年龄9.0岁;年龄范围2.0至17.0岁),他们因疑似内分泌或生长相关问题接受了手部和腕部X光检查。排除技术上不合适的图像后,使用AI和GP评估方法对157例病例进行了分析。另有35名患者由儿科内分泌科医生使用TW2方法进行了评估。性能指标通过平均绝对误差(MAE)、均方根误差(RMSE)、偏差以及皮尔逊相关系数来衡量,以实际年龄作为参考。
AI模型的平均绝对误差(MAE)为1.38岁,与放射科医生基于GP的估计值(MAE为1.30岁)相当,且优于TW2(MAE为2.86岁)。RMSE值分别为1.75岁、1.80岁和3.88岁。AI的偏差最小(-0.05岁),而基于TW2的评估方法系统性地低估了骨龄(偏差为-2.63岁)。AI和GP与实际年龄之间的相关性很强(r=0.857和r=0.894),而TW2的相关性较弱(r=0.490)。
BoneView的准确性与放射科医生评估的GP方法相当,并且在该队列中优于TW2的评估结果。基于AI的系统可以提高儿童骨龄评估的一致性,但需要在种族多样性人群中进行仔细验证。

骨龄评估在评估儿童生长障碍方面至关重要。与传统方法相比,人工智能(AI)系统在准确性和重复性方面具有潜在的优势。
比较一种市售的基于人工智能的软件(BoneView BoneAge,法国巴黎Gleamer公司开发)与两种人工评估方法——Greulich-Pyle(GP)图谱和Tanner-Whitehouse第2版(TW2)在儿童群体中的表现。
这项概念验证研究包括了203名儿童患者(平均年龄9.0岁;年龄范围2.0至17.0岁),他们因疑似内分泌或生长相关问题接受了手部和腕部X光检查。排除技术上不合适的图像后,使用AI和GP评估方法对157例病例进行了分析。另有35名患者由儿科内分泌科医生使用TW2方法进行了评估。性能指标通过平均绝对误差(MAE)、均方根误差(RMSE)、偏差以及皮尔逊相关系数来衡量,以实际年龄作为参考。
AI模型的平均绝对误差(MAE)为1.38岁,与放射科医生基于GP的估计值(MAE为1.30岁)相当,且优于TW2(MAE为2.86岁)。RMSE值分别为1.75岁、1.80岁和3.88岁。AI的偏差最小(-0.05岁),而基于TW2的评估方法系统性地低估了骨龄(偏差为-2.63岁)。AI和GP与实际年龄之间的相关性很强(r=0.857和r=0.894),而TW2的相关性较弱(r=0.490)。
BoneView的准确性与放射科医生评估的GP方法相当,并且在该队列中优于TW2的评估结果。基于AI的系统可以提高儿童骨龄评估的一致性,但需要在种族多样性人群中进行仔细验证。

生物通 版权所有