编辑推荐:
针对CT图像机器学习模型易受成像参数差异影响的问题,提出基于元数据的无监督方法自动检测潜在偏倚因素,实验表明控制这些因素可使分类准确率提升5-15%,增强模型鲁棒性和临床适用性。
在计算机断层扫描(CT)图像上训练的机器学习模型对成像采集参数的变化非常敏感。即使是微妙的不一致性,也常常被人类的放射科医生忽略,但它们可能会显著降低模型的准确性。在临床实践中,由于成像协议和扫描仪特性的差异,数据集经常表现出异质性,这使得相关的元数据成为识别偏差来源的宝贵资源,但却往往没有得到充分利用。为了解决这个问题,我们提出了一种新颖的无监督方法,该方法能够系统地识别元数据中嵌入的混淆因素和潜在的混淆因素。我们方法的主要优势包括:自动检测具有影响力的元数据属性、对人工输入的依赖性极低,以及能够主动标记可能在模型部署后引起模型漂移的变量。在两个不同的CT数据集上的实证评估表明,控制我们方法识别出的因素可以显著提高模型性能,与这些因素未被控制的数据集相比,分类准确性提高了5%到15%。这些比较结果凸显了我们这种方法在大幅提高放射组学机器学习模型的鲁棒性、一致性和临床适用性方面的潜力。
在计算机断层扫描(CT)图像上训练的机器学习模型对成像采集参数的变化非常敏感。即使是微妙的不一致性,也常常被人类的放射科医生忽略,但它们可能会显著降低模型的准确性。在临床实践中,由于成像协议和扫描仪特性的差异,数据集经常表现出异质性,这使得相关的元数据成为识别偏差来源的宝贵资源,但却往往没有得到充分利用。为了解决这个问题,我们提出了一种新颖的无监督方法,该方法能够系统地识别元数据中嵌入的混淆因素和潜在的混淆因素。我们方法的主要优势包括:自动检测具有影响力的元数据属性、对人工输入的依赖性极低,以及能够主动标记可能在模型部署后引起模型漂移的变量。在两个不同的CT数据集上的实证评估表明,控制我们方法识别出的因素可以显著提高模型性能,与这些因素未被控制的数据集相比,分类准确性提高了5%到15%。这些比较结果凸显了我们这种方法在大幅提高放射组学机器学习模型的鲁棒性、一致性和临床适用性方面的潜力。
生物通 版权所有