早期的口腔癌检测研究主要依赖于传统的机器学习(ML)技术,这些技术主要用于基于纹理的特征分析,并在某些情况下被整合到混合框架中以支持图像分类任务。然而,计算能力和影像分析技术的进步使得深度学习(DL)方法成为近年来的主要方法,因为它们具有强大的处理、分析和解释复杂图像数据的能力。其中,卷积神经网络(CNNs)是大多数研究的核心,采用了诸如VGG-16/19、ResNet-34/50/101/152和DenseNet-121/161/169/201等成熟架构。
尽管这些DL模型取得了有希望的结果,但它们在召回率、特异性和错误率方面仍存在一定的局限性,可能导致漏诊或假阳性结果。AI和深度学习的进一步发展促进了更准确、更高效模型的开发,这些模型能够可靠地识别高风险个体并检测口腔癌和癌前病变。
YOLO作为一种先进的基于卷积神经网络的物体检测框架,因其实时性能、简洁的架构和高检测效率而受到广泛认可。More等人对三种物体检测模型(Faster R-CNN、SSD和YOLO)进行了比较分析,得出YOLO最适合访问控制环境的结论。其优势包括简化的架构以及在训练过程中能够从整个图像上下文中学习的能力。与传统多阶段方法不同,YOLO通过端到端优化显著减少了处理时间并提高了检测准确性。
自2015年问世以来,YOLO系列模型经历了快速而持续的发展。2023年1月发布的YOLOv8在检测性能和计算效率方面取得了显著改进,成为实时物体检测领域的一个有前景的进展。
现有文献表明,关于YOLO在OPMDs和口腔癌分类应用方面的科学研究较少。这突显了探索和实施先进AI架构的必要性,以提高该领域的诊断效率、准确性和实时适用性。因此,本研究旨在提出YOLOv8作为诊断深度学习模型,并评估其算法在利用数字口腔内图像检测和分类口腔潜在恶性疾病和口腔癌方面的有效性。
研究设计
这项前瞻性研究在哈里亚纳邦罗塔克市牙科科学研究生院的口腔病理学与微生物学系进行,属于印度医学研究委员会(ICMR)资助的全国项目的一部分。根据项目协议,纳入了临床诊断为红色和/或白色病变(OPMDs)或疑似恶性肿瘤(口腔癌)的溃疡患者。作为参考,还使用了临床健康的口腔黏膜图像。
基线模型性能(未经数据增强处理)
基线模型在未应用任何数据增强的583张原始图像上进行训练。在这些条件下,模型的总体精度为0.836,召回率为0.729,mAP50为0.819,mAP50-95为0.501。按类别评估显示,癌症类别的精度为0.827,召回率为0.765,mAP50为0.845,mAP50-95为0.536;癌前病变类别的精度为0.841,召回率为0.711,mAP50为0.806,mAP50-95为0.483。
讨论
口腔癌筛查是常规口腔检查的重要组成部分,旨在尽早发现表明恶性肿瘤的病理变化。在口腔恶性肿瘤中,OSCC最为常见,它可以原发(OSCC-dn)或通过口腔潜在恶性疾病(OPMDs)的恶性转化继发(s-OSCC)。由于早期口腔病变患者通常首先就诊于全科医生(包括内科和牙科医生),这些临床医生起着关键作用。
结论
所提出的基于YOLOv8的深度学习框架在自动检测和区分口腔潜在恶性疾病和口腔癌方面表现出强大的性能,证明了其技术可行性和概念验证的实用性。虽然结果表明它具有快速、无创的决策支持潜力,但在临床或社区部署之前仍需进一步的外部和前瞻性验证。未来的工作将集中在扩展数据集上。
作者贡献声明
阿克拉·巴蒂(Achla Bharti):撰写原始草案、验证、监督、方法论、调查、正式分析、数据管理、概念化。
尼基塔·卡希亚普(Nikita Kashyap):撰写原始草案、验证、监督、方法论、调查、正式分析、数据管理、概念化。
玛拉·坎博杰(Mala Kamboj):撰写原始草案、验证、监督、方法论、调查、正式分析、数据管理、项目管理、软件开发、概念化。
卡马尔迪普·乔希(Kamaldeep Joshi):撰写修订稿及
CRediT作者贡献声明
阿克拉·巴蒂(Achla Bharti):撰写与编辑、可视化、验证、监督、资源管理、方法论、调查、正式分析、数据管理、概念化。
尼基塔·卡希亚普(Nikita Kashyap):撰写与编辑、可视化、资源管理、方法论、调查、正式分析、数据管理、概念化。
玛拉·坎博杰(Mala Kamboj):撰写与编辑、撰写原始草案、可视化、验证、监督、资源管理、项目管理。
利益冲突声明
作者声明与本研究无任何利益冲突。
致谢
作者衷心感谢印度医学研究委员会(ICMR)在“生成烟草引起的口腔病变医学影像数据集(MIDAS)以促进印度健康研究”(参考编号BMI/014(03)/TF/2023,ID编号2023-20012)项目下的支持。