背景:人工智能(Artificial Intelligence, AI)通过先进的诊断、预后和决策支持系统,正在迅速地变革医学领域。 目的:旨在总结人工智能在医疗保健领域的基本概念、临床应用、伦理问题及未来前景。 方法:研究人员进行了一项叙述性综述,审视了当前关于机器学习(Machine Learning, ML)、深度学习(Deep Learning, DL)、神经网络(Neural Networks)以及人工智能在主要医学专科中应用的证据。 结果:人工智能在诊断支持、预后预测、医学影像和个性化医疗方面展现出高性能。然而,与数据质量、泛化能力、可解释性及伦理关切相关的局限性仍是重大挑战。 结论:尽管人工智能在改善医疗服务和精准医学方面潜力巨大,但为实现安全的临床应用,仍需进行严格的验证、伦理监督以及恰当的监管。
引言部分阐述了人工智能(Artificial Intelligence, AI)的广义定义,即一系列使机器能够执行原本被认为是人类专属任务的计算方法。过去十年,计算能力、数据可获得性和算法能力取得了前所未有的进步,推动了人工智能方法和应用的指数级增长。在医学领域,人工智能已从实验性原型发展为逐步融入常规临床实践的解决方案。例如,大型语言模型(Large Language Models, LLMs)已在结构化环境中用于评估医生的知识与技能以及临床决策过程。同时,前沿算法和模型在放射学图像解读、药物发现与开发、手术等多个医疗领域达到了高度可靠性。此外,医疗管理和医学教育等关键领域也极大地受益于人工智能的应用。医院越来越多地采用基于人工智能的技术来增强医疗专业人员在诊断和治疗方面的专业知识。
在这一背景下,本叙述性综述旨在为临床医生提供一份关于现代人工智能主要概念和基础知识的实用指南。为此,内容全面涵盖了监督学习(supervised learning)与无监督学习(unsupervised learning)机器学习(Machine Learning, ML)、深度神经网络(deep neural networks,即深度学习Deep Learning, DL)、强化学习(reinforcement learning)、可解释性(explainability)和伦理考量等相关方面。此外,本综述概述了人工智能在主要医学领域的应用现状,重点强调了在放射学、心脏病学和肿瘤学等多个学科中的优势与不足。鉴于该主题的重要性,本文也探讨了人工智能在医疗流程中的作用。最后,讨论了诸如多模态数据流的整合、向先进技术的过渡、支持其临床采纳的监管框架以及关键伦理问题等未来前景。
基础部分首先探讨了人工智能的起源与基础问题,其概念主要源于图灵(Turing)的理论,图灵测试(Turing test)至今仍是评估机器智能行为的重要基准。在医学演变中,人工智能是能够革新诊断、预后和疾病治疗方法的变革性工具。
机器学习(Machine Learning, ML)是人工智能的一个分支,它通过算法使系统能够从数据中“学习”,而无需为特定功能进行专门编程。在医学中,监督学习和无监督学习是最相关的两种范式。监督学习如同使用答案库学习,算法使用已知输入数据(如医学图像或实验室检测结果)和期望输出(如疾病存在与否)的标记样本进行训练,典型应用包括医学图像肿瘤分类或治疗反应预测。无监督学习则类似没有预设答案的探索性学习,算法分析无标记数据并自主识别隐藏结构或模式,可用于发现疾病新亚型、对具有共同临床或分子特征的患者进行分组以支持个性化治疗。此外,强化学习(Reinforcement Learning)是一种通过奖惩反馈机制在与动态环境交互中迭代学习最优决策策略的补充范式,在手术机器人、自适应治疗优化等领域展现出前景。机器学习系统的开发涉及数据收集、算法选择及数据预处理等复杂过程,其性能评估依赖于一组与机器学习方法类型相关的指标,如准确率(Accuracy)、精确率(Precision)、召回率(Recall)、F1分数(F1-score)、受试者工作特征曲线下面积(Area Under the ROC Curve, AUC-ROC)等。
深度学习(Deep Learning, DL)是机器学习的一个子集,其特点在于使用具有多个隐藏层(“深”)的人工神经网络(Artificial Neural Networks, ANNs)。与传统机器学习方法通常需要手工特征预处理不同,深度学习算法能够直接从原始数据中自动学习特征层次。其灵感源于认知科学、神经科学和心理学,通过模拟大脑结构和行为建立计算模型。典型的人工神经网络包括输入层、进行大部分处理的隐藏层和产生最终结果的输出层。“深度”指大量隐藏层的存在,使网络能够从日益复杂和抽象的数据表示中学习核心内容。卷积神经网络(Convolutional Neural Networks, CNNs)因其在处理图像等网格拓扑数据方面的成功,在医学影像分析中尤为突出,能有效分类、分割和检测核磁共振(MRI)、计算机断层扫描(CT)等医学图像中的异常。其他架构也得到应用,例如在大型语言模型中,主要采用基于Transformer的架构,其特点是自注意力机制和深层结构,能够实现对人类语言的复杂理解和生成。此外,生成模型家族还包括变分自编码器(Variational Autoencoders, VAEs)、生成对抗网络(Generative Adversarial Networks, GANs)、基于分数的扩散模型等,它们能够学习数据分布并合成跨模态的新样本。
应用部分首先聚焦于人工智能在心血管疾病(Cardiovascular Diseases, CVDs)中的应用。除了基于影像的诊断,人工智能越来越多地应用于心血管医学的风险分层、表型分析和个性化预后评估。例如,利用临床相关变量开发的模型在预测住院死亡率方面表现出优异的区分度,无监督聚类还识别出与不同死亡风险相关的表型亚组。机器学习和深度学习模型不仅能解读影像,还能利用大规模纵向电子健康记录(Electronic Health Records, EHRs)和多模态临床数据集,揭示与心血管风险相关的微妙模式。此外,这些技术正被探索作为简化诊断流程的工具,以实现心律失常和心脏病等状况更快、更准确的识别,例如基于心电图(ECG)图像或超声心动图视频分析的深度学习模型在分类心血管疾病方面取得了高准确率。
人工智能与糖尿病(Diabetes Mellitus, DM)的结合同样日益紧密。由于人工智能方法能够从海量临床和生物数据集中发现复杂的非线性模式,其应用已从早期诊断、血糖预测扩展到自动化视网膜图像分析和长期并发症风险分层。多项研究证实了人工智能在预测心血管事件、疾病发生、肾脏疾病进展、糖尿病视网膜病变、神经病变及死亡风险等方面的强大能力。例如,利用纵向电子健康记录数据开发的深度学习模型能准确预测心力衰竭风险,基于视网膜特征的模型能早期预测心血管疾病。此外,人工智能的应用也从静态预测转向连续的动态风险分析,并开始整合多并发症预测框架。
在肿瘤学(Oncology)领域,人工智能通过利用组织病理学、放射学、基因组学和电子健康记录的大型数据集,正在变革癌症研究和精准肿瘤学。算法能够学习识别和分类癌细胞、评估肿瘤分级分期、检测指导治疗决策的分子生物标志物,这些方法主要建立在卷积神经网络(CNNs)等深度学习模型之上。例如,深度学习算法在检测乳腺癌淋巴结转移方面表现出了与病理学家相当甚至更高的准确性,能够对前列腺癌、乳腺癌等进行分类,其性能在某些场景下超越人类专家水平。此外,人工智能模型还被用于直接从组织病理学切片推断分子和免疫组化生物标志物,如预测雌激素受体(ER)状态、肿瘤分级和突变状态,从而在无需分子检测的情况下促进精准肿瘤学。这些模型也被用于预测癌症的长期结局,如复发、转移和生存率,通常整合组织学、基因组学、临床特征和放射学等多模态数据。
人工智能在放射学(Radiology)中正从自动化工具演变为诊断精准度的核心组成部分。生成式人工智能辅助放射科医生撰写CT和X线影像报告,可显著缩短报告时间。在图像分析和效率优化方面,人工智能也取得进展,自动化放射学报告生成(ARRG)方法已趋成熟。在肿瘤影像学中,人工智能通过应用影像组学(radiomics)展现出巨大潜力,例如对结直肠肝转移的CT和MRI进行机器学习和影像组学分析,以支持预后分层和治疗规划。尽管如此,可重复性、算法偏见和可解释性有限等挑战依然存在,数据集偏移(dataset shift)也是重要的技术限制。
在组学(Omics)领域,机器学习(ML)和人工智能(AI)在分析基因组学、转录组学、蛋白质组学等高通量技术产生的生物数据中发挥着主导作用。由于组学数据集通常特征多于样本,维度缩减是分析流程的关键步骤,包括去除冗余特征和提取相关特征。监督学习算法广泛用于疾病预测,无监督方法则常用于基于分子层面的患者分层。深度学习在解答特定生物学问题方面获得更多关注,如卷积神经网络用于检测非编码变异,循环神经网络用于蛋白质亚细胞定位和功能预测。多组学整合是新的挑战,涉及相关性、拼接、转换或基于模型等方法。
在医疗运营管理(Healthcare Operations)方面,人工智能和机器学习通过引入创新方法来优化工作流程、资源利用、临床支持系统和患者参与度,正在从根本上重塑其面貌。其应用涵盖员工排班优化、医院资源优化、急诊分诊、患者流量预测、住院时长预测等多个方面。强化学习(Reinforcement Learning)等方法也被应用于资源分配和大流行应对。这些研究描绘了一个人工智能驱动变革的医疗生态系统,同时倡导健全的数据治理、伦理设计和临床医生协作,以确保可持续和公平的采用。
在营养学(Nutrition)领域,人工智能通过个性化营养、基于移动设备的膳食评估、食品安全和供应链管理等方面重塑了营养科学和实践的格局。基于多组学数据和微生物组信息的机器学习模型可生成高度个性化的饮食建议,移动应用通过图像分析实现自动化食物识别。人工智能结合区块链技术增强了全球食品供应链的透明度和可追溯性。然而,数据隐私和模型可解释性等挑战仍然存在。
在数字病理学(Digital Pathology)中,全切片图像(Whole Slide Images, WSIs)扫描的普及推动了人工智能应用的发展,主要用于自动化病理医生耗时的任务,如诊断、报告、分级、微生物搜索和形态生物学特征的客观测量。计算机辅助诊断(CAD)通过分类、检测和分割等任务提高病理医生的工作效率和诊断信心,基于内容的图像检索(CBIR)可辅助罕见病诊断。尽管存在算法验证、可解释性、数据质量及监管批准等方面的改进需求,人工智能已成为数字病理学不可或缺的工具。
在其他学科中,人工智能的应用同样广泛。在疼痛医学中,多模态模型正被开发用于自动疼痛评估(Automatic Pain Assessment, APA),融合人口统计学、临床数据、生物信号和行为输出以客观检测疼痛。在外科领域,人工智能用于优化治疗策略、增强患者监测和支持个性化诊疗路径,并在机器人辅助手术和减少术中错误方面发挥作用。在麻醉学中,人工智能被用于改进监测和药物输注,例如通过闭环系统。在远程医疗和远程患者管理中,人工智能可促进患者报告结果和生物信号趋势的实时分析。在传染病领域,人工智能模型用于疫情预测和抗生素耐药性分析。
高级策略与展望部分探讨了人机交互(Human-Machine Interactions, HMI)中的机器学习。医疗环境中的HMI主要关注通过特定传感器(如EEG、EMG、ECG)直接从用户获取的实时生物医学数据,最著名的是脑机接口(Brain Computer Interface, BCI),它通过机器学习算法将大脑活动与任务相关联,允许残疾患者控制外部机器人设备。典型流程包括数据采集、滤波、计算功率谱密度以获取事件相关去同步/事件相关同步(Event-Related Desynchronization/Event-Related Synchronization, ERD/ERS)激活的频谱成分,使用Fisher评分方法提取特征,最后构建基于支持向量机(Support Vector Machine, SVM)的分类模型。
虚拟现实(Virtual Reality, VR)与机器学习的结合也在医疗环境中得到应用。VR通过多传感器反馈和机器学习算法分析患者的头部位置等多维数据,用于疾病评估、康复治疗和医学教育,例如模拟手术或病理场景,允许学生在沉浸式环境中学习和被评估。
伦理学方面强调了人工智能在生物医学领域快速发展所带来的伦理、法律和监管挑战。核心问题包括算法偏见(algorithmic bias),即AI模型复制或放大训练数据中预先存在的不平等;模型的透明度和可解释性(transparency and explainability),需要打开决策“黑箱”以建立信任;数据保护与隐私(data protection and privacy),需应对生成式AI系统在模型获取、开发和部署阶段对敏感信息保密性的威胁,并采用隐私增强技术。监管方面,医疗AI系统在美国受美国食品药品监督管理局(Food and Drug Administration, FDA)监管,在欧洲受医疗器械法规(Medical Device Regulation, MDR)约束。国际医疗器械监管机构论坛(International Medical Device Regulators Forum, IMDRF)为软件即医疗器械(Software as a Medical Device, SaMD)制定了风险分类框架。法律责任归属是另一个关键障碍,当前医疗事故框架主要将法律责任置于医疗专业人员身上,而AI算法在临床决策中扮演越来越积极的角色,这可能导致不公平的责任归属。需要建立明确的法律责任框架,以区分人为错误和算法故障。
结论部分指出,尽管结果有希望,但大多数用于预测分析的模型在数据源、机器学习/深度学习架构、可解释性、验证方法和泛化能力方面差异显著,在临床工作流程整合、透明度和监管批准方面也存在障碍。然而,趋势表明未来十年将更多地采用混合人工智能系统、跨机构联邦学习和可解释人工智能来支持临床决策。最后,尽管人工智能在生物医学领域的应用有望革新临床实践,但这一过程必须伴随着严格的伦理和监管方法,将偏见缓解、透明度、数据安全和适当的监管治理纳入所有利益相关者的协作框架中,唯有如此,人工智能才能成为所有患者健康可靠且有益的工具。
打赏