编辑推荐:
研究人员利用人工智能根据常规收集的肿瘤活检图像来预测肿瘤中数千个基因的活性。它可以指导治疗,而不需要昂贵的基因组测试。
为了确定癌症的类型和严重程度,病理学家通常在显微镜下分析肿瘤切片。但是,为了弄清楚是什么基因变化驱动了肿瘤的生长——从而获得指导治疗的信息——科学家们必须对从肿瘤中分离出来的RNA进行基因测序,这一过程可能需要数周时间,花费数千美元。
现在,斯坦福大学医学院的研究人员开发了一种人工智能驱动的计算程序,可以仅根据活检的标准显微镜图像预测肿瘤细胞内数千个基因的活动。该工具于11月14日在线发表在《自然通讯》上,它是使用来自7000多个不同肿瘤样本的数据创建的。该团队表明,它可以使用常规收集的活检图像来预测乳腺癌的遗传变异,并预测患者的预后。
生物医学数据科学教授、该论文的资深作者Olivier Gevaert博士说:“这种软件可以用来快速识别患者肿瘤中的基因特征,加快临床决策,为医疗保健系统节省数千美元。”
这项工作也由斯坦福大学研究生Marija Pizuria和博士后郑元宁博士和Francisco Perez博士领导。
由基因组学驱动
临床医生越来越多地指导选择癌症治疗方法——包括化疗、免疫疗法和基于激素的疗法——不仅根据患者的癌症影响到哪个器官,而且根据肿瘤使用哪些基因来促进其生长和扩散。打开或关闭某些基因可能会使肿瘤更具侵袭性,更容易转移,或者对某些药物的反应或多或少。
然而,获取这些信息往往需要昂贵且耗时的基因组测序。
Gevaert和他的同事们知道,单个细胞内的基因活动可以以人眼通常无法察觉的方式改变这些细胞的外观。他们求助于人工智能来寻找这些模式。
研究人员从16种不同癌症类型的7584例癌症活检开始。每个活组织切片都被切成薄片,并使用苏木精和伊红染色的方法进行准备,这是可视化癌细胞整体外观的标准方法。有关癌症转录组的信息——细胞积极使用的基因——也可以获得。
工作模型
在研究人员整合了他们的新癌症活检以及其他数据集(包括转录组数据和来自数千个健康细胞的图像)之后,他们命名为SEQUOIA(使用线性化注意力的基于幻灯片的表达量化)的人工智能程序能够从染色图像中预测超过15,000种不同基因的表达模式。对于某些癌症类型,人工智能预测的基因活性与真实基因活性数据的相关性超过80%。一般来说,初始数据中包含的任何特定癌症类型的样本越多,该模型对该癌症类型的表现就越好。
Gevaert说:“我们对模型进行了多次迭代,才达到我们对其性能满意的程度。”“但最终对于某些肿瘤类型,它达到了在临床中有用的水平。”
Gevaert指出,医生通常不是一次看一个基因来做临床决定,而是看包含数百个不同基因的基因特征。例如,许多癌细胞激活了数百个与炎症有关的基因,或数百个与细胞生长有关的基因。与预测个体基因表达的表现相比,SEQUOIA在预测这些大型基因组程序是否被激活方面更加准确。
为了使数据易于获取和解释,研究人员对SEQUOIA进行了编程,将遗传发现作为肿瘤活检的视觉地图显示出来,让科学家和临床医生看到遗传变异在肿瘤的不同区域是如何不同的。
预测患者预后
为了测试SEQUOIA在临床决策中的效用,Gevaert和他的同事们确定了该模型可以准确预测乳腺癌基因表达的乳腺癌基因,这些基因已经用于商业乳腺癌基因组测试。(例如,获得美国食品和药物管理局(Food and Drug administration)批准的MammaPrint测试可以分析70种乳腺癌相关基因的水平,为患者提供癌症复发风险的评分。)
“乳腺癌有许多经过充分研究的基因特征,这些特征在过去十年中已被证明与治疗反应和患者结果高度相关,”Gevaert说。“这使它成为我们模型的理想测试案例。”
该团队表明,SEQUOIA可以提供与mamaprint相同类型的基因组风险评分,仅使用肿瘤活检的染色图像。这些结果在多组不同的乳腺癌患者中得到了重复。在每一种情况下,被SEQUOIA确定为高风险的患者都有更差的结果,癌症复发率更高,癌症复发前的时间更短。
人工智能模型目前还不能用于临床环境——它需要在临床试验中进行测试,并得到FDA的批准,然后才能用于指导治疗决策——但Gevaert表示,他的团队正在改进算法,并研究其潜在的应用。他说,在未来,SEQUOIA可以减少对昂贵的基因表达测试的需求。
他说:“我们已经证明了这对乳腺癌是多么有用,现在我们可以用它来治疗所有的癌症,并观察任何存在的基因特征。”“这是一个我们以前没有的全新的数据来源。”
罗氏诊断公司的科学家也是这篇论文的作者。
这项研究的资金由国家癌症研究所提供(资助R01 CA260271),比利时美国教育基金会的奖学金,Fonds Wetenschappelijk Onderzoek-Vlaanderen,富布赖特西班牙委员会和根特大学的资助。
生物通 版权所有