编辑推荐:
我们知道我们在T3p上发现了一些有趣的东西,这是一种在乳腺癌中发现的小RNA,但在正常组织中却不存在。
我们知道我们在T3p上发现了一些有趣的东西,这是一种在乳腺癌中发现的小RNA,但在正常组织中却不存在。在2018年被描述后,这个分子带领我们的团队进行了为期六年的旅程,系统地绘制了所有主要癌症类型的孤儿非编码RNA(oncRNAs),了解哪些是真正驱动疾病的,并通过简单的血液测试展示了它们在监测患者方面的作用。
在今天发表的一篇论文中,我们展示了我们如何从挖掘癌症基因组数据到构建机器学习分类器,在小鼠中开发大规模功能筛选,并最终在近200名乳腺癌患者中验证这些RNA作为基于血液的生物标志物。
我们的第一个主要发现是我们在乳腺癌中看到的并不是唯一的。我们系统地分析了来自32种癌症类型的癌症基因组图谱的小RNA测序数据,发现大约26万个这些癌症特异性小RNA(我们称之为oncRNAs)分布在我们检查的每种癌症中。
这些RNA的出现并不是随机的,每种癌症类型都会产生不同的oncRNA表达模式。例如,肺癌细胞表达一组不同于乳腺癌的oncRNAs。机器学习模型可以利用这些模式对癌症类型进行分类,准确率为90.9%。我们在938个肿瘤的独立队列中验证了这些模式,准确率达到82.1%。
在特定的癌症中也存在变异:基底乳腺肿瘤产生的oncRNAs模式与腔内肿瘤不同,这表明可能存在我们甚至还不知道的细分。这表明这些分子告诉我们一些关于癌细胞状态的基本信息。换句话说,oncRNAs的存在和缺失模式就像“数字分子条形码”一样,捕捉癌细胞的身份,从癌症类型到亚型,甚至细胞状态。
虽然这组新的癌症生物标志物被证明是非常有用的,但我们也有兴趣知道癌细胞是否可以采用这些癌症新兴RNA物种来设计新的致癌途径。
为了找到答案,我们创建了大规模的筛选文库,对乳腺癌、结肠癌、肺癌和前列腺肿瘤中的大约400种oncRNA进行编码,并使用慢病毒载体将它们引入癌细胞。对于一半,我们过度表达了oncRNAs。对于另一半,我们使用“Tough decoyy”结构来击倒它们。然后,我们将这些细胞注射到小鼠体内,寻找在肿瘤生长过程中哪些oncRNAs使细胞具有竞争优势。
在异种移植小鼠模型中,约5%显示出明确的表型。我们详细验证了两种乳腺癌的oncRNAs。其中一个促进了上皮-间质转化,这是癌症进展和转移的关键过程。另一种激活E2F靶基因,促进增殖。在独立细胞系模型中,两者均显著增加肿瘤生长和转移性定植。
当我们回顾患者肿瘤数据时,我们发现表达这些相同的oncRNAs的肿瘤表现出类似的通路调节。在TCGA样本和我们自己的模型中看到相同的生物模式给了我们对结果的信心。
临床上最令人兴奋的是,癌细胞将这些RNA释放到血液中,追踪它们可以告诉你病人的情况。
我们分析了来自9种组织类型的25种癌细胞系的无细胞RNA,发现大约30%的oncRNAs是活跃分泌的。为了验证,我们在I-SPY 2新辅助化疗试验中分析了192名乳腺癌患者的血清,在治疗前后采集血液,并计算了总oncRNAs负荷的变化。
这个简单的指标具有显著的预测性。化疗后oncRNAs残留量高的患者总生存率差近4倍。即使我们控制了标准的临床指标,如病理完全缓解和残余癌症负担,这仍然是正确的。
这是我们的登月计划。我们知道这些RNA会在血液中出现,但它们是否能在实际的患者样本中提供信息还不得而知。我们只需要1毫升血清就能得到强烈的信号,这一事实令人惊讶。
这解决了一个真正的临床问题:用无细胞DNA等标记物监测乳腺癌中最小残留疾病是具有挑战性的,因为肿瘤不会脱落太多DNA,尤其是在早期阶段。基于RNA的监测可能会提供一条前进的道路,因为癌细胞会主动分泌RNA,而不是被动地释放DNA。
还有很多悬而未决的生物学和临床问题。这些功能性的oncRNAs究竟是如何工作的?它们是否与蛋白质相互作用?和其他RNA ?oncRNA动态是否可以用于实时指导治疗决策?它能更早地发现癌症复发吗?它们能帮助临床医生更好地对患者进行分层来指导治疗吗?这些问题需要更深入的研究和更大规模的前瞻性试验来回答。
但是,oncRNAs在血液中提供癌症特异性信号的核心发现已经在朝着翻译的方向发展。我们与生物技术公司Exai Bio密切合作,开发基于RNA的诊断方法,该公司一直在为癌症检测和分类建立人工智能模型和各种数据集。
任何好的翻译工作都需要一个村庄,但是当你计算处理成千上万的样本时,很容易忽略这样一个事实,即每一个样本都代表着一个病人的故事。这些样本来自参加试验、献血和参与研究的人,他们希望这些样本能帮助他人。能够通过严谨的科学来尊重这一点是激励我们整个团队的动力。
我们认为oncRNAs代表了一类新的癌症发生分子,它既是驱动因素,也是生物标志物。我们希望这个已经开源的资源能够为这个领域开辟新的方向。
生物通 版权所有