MIT:太方便了!语言软件竟能破解RNA病毒弱点

时间:2021年1月19日
来源:

编辑推荐:

流感和艾滋病病毒很难生产出有效的疫苗来对抗某些病毒,其中一个原因是这些病毒变异非常迅速。这使得他们能够通过一个被称为“病毒逃逸”的过程,逃避特定疫苗产生的抗体。

广告
   X   

流感和艾滋病病毒很难生产出有效的疫苗来对抗某些病毒,其中一个原因是这些病毒变异非常迅速。这使得他们能够通过一个被称为“病毒逃逸”的过程,逃避特定疫苗产生的抗体。

麻省理工学院的研究人员现在已经设计出一种新的方法来计算病毒逃逸的模型,这种模型最初是用来分析语言的。该模型可以预测哪些病毒表面蛋白片段更容易发生突变,从而使病毒得以逃逸,还可以识别出不太可能发生突变的片段,使其成为新疫苗的良好靶点。

“病毒逃逸是一个大问题,”麻省理工学院计算机科学和人工智能实验室计算与生物学组负责人Bonnie Berger说。“流感表面蛋白和艾滋病病毒包膜表面蛋白的病毒逃逸都是我们没有通用流感疫苗,也没有艾滋病病毒疫苗的重要原因,这两种疫苗每年都会导致数十万人死亡。”

1月14日发表在《Science》杂志上的一项研究,Berger和她的同事确定了流感、艾滋病和SARS-CoV-2疫苗的可能靶点。自从该论文被接受发表以来,研究人员还将他们的模型应用于最近在英国和南非出现的SARS-CoV-2的新变种。研究人员说,这项尚未经过同行评审的分析表明,病毒的基因序列应该进一步研究,以确定它们是否有可能逃脱现有的疫苗。

Berger和Bryan Bryson是麻省理工学院(MIT)生物工程助理教授,也是MIT和哈佛大学拉贡研究所(Ragon Institute of MGH)的成员,他们是论文的资深作者,一作是MIT的研究生Brian Hie。

蛋白质的语言

不同类型的病毒以不同的速度获得基因突变,而艾滋病毒和流感病毒是变异最快的病毒之一。为了使这些突变促进病毒逃逸,它们必须帮助病毒改变其表面蛋白质的形状,使抗体不再与它们结合。然而,这种蛋白质的变化不会使它失去功能。

麻省理工学院的团队决定使用一种被称为语言模型的计算模型对这些标准进行建模,这种模型来自自然语言处理(NLP)领域。这些模型最初是用来分析语言中的模式,特别是与某些单词一起出现的频率。然后,这些模型可以预测哪些单词可以用来完成一个句子,比如“Sally吃鸡蛋是为了……”所选单词必须语法正确,并且具有正确的含义。在本例中,NLP模型可能预测是“早餐”或“午餐”。

研究人员的关键洞察是,这种模型也可以应用于生物信息,如基因序列。在这种情况下,语法类似于确定由特定序列编码的蛋白质是否具有功能性的规则,语义类似于蛋白质能否呈现新的形状以帮助其逃避抗体。因此,能够使病毒逃逸的突变必须保持序列的语法性,但以一种有用的方式改变蛋白质的结构。

“如果一种病毒想逃离人类免疫系统,它不想自己突变,以致死亡或无法复制,”Hie说。“它想保持健康,但要把自己伪装得足够隐蔽,这样人类免疫系统就无法检测到它了。”

为了模拟这个过程,研究人员训练了一个NLP模型来分析在基因序列中发现的模式,这使得它能够预测具有新功能但仍然遵循蛋白质结构的生物学规则的新序列。这种建模的一个显著优点是它只需要序列信息,这比蛋白质结构更容易获得。这个模型可以用相对较少的信息进行训练——在这项研究中,研究人员使用了60000个HIV序列、45000个流感序列和4000个冠状病毒序列。

“语言模型非常强大,因为它们可以学习这种复杂的分布结构,并从序列变化中获得对函数的一些见解,”Hie说。“我们为每个氨基酸位置提供了大量的病毒序列数据,该模型在训练数据中学习了氨基酸共现和共变异的特性。”

阻断逃逸

一旦这个模型被训练出来,研究人员就用它来预测冠状病毒刺突蛋白、HIV包膜蛋白和流感血凝素(HA)蛋白的序列,这些蛋白或多或少都有可能产生逃逸突变。

对于流感,该模型显示,最不可能突变和产生病毒逃逸的序列位于HA蛋白的柄部。这与最近的研究一致,这些研究表明,针对HA柄的抗体(大多数感染流感或接种流感疫苗的人不会产生HA柄)可以提供几乎普遍的预防任何流感病毒株的保护。

该模型对冠状病毒的分析表明,一部分被称为S2亚单位的刺突蛋白最不可能产生逃逸突变。问题仍然是SARS-CoV-2病毒的变异速度有多快,因此目前用于抗击Covid-19大流行的疫苗还能有效多久还不得而知。初步证据表明,这种病毒的变异速度不如流感或艾滋病病毒。然而,最近在新加坡、南非和马来西亚出现的新突变,他们认为应该对这些突变进行潜在病毒逃逸的研究(这些新数据尚未经过同行评审)。

研究人员在对艾滋病病毒的研究中发现,该蛋白的V1-V2高变区有许多可能的逃逸突变,这与之前的研究结果一致,他们还发现了逃逸概率较低的序列。

研究人员正在与其他人合作,利用他们的模型来确定癌症疫苗的可能靶点,这种疫苗可以刺激人体自身的免疫系统来摧毁肿瘤。他们说,它也可以用来设计小分子药物,可能不太可能引起耐药性,如结核病的疾病。

这实在太方便了,你只需一些序列,而获得序列其实不难。

原文检索:Learning the language of viral evolution and escape

(生物通:伍松)

相关新闻
生物通微信公众号
微信
新浪微博


生物通 版权所有