编辑推荐:
杜克大学(Duke University)的生物医学工程师开发了一个基于人工智能的平台,该平台设计了一种被称为肽的短蛋白质,能够结合并破坏以前无法治疗的致病蛋白质。
杜克大学(Duke University)的生物医学工程师开发了一个基于人工智能的平台,该平台设计了一种被称为肽的短蛋白质,能够结合并破坏以前无法治疗的致病蛋白质。受OpenAI图像生成模型的启发,他们的新算法可以快速确定多肽的优先级以进行实验测试。
这项研究发表在1月22日的《科学进展》杂志上。
治疗疾病的一种方法是开发能够专门针对并摧毁驱动疾病的蛋白质的疗法。有时,这些关键蛋白质具有明确的结构,就像折叠整齐的折纸鹤一样,因此传统的小分子疗法可以很容易地与它们结合。但是,超过80%的致病蛋白质就像一个凌乱的纱线球——无序和纠结——这使得标准疗法很难在表面找到一个口袋来锁定并发挥作用。
为了避免这个问题,研究人员已经探索了如何利用肽来结合和降解致病蛋白。因为肽是蛋白质的小版本,它们不需要表面口袋来结合。相反,它们可以与蛋白质中的各种氨基酸序列结合。但即使这些方法也有其局限性,因为现有的“现成”粘合剂并没有被设计成附着在不稳定或过度纠结的蛋白质结构上。虽然科学家们一直致力于开发新的结合蛋白,但这些方法仍然依赖于绘制目标蛋白的3D结构信息,而这些信息对于无序目标是不可用的。
杜克大学生物医学工程助理教授Pranam Chatterjee和他的团队并没有试图绘制出致病蛋白质的结构,而是从生成式大型语言模型(LLMs)中获得灵感,创造了一个解决方案。结果是PepPrCLIP,或肽优先排序通过CLIP。他们的工具的第一个组成部分——PepPr——使用一种基于大量天然蛋白质序列库训练的生成算法来设计具有特定特征的新“指导”蛋白质。CLIP是他们平台的第二个组成部分,它利用了一个算法框架,该框架最初由OpenAI开发,用于将图像对应的标题匹配在一起,以测试和筛选哪些肽与目标蛋白质匹配。CLIP模型在这里只需要目标序列。
“OpenAI的CLIP算法将语言与图像连接起来。如果你有文字说“狗”,你应该得到一个狗的图像。我们训练它匹配肽和蛋白质,而不是语言和图像。PepPr生成多肽,我们的适应性CLIP算法将筛选这些多肽,并告诉我们哪些是很好的匹配。”杜克大学生物医学工程助理教授Pranam Chatterjee说。
与RFDiffusion(一种利用目标蛋白的3D结构生成肽的现有平台)相比,PepPrCLIP速度更快,并且能够生成几乎总是与目标蛋白更好匹配的肽。为了评估PepPrCLIP在有序和无序蛋白质靶标上的工作效果,Chatterjee和他的实验室与杜克大学医学院、康奈尔大学和桑福德伯纳姆普雷比斯医学发现研究所的研究人员合作,对该平台进行了实验测试。
在第一个测试中,研究小组表明,pepprclip生成的肽可以有效地结合并抑制UltraID的活性,UltraID是一种相对简单和稳定的酶蛋白。接下来,他们使用PepPrCLIP来设计可以附着在-连环蛋白上的肽,-连环蛋白是一种无序的复杂蛋白质,与几种不同类型的癌症信号有关。研究小组生成了六种肽,CLIP表明它们可以与蛋白质结合,并表明其中四种可以有效地结合并降解它们的目标。通过破坏蛋白质,它们可以减缓癌细胞的信号传导。
在他们最复杂的测试中,研究小组设计了一种肽,可以与滑膜肉瘤相关的高度紊乱的蛋白质结合。滑膜肉瘤是一种罕见的侵袭性癌症,可以在软组织中发展,主要影响儿童和年轻人。根据查特吉的说法,“这就像一碗意大利面。它是世界上最无序的蛋白质。”
研究小组通过将多肽植入滑膜肉瘤细胞,测试了10种设计。他们观察到,pepprclip设计的肽可以结合并降解蛋白质,就像它对更简单的目标一样。如果他们能破坏这种蛋白质,他们就有机会开发出一种治疗以前无法治疗的癌症的方法。
除了计划继续改进他们的平台之外,Chatterjee和他的团队还计划与医疗和行业专业人士合作,开始制造肽,最终用于治疗由不稳定蛋白质引起的疾病,如亚历山大病(Alexander’s Disease)和不同类型的癌症。亚历山大病是一种致命的神经系统疾病,主要影响儿童。
“这些复杂的、无序的蛋白质使许多癌症和疾病实际上无法药物治疗,因为我们无法设计出与它们结合的分子。”但PepPrCLIP表明,它甚至可以对最复杂的蛋白质起作用,这开辟了许多令人兴奋的临床可能性。
生物通 版权所有