编辑推荐:
利用人工智能模型,科学家可以预测基因表达,设计新的蛋白质,并创造精准药物。
此前,人工智能曾遭到质疑,但科学家们利用人工智能解决了蛋白质折叠和设计问题,并于2024年获得了诺贝尔化学奖,现在人工智能已被全球生物学家采用。人工神经网络和语言模型等人工智能模型帮助科学家解决各种问题,从预测蛋白质的3D结构到从零开始设计新型抗生素。研究人员继续改进人工智能模型,解决其局限性,并展示其在生物学中的广泛应用。
诺贝尔奖得主大卫·贝克(David Baker)利用深度学习模型创造了比天然蛋白质更适合解决现代问题的新生蛋白质。
蛋白质折叠问题是蛋白质生物学家的一个主要痛点,现在已经被人工智能解决了,华盛顿大学的生物化学家大卫·贝克和DeepMind的研究人员德米斯·哈萨比斯和约翰·跳普获得了诺贝尔化学奖。为了从氨基酸序列中确定蛋白质的三级结构,科学家们苦苦挣扎了大约二十年。1994年,科学家们建立了结构预测关键评估(CASP)竞赛,以促进这一领域的合作。1998年,贝克的团队开发了用于蛋白质能量配置建模的罗塞塔软件;事实上,几年后,该团队将他们的计算模型变成了一个名为Foldit的游戏,以吸引志愿者参与解决蛋白质结构问题。在2018年的CASP上,DeepMind团队公布了他们突破性的AlphaFold程序,该程序在真实的蛋白质序列和结构上进行训练。两年后,AlphaFold2程序在准确预测蛋白质结构方面取得了成功,专家们宣布蛋白质折叠问题基本解决了。2024年,Baker、Hassabis和Jumper因其对蛋白质功能和应用的深入了解而获得诺贝尔奖。
随着2018年人工智能深度学习模型AlphaFold的发布,科学家们终于能够预测蛋白质的3D结构——这是生物学上一个存在了几十年的挑战。经过100,000个已知蛋白质序列和结构的训练,该模型不仅可以以接近实验水平的精度准确预测蛋白质结构,还可以用于设计用于治疗学和其他领域的各种应用的从头蛋白质。受到AlphaFold成功的启发,科学家们现在正在使用深度学习模型来创建细胞的时空图,分析细胞图像以检测指示疾病的形态学变化,并估计新药在阻止疾病进展方面的功效,以最大限度地减少药物发现管道中的损失。工程师科学家、Deepcell首席执行官麦迪森·马萨里(Maddison Masaeli)等专家对人工智能在生物学领域的迅速应用感到高兴,但他警告称,研究人员需要大量的专业知识才能将人工智能用于生物学应用。
利用先进的机器学习工具,研究人员可以创造出具有新功能的人造蛋白质。
利用人工智能模型的力量,科学家们现在能够设计出具有特定生物功能的定制蛋白质,从而解决自然界中发现的蛋白质无法解决的问题。传统的蛋白质工程是基于进行增量更改并观察其效果,但机器学习模型既可以设计更好的蛋白质,又可以显着加快这一过程。华盛顿大学的蛋白质设计专家David Baker和他的团队使用了几种不同的人工智能模型来设计稳定的荧光素酶,这种酶可以与合成的荧光素结合而发光,并应用于动物组织的深度成像。虽然这种类型的蛋白质设计还有改进的空间,而且还没有完全自动化,但它可以在未来用于制造各种用于治疗和其他目的的蛋白质。
乔恩·斯托克斯和他的团队开发了SyntheMol,这是一种可生成的人工智能模型,他们用它来制造新型抗生素,预测其对ESKAPE病原体的疗效。
使用人工智能设计新生蛋白可能会对抗生素开发产生重大影响。随着世界范围内抗菌素耐药性的增加和新抗生素的发现的缺乏,麦克马斯特大学的研究人员转向人工智能来设计易于合成的新型抗生素。在生物化学家乔恩·斯托克斯(Jon Stokes)的带领下,该团队开发了一种名为SyntheMol的生成式人工智能模型,用于设计对鲍曼不动杆菌(Acinetobacter baumannii)具有抗菌活性的小分子。鲍曼不动杆菌是一种耐药病原体,被世界卫生组织(World Health Organization)视为对全球健康的主要威胁。虽然它们还没有在人体上进行测试,但其中一些分子在体外抑制了目标细菌和其他耐药微生物的生长。
受人脑的启发,人工神经网络(ann)是一种机器学习模型,包含多层相互连接的节点(或神经元),可以处理数据。网络中的每个节点使用加权输入数据执行数学方程,并根据阈值确定是否将输出传递给下一层节点。科学家使用已知值或特征的数据集训练人工神经网络,然后允许它根据每个样本的真实答案评估其预测输出,以便随着时间的推移提高其准确性。然后,人工神经网络可以用来预测新数据集的结果。尽管有一些关键的限制,人工神经网络可以识别人类可能无法识别的复杂数据中的模式,并执行一些琐碎的任务,为研究人员腾出时间。
研究人员现在已经开发出一种语言模型——负责chatgpt的深度学习模型——可以通过大脑的核磁共振图像来确定一个人的想法。德克萨斯大学奥斯汀分校(University of Texas at Austin)的研究员亚历山大·胡特(Alexander Huth)发明了这项技术,目的是让不会说话的人能够进行交流,但它也揭示了人类大脑功能的见解。胡特的模型表明,即使核磁共振扫描显示只有前额叶皮层是活跃的,大脑的所有部分也会使用与意义相关的信息。虽然该模型不能推广到不同的主题,这意味着它不能读心术,但专家们建议谨慎对待,因为这些模型在未来会变得更加准确。
虽然ChatGPT用于预测句子中的下一个单词,但科学家们现在已经创建了类似的深度学习模型,可以预测单个细胞中的基因表达。由多伦多大学的计算生物学家Bo Wang和他的团队创建的单细胞生成预训练转换器(scGPT)可以比目前几种最流行的方法更有效地分析单细胞RNA测序数据。该模型还能够比标准模型更准确地预测遗传扰动的影响。最初在骨髓和免疫细胞上进行训练,一种新的scGPT迭代现在已经适用于分析各种其他细胞类型,并可在不久的将来用于回答重要的生物学问题。
从帮助我们理解大脑到创造新的治疗方法,人工智能模型在生物学上具有巨大的潜力,但专家们警告说,它们的使用应该谨慎,它们的成功取决于知识的深度和广度。研究人员继续探索、开发和完善各种应用的深度学习模型,包括生物数据的解释和预测。
生物通 版权所有