编辑推荐:
研究人员开发了一种机器学习模型,可以预测更适合特定靶标的Cas9蛋白,并且可以根据设计特性进行定制,用于研究或治疗用途。
在《自然》杂志上发表的一项名为“通过可扩展工程和机器学习定制CRISPR-Cas9 PAM变体”的新研究中,来自马萨诸塞州总医院(MGH)和哈佛医学院(HMS)的研究人员开发了一种机器学习模型,该模型允许预测更适合特定靶标的定制Cas9蛋白,并且可以根据设计特性进行定制,用于研究或治疗用途。作者表示,这种可扩展的方法可以设计和表征数百或数千种新型Cas9蛋白的生化特性。
HMS病理学副教授Benjamin kleinver博士在接受GEN采访时说:“我们很高兴与基因组编辑界分享这些酶,并获得关于它们作为核酸酶、碱基编辑器和其他基因组编辑方式的性能的反馈。”
为了安全、精确地纠正导致遗传疾病的突变,基因组编辑技术必须被编程为针对患者特异性序列,同时限制脱靶效应。Cas核酸酶通过读取原间隔邻近基序(PAMs)来识别基因组靶标,从而启动与靶标位点的引导RNA配对。在常用的化脓性链球菌Cas9 (SpCas9)中,配对需要标准的PAM序列3'NGG,这不可避免地将酶的使用限制在PAM编码的基因组序列上。
为了扩大对基因组的访问,一种常见的工程策略是放松PAM,允许对新位点进行编辑,同时保留对NGG的活性,从而创造出广泛应用的通用酶。然而,使有效的靶编辑,同时最大限度地减少脱靶效应的放松PAM酶仍然是一个挑战。
在这项新研究中,kleinver的团队为数百种工程SpCas9酶生成了PAM的实验谱,以训练一个神经网络,将氨基酸序列与PAM特异性联系起来。由此产生的PAM机器学习算法(PAMmla)预测了大约6400万个SpCas9酶的PAM。然后,它确定了有效和特定的酶,这些酶优于现有的基于进化和工程的候选酶,作为人类细胞中的核酸酶和碱基编辑器,同时减少了脱靶效应。
在用户导向Cas9酶设计的例子中,MGH组在人类细胞和小鼠中选择性靶向视紫红质P23H突变。这种突变是常染色体显性视网膜色素变性(adRP)的常见原因,这是一种导致视力丧失的遗传性眼病。
“我们设想,可扩展工程、深度表征和利用机器学习来预测更大范围蛋白质的总体框架将扩展到许多令人兴奋的领域,包括Cas9酶的其他特性,如靶点特异性和靶标活性,以及完全非crispr酶,”该研究的第一作者、HMS研究生Rachel Silverstein在接受GEN采访时表示。
其他应用包括将该工程工作流程扩展到下一代编辑器中的其他蛋白质结构域,例如用于碱基编辑器的脱氨酶结构域,用于引物编辑器的逆转录酶结构域和用于点击编辑器的DNA聚合酶。
机器学习与传统的实验工程策略相比具有关键优势,传统的实验工程策略除了面临费力和耗时的实验选择策略外,还经常难以预测多个同时突变的功能影响。作者表示,与单独的实验方法相比,计算预测可以筛选更多数量的具有更多不同氨基酸取代组合的酶,从而增加了在更深的突变空间中识别最佳酶的可能性。
根据Silverstein的说法,这种方法的关键是建立一种简单且可扩展的生化分析方法,可以并行产生数千种酶的丰富数据,为训练机器学习模型提供必要的数据。
“从长远来看,我们设想机器学习的使用可以广泛应用于增强基因组编辑技术的活动,这将有利于创建一个多样化和完整的技术工具箱,”Silverstein告诉GEN。
作者已经将pamla作为一个网络工具提供,以加快SpCas9酶的定制,用于研究或翻译用途。
生物通 版权所有