“机器学习”揭示未来农业和医学重要基因的“生产力”

时间:2021年9月27日
来源:生物通

编辑推荐:

根据发表在《Nature Communication》上的一项新研究,机器学习可以精确定位“重要基因”,帮助作物在更少的肥料下生长。它还可以预测植物的其他特性和动物的疾病结果,说明它在农业之外的应用。

广告
   X   

根据发表在《Nature Communication》上的一项新研究,机器学习可以精确定位“重要基因”,帮助作物在更少的肥料下生长。它还可以预测植物的其他特性和动物的疾病结果,说明它在农业之外的应用。

利用基因组数据预测农业和医学的结果对系统生物学来说既是一个希望也是一个挑战。研究人员一直在努力确定如何最好地利用现有的大量基因组数据来预测生物体如何应对营养、毒素和病原体暴露的变化,从而为作物改良、疾病预测、流行病学和公共卫生提供信息。然而,从基因组规模的信息准确预测农业和医学领域的复杂结果仍然是一个重大挑战。

在《Nature Communication》的研究中,纽约大学的研究人员以及美国和台湾的合作者利用机器学习(一种用于检测数据模式的人工智能)来应对这一挑战。

Gloria Coruzzi解释说:“我们发现,关注表达模式在物种间进化上保持不变的基因,可以增强我们学习和预测对主要作物生长性能以及动物疾病结果具有重要意义的基因的能力。”,Gloria Coruzzi是纽约大学生物系和基因组学与系统生物学中心的教授,也是该论文的资深作者。

纽约大学基因组学与系统生物学中心和国立台湾大学的Chia-Yi Cheng补充道:“我们的方法利用了物种内或物种间全基因组表达和相关表型的自然变异。我们表明,从生物学原理上讲,减少对物种内和物种间表达模式保守的基因的基因组输入是减少基因组数据维数的一种方法,这显著提高了我们的机器学习模型识别哪些基因对某一特征重要的能力。”

作为概念证明,研究人员证明,对氮的反应性基因在进化上在两种不同的植物物种之间是保守的——拟南芥,一种在植物生物学中被广泛用作模式生物的小型开花植物,和玉米品种,美国最大的作物——显著提高了机器学习模型预测对植物如何有效利用氮具有重要意义的基因的能力。氮是植物的重要养分,是肥料的主要成分;更有效地利用氮肥的作物生长得更好,需要更少的肥料,这对经济和环境都有好处。

研究人员进行了实验,验证了八个主转录因子是对氮利用效率重要的基因。他们表明在拟南芥或玉米中基因表达的改变可以增加低氮土壤中的植物生长,他们在纽约大学的实验室和伊利诺伊大学的玉米田进行了测试。

“现在我们可以更准确地预测哪些玉米杂交种更擅长在田间施用氮肥,我们可以迅速改善这一特性。通过降低农民成本、减少环境污染和减少农业温室气体排放,提高玉米和其他作物的氮肥利用效率提供了三个关键好处。”Stephen Moose说。

此外,研究人员证明,通过预测植物的其他性状,包括拟南芥和玉米的生物量和产量,这种进化信息机器学习方法可以应用于其他性状和物种。他们还表明,这种方法可以通过研究小鼠模型预测另一种主要作物水稻抗旱性的重要基因,以及动物的疾病结果。

Coruzzi说:“因为我们表明,我们的进化信息管道也可以应用于动物,这突出了它揭示生物学、农业或医学中任何生理或临床特征的重要基因的潜力。”。

“许多具有农艺或临床重要性的关键特征在基因上是复杂的,因此很难确定它们的控制和遗传。我们的成功证明,大数据和系统级思维可以让这些众所周知的困难挑战变得容易处理,”普渡大学园艺和景观设计系教员、研究作者Ying Li说。

Cheng, CY., Li, Y., Varala, K. et al. Evolutionarily informed machine learning enhances the power of predictive gene-to-phenotype relationships. Nat Commun, 2021 DOI: 10.1038/s41467-021-25893-w

生物通微信公众号
微信
新浪微博


生物通 版权所有