编辑推荐:
CORNETO 是一款新型计算工具,可帮助研究人员将不同类型的生物数据与先前的生物学知识相结合,从而绘制出基因和蛋白质等分子在细胞内相互作用的图谱。通过同时分析不同的样本,CORNETO 可以显示哪些生物过程是常见的,哪些是不同细胞类型和条件下特有的。研究人员已利用 CORNETO 揭示疾病研究中的共同通路和细胞特异性通路,例如识别与卵巢癌患者化疗耐药性相关的信号通路。
欧洲分子生物学实验室 (EMBL-EBI) 的科学家与海德堡大学的合作者开发了 CORNETO,这是一种新型计算工具,利用机器学习从复杂的生物数据中获取有意义的洞察。CORNETO 通过将来自不同样本和条件的实验数据与先前的生物学知识(例如信号传导或代谢网络)相结合,使用户能够提取分子网络(基因、蛋白质和信号通路相互作用的图谱)。这有助于我们更好地理解导致细胞健康或患病的机制。
了解细胞内分子的相互作用方式是揭示可能导致疾病的机制的关键。然而,随着研究人员可用的组学数据类型规模和复杂性不断增长,研究人员往往难以从中提取有用且有意义的模式。CORNETO(Constrained Optimisation for the Recovery of NETworks from Omics)的全称是“组学网络恢复的约束优化”(Constrained Optimisation for the Recovery of NETworks from Omics),它将机器学习技术与生物学先验知识相结合,可以同时分析多种类型的组学数据,包括转录组学、蛋白质组学和代谢组学。
欧洲分子生物学实验室 (EMBL-EBI) 研究主管、海德堡大学休假教授 Julio Saez-Rodriguez 表示:“我们希望解决系统生物学中的一个常见挑战:当同时拥有如此多的复杂数据时,如何理解组学数据。CORNETO 能够将这些复杂数据与来自生物数据库的先验信息相结合,从而找到一致、可解释且具有生物学意义的模式。”
传统上,科学家一次只分析一种条件下的数据(例如,比较健康细胞和患病细胞),并针对每种条件构建单独的相互作用网络。但这种方法可能会忽略全局。CORNETO 使用机器学习同时分析多个样本或条件,突出不同数据集中共有的生物过程,并精确定位样本之间的差异。CORNETO 的设计还允许研究人员根据特定用例进行定制,或根据需要将其扩展到新的数据类型。
海德堡大学博士后研究员Pablo Rodríguez-Mier解释说:“使用CORNETO就像在一张错综复杂的网中找到共同点。它可以帮助研究人员提取出多个样本中发生的关键生物过程,并了解每个样本中的相同点和不同点。”
使用 CORNETO 对癌症研究等领域的研究人员尤其有价值,因为癌症研究领域中,患者之间存在相似之处,但没有两个患者完全相同。为了证明这一点,研究人员使用 CORNETO 分析了多名癌症患者的基因表达数据,以发现哪些特定的细胞内信号通路出现了异常。
CORNETO 仅利用转录组学数据,就识别出了关键的失调激酶(调节细胞信号传导的酶),并利用磷酸化蛋白质组学技术独立检测了这些激酶。由此生成的网络揭示了共享通路和患者特异性差异,这朝着未来可能支持个性化治疗策略的洞察迈出了一步。
CORNETO 目前也被用于欧盟研究项目DECIDER,以识别与卵巢癌患者化疗耐药性相关的失调信号通路。
研究人员还利用 CORNETO 分析了不同基因失活的酵母菌株的代谢途径。CORNETO 能够发现酵母细胞赖以生存和生长的关键过程。了解这些关键过程有助于科学家设计出更优的酵母菌株,用于生产生物燃料和其他工业产品。
CORNETO 现已在 GitHub 上作为开源软件提供。您还可以在这里找到教程、示例数据集和模块化代码,以便根据您的需求调整 CORNETO。
Unifying multi-sample network inference from prior knowledge and omics data with CORNETO
生物通 版权所有