开创基准:科学家公布了世界上最大的长读RNA测序数据集,解决了一个长期存在的瓶颈

时间:2025年4月29日
来源:AAAS

编辑推荐:

新加坡科学家发布了世界上最大的开放获取长读RNA测序数据集之一,为全球疾病研究和精准医学的进步铺平了道路。

广告
   X   

SG-NEx为全球研究界提供了一个开放获取的资源,通过以下方式加速生物标志物的发现和精准医学:

  • 前所未有的规模和标杆:世界上最大的比较长读测序技术和传统短读测序方法的数据集之一。

  • 增强RNA见解:展示了长读测序揭示复杂RNA特征的能力,如癌症相关的融合转录物,短读方法经常错过。

  • 全球可访问性:39TB的数据集和分析工具可通过AWS开放数据注册表免费获得,支持全球研究合作。

  • 高级诊断潜力:使更准确的RNA分析,以发现神经退行性疾病,心血管和传染病的新生物标志物,推进个性化治疗方法。

由新加坡A*STAR基因组研究所(A*STAR GIS)领导的一组科学家发布了世界上最大、最全面的长读RNA测序数据集之一,解决了疾病研究中一个长期存在的瓶颈。新加坡纳米孔表达(SG-NEx)数据集包含14个人类细胞系中超过7.5亿长的RNA,旨在帮助研究人员更精确地解码RNA复杂性,为下一代诊断和治疗奠定基础。这项研究于2025年3月发表在《自然方法》杂志上。

揭开RNA的全貌

尽管是现代转录组学的主干,但传统的短读RNA测序往往无法捕获全长RNA分子和复杂的变异,如剪接模式、融合转录物和影响癌症等疾病进展的特定化学修饰。这限制了它在检测临床相关生物标志物方面的应用。

SG-NEx使用长读RNA测序克服了这些限制,这使得可以直接观察RNA的完整序列结构。这提供了更深入的生物学见解,同时减少了分析盲点,这是发现新的生物标志物和开发更好、更精确的治疗方法的关键步骤。

a *STAR GIS高级科学家Chen Ying表示:“想象一下,你有一本书,每一页都被撕成了碎片。”这就是短读RNA测序所发生的事情,它迫使你从分散的句子中重建故事。一些细节可能会丢失,而且很容易出错。相比之下,长读RNA测序可以让你一次阅读整页甚至整章的书。这使得我们更容易发现隐藏在与疾病相关的复杂RNA分子中的关键细节。”

随着生命科学行业在精准医疗方面加倍努力,研究人员和生物技术公司需要可靠、高分辨率的工具来确定新的疾病标志物和治疗目标。SG-NEx旨在通过其开放获取的数据集和基准资源填补这一空白,使业界能够更好地分析不同形式的基因(称为同种异型),并为人类疾病的学术和转化研究、开发基于RNA的诊断或治疗的生物技术和制药公司、创建下一代RNA分析平台的工具开发人员和生物信息学团队提供重要基础。医疗保健系统和政策制定者投资于基因组精确策略。

通过合作推动创新,实现全球影响力

SG-NEx于2018年启动,是与A*STAR GIS、杜克-新加坡国立大学医学院、新加坡国家癌症中心、新加坡癌症科学研究所、新加坡国立大学癌症研究所、沃尔特和伊丽莎霍尔医学研究所、加文医学研究所和彼得麦卡勒姆中心的专家密切合作的结果。

“从一开始,我们就设计了SG-NEx项目,采用快速开放获取数据发布策略,以最大限度地发挥其效用。通过公开数据,我们使全世界的研究人员能够开发和测试新的RNA分析方法。A*STAR GIS高级首席科学家Jonathan Göke说:“这是加速生物医学发现和释放长读测序潜力以改善诊断和患者护理的重要一步。

塑造RNA研究的未来

SG-NEx团队目前正在努力进一步扩大其影响力,通过开发用于自动化RNA特征检测的人工智能工具,扩大全球对数据的访问,并促进长读协议的标准化,这是临床采用的关键推动因素。

A*STAR GIS执行董事Wan Yue博士表示:“SG-NEx结合大规模数据生成、严格的基准测试和开放获取的基础设施,正在塑造RNA研究的未来。它使我们更接近了解RNA如何影响健康和疾病,以及我们如何利用这些知识来改善生活。”


A systematic benchmark of Nanopore long-read RNA sequencing for transcript-level analysis in human cell lines


相关新闻
生物通微信公众号
微信
新浪微博


生物通 版权所有