生物信息研究的加速剂 生物信息专用计算机

时间:2003年9月9日
来源:

编辑推荐:

广告
   X   

[AD340X300]

生物信息学(Bioinformatics)是当今生命科学和自然科学的重大前沿领域之一,同时也将是21世纪自然科学的核心领域之一。世界各国对生物信息研究领域均高度重视,每年都会有大量资金投入。这不仅仅是因为生物信息能够带来巨大的利润,而且借助于它能够使本国在世界竞争中处于有利位置。我国虽然在生物信息研究方面取得了重要成绩,但在某些方面还是感受到了外界强大的压力和挑战。鉴于此,曙光公司与华大基因日前联合推出国内首例生物信息专用计算机,期望以此来带动我国在生物信息研究进入一个快速健康的发展轨道。

喜忧参半,我国生物信息研究进入分水岭

生物信息学是一门新兴的交叉学科,是伴随基因组研究而产生的,它的研究内容是紧随基因组研究的逐步深入而发展的。广义地讲,生物信息学是以计算机为工具从事对基因组研究相关生物信息的获取、加工、储存、分配、分析和解释。它包括了两层含义,一是对海量数据的收集、整理与服务,也就是管好这些数据;另一个是从中发现新的规律,也就是用好这些数据。目前,伴随着基因组研究日新月异的快速发展,相关信息出现了爆炸性增长,迫切需要对海量生物信息进行处理。以Genbank中的DNA碱基数为例,其增长速度呈指数性增长,大约每14个月就会增长一倍,这一增长速度只有计算机运算能力的增长可以与之比拟。所以在当前基因组信息爆炸的时代,建立超大规模计算系统,发展全新的生物信息学的理论、方法来分析这些数据,从中获得有用的信息是基因组研究取得成果的决定性步骤。其次,基因组研究最终是要把生物学问题转化成对数字符号的处理问题。要解决这样的问题就必须发展新的分析理论、方法、技术、工具,就必须依赖计算机的信息处理。

由于生物信息学科的特殊性加上整体发展时间较短,并且相比其他科研领域来说目前国内在该方面的相关研究与国际上的水平差距比较小,因此从政府的宏观调控到各级科研院所以及大学院校等科研单位都对生物信息学的研究给予了足够的重视,力争把握好这个在未来能够赶超世界领先水平的有利时机。虽然我国在生物信息学方面研究、DNA测序能力方面已处于世界前列,但与国际上相比,对基因组数据的分析处理和利用能力,包括计算能力则存在较大差距。国外分析这样的海量数据都使用超级计算机,而我们的许多研究工作还依赖于使用能力弱得多的工作站甚至个人电脑。与国外相比,国内生物信息研究在使用高性能计算方面还比较薄弱,这必将严重影响我国生物信息学未来的发展水平。与计算技术结合的瓶颈使我国的生物信息研究目前处于分水岭:不是超过别人,继续做领跑者;就是被别人赶超,从此一蹶不振。因此,开发集硬件、算法、软件和数据库众多功能于一身的生物信息专用机是我国生物信息服务领域迫切需要解决的问题。通过对生物信息专用机的开发,实现高性能计算和生物信息研究的结合,实现基因序列分析软件和基因组数据库的结合,实现并行运算算法的开发,实现生物信息研究系统平台的搭建。

柳暗花明,国内首款生物信息专用机横空出世

2003年8月18日,“作为国内服务器品牌三甲之一”的曙光信息产业(北京)有限公司(以下简称曙光公司)与国内著名的基因组、生物信息研究中心华大基因联合推出国内第一款完全拥有自主知识产权的生物信息专用计算机,采用先进的基因数据库架构技术、数据定制可视化技术、数据密集技术、网格使能技术、在线扩展技术及机群系统等技术,为国内用户搭建了一套与国际生物信息研究主流趋势相接轨的系统平台。

该系统是建立在华大基因和曙光公司在生物信息研究领域长期合作成果的基础之上,通过运用曙光公司的高性能计算机硬件平台,为国内大量致力于基因组研究的科研工作者们提供方便、快捷的服务。它为生物信息学研究提供了一个基于硬件、软件和数据库集成环境下的统一运行平台,为各个分析软件、子数据库模块提供一致的运行和管理环境。同时用户可以根据需要选择软件和数据库模块,无缝集成到平台上。平台提供ORACLE数据库和软件的集成接口和管理工具。生物信息专用计算机以模块化的方式提供大量基因组学、生物信息学研究的常用分析工具,并能实现分布式高性能计算。用户也可以根据需要定制分析软件,添加到该专用计算机应用平台中。生物信息专用计算机装有一整套生物信息学解决方案,装有生物信息系统平台、基因组数据库、分析软件以及管理软件。其中,基因组数据库中有人类基因组、疾病相关性基因、中药化合物、病原微生物基因组、医学模式基因组等门类数据,为医药开发提供了重要工具。除人类基因组数据库之外,该专用计算机还装有农业基因数据库和微生物基因组数据库。

此款生物信息专用计算机具备以下优势:

软硬件一体的解决方案,方便使用:以往从事生物研究的科技工作者需要分别采购硬件和软件组成研究平台之后再开始科研工作。这些采购自不同厂家的硬件和软件带来的问题是:软硬件存在一定的不兼容性,需要对软件进行繁杂的移植工作以适应硬件环境的运行要求,而这些计算平台进入稳定期限一般需要1-2年的时间。而1-2年的调试时间将极有可能耽误相关科研进程,以至许多优秀的科研成果可能被国外同行捷足先登。生物信息专用计算机是集软硬件一体化的解决方案,用户不需担心软硬件的相互兼容性,也不需要分头和多个供应商联系维护、培训等业务。

科研速度加快,出成果快:鉴于该系统运用的是一个成熟的软硬件一体化的研究平台,能够大大加快科研的进度,从而提高科研的效率,缩短了出成果的时间周期。

海量数据,丰富庞大的数据库:该系统在后台无缝连接了丰富大量的数据库资源,能够使用户很方便对庞大的数据库进行管理和存储。目前,华大基因研究中心在人类基因组、水稻基因组、SARS病毒基因研究中积累的数据已经固化在了数据库中,用户可以直接使用。这些数据对于进行相关研究的科技人员来说将会是一笔宝贵的财富。

数据库良好的扩展性能:针对生物研究生成的数据库结构是华大基因研究中心多次优化之后定型的,对于用户可能增加的数据库提供了扩展接口,保证了数据库良好的扩展性。

无可比拟的高性价比:专用机性能价格比比较高,能够为用户节约大量的科研成本费用。

小试牛刀,生物信息专用机不负众望

此款生物信息专用计算机目前已在1%人类基因组计划、水稻基因组草图和完整图绘制、SARS病毒基因组研究中都承担了大量关键的科研任务,且效果显著。其中包含的生物信息研究平台系统在中国农科院基因资源与基因改良科学工程项目中被采用,用来开展水稻、小麦和棉花等重要农作物数量遗传性状QTL功能基因方面的研究,在DNA、RNA和EST序列的分析以及基因序列比对、筛选新功能基因等实际研究中发挥重要的作用。除此之外,本地化安装的水稻与小麦基因组数据库和功能强大的序列及数据库管理软件,为用户节约了大量的时间和精力,使得科研效率大大提高,整体科研成本降低。另外,南京医药集团采用本系统对癌症调控转录因子功能基因进行分析,并对疾病基因进行功能注释,进一步完成靶基因和药物的筛选,全部数据都源自后台安装有本地化的人类疾病相关调控因子数据库,分析后得到的结果数据也被保存到该数据库中。

四年的实践,人类、水稻、SARS基因的成功测序证明,生物信息专用计算机是华大多年生物信息研究实践与曙光的高性能计算能力的完美结晶。生物信息学承担着生命科学研究的基础重任,不仅为医学界里医药的开发、医疗保健设计提供精准快速的数据依据,而且也将是国力的又一体现,生物信息专用计算机加速了生物工程研究,为我国的生命科学研究更快地赶超世界前列水平提供了有利的武器!(曙光信息技术(北京)有限公司高性能事业部总经理赵青.华大基因研究中心信息服务部总经理黄小兵)

摘自 千龙新闻网

生物通微信公众号
微信
新浪微博


生物通 版权所有