首页>产业 > 生物医药 > > 正文

从24小时到7分钟 华西医院刷新基因分析“中国速度”

2022-02-21 11:24:26
来源:科技日报 作者:陈科 评论:0

  2月18日,四川大学华西医院发布消息,该院生物医学大数据中心将人类全基因组测序时间从24小时缩短到7分钟,刷新了基因分析的“中国速度”。这也意味着,该项研究成果直接加速了基因测序从科研到临床的进程,未来将有更多精准的基因数据辅助于医疗诊断及治疗。

研发团队签署项目合作协议。采访对象供图

  基因测序和分析技术现已应用于生育健康、肿瘤个体化诊断和治疗、遗传病、传染病检测、疫苗研发等领域。在该领域一个不可避免的“拦路虎”就是——时间。以四川大学华西医院启动的“十万中国罕见病患者全基因组测序计划”项目为例,按照传统技术30X人类全基因组数据分析24小时/例的速度计算,该项目投入100台计算机也需要30多年才能完成。

  2021年6月,华西医院联合华为、赛乐基因组建联合研发团队,开展多组学数据加速分析平台系统的开发。面向大规模队列多组学数据分析应用场景,研发团队聚焦多组学数据分析“存、管、算”三个方向,包括开发多组学数据专项训练的存储自动分级技术,在数据分析过程中提供高I/O和低成本的存储方案;面向存储系统的管理维护者,研发基于逻辑层的组学数据全生命周期的存储管理系统;基于GPU异构并行加速技术,将原来在CPU上运行的bwa和STAR等分析软件重构迁移到GPU上,充分利用GPU运算高并发的特征,以满足高效、低成本完成组学分析的需求。

  该项目负责人、华西生物医学大数据中心于浩澎副研究员表示,之所以能实现时间上质的突破,根本在于打破计算算力和储存性能的瓶颈。他将其形象地比喻为吃得快的“大嘴巴”和装得下的“大肚子”。前者实现了大文件的直通读取和小文件的聚合读取,数据读取的效率更高;后者可以对数据分析的各个作业流程进行融合调度的优化,I/O流更加顺畅,从而实现了“吃得更多、消化更快”。

  他表示,研发团队在全基因组数据分析加速上,以GATK(The Genome Analysis Toolkit)流程为基础,最终完成了速度的飞跃,实现了30X人类全基因组测序胚系变异分析时间从24小时到7分钟的压缩,同时保证了分析结果的准确性:和GATK结果高度一致。

(责任编辑:韩梦晨)

相关阅读:

版权与免责声明:
①凡本站注明稿件来源为:中国高新技术产业导报、中国高新网、中高新传媒的所有文字、图片和音视频稿件,版权均属本网所有,任何媒体、网站或个人未经本网协议授权不得转载、链接、转贴或以其他方式复制发表。已经本网授权使用作品的,被授权人应在授权范围内使用,并注明“来源:中国高新网、中高新传媒或者中国高新技术产业导报”。违反上述声明者 ,本网将追究其相关法律责任。
② 任何单位或个人认为本网站或本网站链接内容可能涉嫌侵犯其合法权益,应该及时向本网站书面反馈,并提供身份证明,权属证明及详细侵权情况证明,本网站在收到上述文件后,将会尽快移除被控侵权的内容或链接。
③如因作品内容、版权和其他问题需要与本网联系的,请在该事由发生之日起30日内进行。电话:010-68667266 电子邮件:dbrmt#chih.org (请将“#”换为“@”)
排行
  • 全部/
  • 本月

编辑推荐


扫描添加 中国高新技术产业导报

(数字报)

扫描添加 中国高新APP客户端
扫描添加 新浪微博
扫描添加 腾讯微信公众号