服务器 频道

第三代基因测序技术革新 探索生命的奥秘全凭这朵云

  一位准妈妈,在怀孕12-24周时,需要做唐氏儿的筛查,传统唐筛的方式准确率低,如果结果显示危险性高,那么准妈妈还需要做羊膜穿刺等进一步检查。

  而今天,随着基因测序技术的发展,我们可以通过无创DNA检测的方式,利用DNA测序对母体外周血浆中的游离DNA片段进行测序,并将测序结果进行生物信息分析,可以从中得到胎儿的遗传信息,从而实现对唐氏儿的精准筛查。

  结合DNA在转录蛋白质时的对应关系以及不同蛋白质对人体的作用,科学家们已经可以从DNA中解读关于人类健康及遗传的很多信息。这其中就包括后代出现某些遗传缺陷的几率,某种疾病在个体上发生的概率,个体对某些药物或食物的潜在过敏反应等等。

  可以说DNA的测序对人的健康生活和生育有着重大意义,一次DNA测序就可以为个人或家庭提供一份详尽的生活建议和指导。而这正是武汉未来组生物科技有限公司目前正在从事的工作。

  基因测序领域中的IT挑战

  最新的第三代基因测序仪不仅测得更准,更可以大幅降低基因测序的成本。现在,即便是普通家庭也可以几乎没有经济负担的完成一次基因测序。而基因测序已经成为中国人关注健康,提升生活品质的流行手段。

  个人基因测序市场规模的扩展让未来组的业务在短短几年中取得了飞速的进展。目前,未来组已经发展为国内最大的第三代基因测序公司。

  不过蓬勃发展的个人基因测序业务和大量的科研工作也让未来组的IT设施受到了巨大的挑战。

  虽然第三代基因测序仪可以同时进行大量基因片段的快速测序,但由于人类DNA序列长度达到30亿,如果将其转化为文本,那么这个文件最保守的大小也要达到3GB。而如果考虑到必要的冗余因素,这个文件的体积还要成倍的增加。如此规模的数据量对存储系统的容量提出了极高的要求。

  未来组目前已经拥有两台第三代基因测序仪,而未来这一数字将增长至五台。基于现有的业务增长速率,这意味着仅在个人基因测序业务中,每天的数据产生量就高达300TB至600TB。

  可以说任何本地系统的扩容速度都无法追上这种规模的数据增长。唯一的出路只有云!

  华为以全面IT技术助力健康新时代

  经过反复比对和考察,未来组最终选择将华为云作为未来存储的主阵地。

  目前,未来组已经与华为云合作打通了从测序仪到华为云端存储的数据传输通道,测序仪得到的基因组数据可以直接存储在华为云上。凭借华为云极强的资源拓展能力,大规模的基因测序工作不会再受到存储系统容量的限制,未来组的业务发展也得到了有利的保障。

  同时,武汉未来组生物科技有限公司IT中心总监朱赢也表示:在探索基因测序数据云端存储方法的过程中,华为云提供了非常完善的技术支持服务。而华为云在业务上的响应速度也是未来组所有接触过的云服务商中最快的。这让未来组与华为之间建立起了非常好的合作和信任关系。

  不仅如此,未来组还正与华为在更多领域开展联合探索:

  在一个名为“华夏万人SV”的基因测序计划中,样本数量达到了空前的一万个。使用现有系统,每个样本都需要至少360个核小时来将DNA片段重组为完整的DNA序列,这意味着整个项目需要将近400万核小时的时间来完成计算。而通过使用华为提供的100台32核心高性能服务器进行72小时满负荷测试,整个DNA片段重组需4万个核小时就可以完成全部计算工作,效率提升100倍。

  同时,未来组还在积极尝试利用华为昆仑小型机产品所具备的海量内存来提升DNA片段重组计算任务的运行效率。

  朱赢表示:未来,未来组还会尝试使用华为云所提供的异构计算服务来加速DNA片段重组的计算工作,并结合容器技术来进一步提升效率。基于华为云,未来组还将开发一套面向基因测序分析报告的移动APP,让用户可以更方便、更快速的调取基因测序结果,获得更好的用户体验。

  有人说基因工程和生物科技很可能是第四次工业革命的主要方向,而现在,我们正站在这场革命的门口。

  写在最后,笔者认为随着生命科学领域的全面发展以及数据中心的全面云化,生命科学行业云化发展是大势所趋。云计算的到来,使数据以及计算全部可以在云上完成,满足企业数据不下云,高效完成企业的计算需求,减少企业重资产以及维护的工作,使客户更聚焦在自身的业务发展上。

  在基因测序领域,以数据分析、云计算为主导的IT技术已经成为驱动行业创新、变革的重要因素。快速的技术革新和应用,使得医生可以基于病患的基因信息、生活环境和生活方式,提供更为精准的诊断和治疗。通过强大的资源、完整而先进的产品组合以及强大的服务能力,华为以及华为云正在为未来组这样的生物科技公司铺就一条混合IT的高速公路,让更健康、更美好的未来能够尽快到来。

0
相关文章