您的位置:首页 >国内科研 >

《Nature Biotechnology》兵贵神速:九天内,完成11套人类基因组

时间:2020-05-07 00:00:00 来源:网络整理

最新《Nature Biotechnology》文章证明,利用promethION纳米孔技术进行长读长人类基因组组装“史无前例地,在九天内以更便宜的价格完成了11个人类基因组测序”。

三年前,加州大学圣克鲁兹分校开发了这款纳米孔测序技术,在当时处理海量数据需要15万个小时的计算和研究人员数周的工作时间。大约1年后,研究人员开发了一种算法,从而能够在大约6个小时内,以70美元的价格,从长读长测序数据中准确、精确地组装出一整套人类基因组。

研究人员说,这款程序将加快基因组学的研究步伐,允许泛基因组(pangenome)研究更接近人类多样性的真实规模。

目前基因组学研究,完全依赖于从群体中挑选个体代表整个物种的参考基因,为了反映真实的人类多样性,加州大学圣克鲁兹分校开展了一项泛基因组计划,采用350个新人类基因组进行测序。

作为这项工作的一部分,他们开发了这种纳米孔长读长测序,利用三个promethION流动单元格,能够持续地以前所未有的长度(中位N50读长高达42kb)约60X覆盖度(约200千兆碱基)产出。此外,大约7X的基因组覆盖长度超过100kb。这种方法在成本和可同时处理的基因组数量方面都具有高度的可扩展性——还可以获得更高的读取长度和吞吐量,将进一步促进获得完整的、阶段性的、参考质量的基因组。

深入了解Oxford Nanopore最高通量测序平台——promethION

“我们的新组装器既便宜又快捷,我相信,在未来几年内,我们将很容易地组装出数百个从头开始的基因组,”文章作者Benedict paten说。

这项研究由陈扎克伯格倡议(CZI)的paolo Carnevali领导,他说:“当我看到科学家Miten Jain在2018年发表的论文时,我印象特别深刻。后来我又认识了Benedict paten,最终我决定与他们的团队合作为这项调查的计算方面做出贡献。”

合作开始后几个月内,他们便开发和测试了这款特殊的计算器,并将其命名为Shasta。

在这篇题目为“Nanopore sequencing and the Shasta toolkit enable efficient de novo assembly of eleven human genomes”的论文中,他们描述了Shasta如何产出更好的精确度和更低的错误组装数。作者说,Shasta是一种内存计算驱动的算法,现在能够在不到6小时内完成一个全新的(从未加工过的)人类基因组组装,每个样本的平均成本仅为70美元——这是一个里程碑式的进步。

为了提高装配的基本质量,研究小组使用了一种基于深度神经网络的测序抛光器作为最终的装配步骤,这使得组装的总成本约为200美元,总时间花费37小时,但减少了生成长读长程序集的计算开销(费用减少了五倍)。

研究人员在文章中评估和验证了精确度——首次证明只使用纳米孔数据即可实现99%的人类基因组装配准确度。此外,他们还利用HiC测序数据为这些经过抛光的组装基因组生成了染色体水平的模板目录。

“我们的目标不仅是扩大参考基因组的多样性,而是大规模地、常规地探索真正完整的人类基因组集合,了解未知的变异区域,”联合作者Karen Miga说。

原文检索:Nanopore sequencing and the Shasta toolkit enable efficient de novo assembly of eleven human genomes

(生物通:伍松)


郑重声明:文章仅代表原作者观点,不代表本站立场;如有侵权、违规,可直接反馈本站,我们将会作修改或删除处理。