您的位置:首页 >国外科研 >

当一个变成两个:更精确的纳米孔测序分析

时间:2021-05-20 00:00:00 来源:网络整理

当一个变成两个:更精确的纳米孔测序分析

示例向量图像

Earlham研究所研究人员开发的一种新的软件工具将帮助生物信息学家提高他们的生物数据的质量和准确性,并避免错误的组装。快速,轻量级,用户友好的工具可视化基因组组装和基因比对从最新的下一代测序技术。

这种新的可视化工具叫做Alvis,它可以检测DNA序列数据和参考基因组数据库之间的映射关系。这使得生物信息学家可以通过生成高效的现成的矢量图像,更容易地分析来自常见基因组任务和格式的数据。

莱格特集团厄尔汉姆研究所的第一作者和博士后科学家塞缪尔·马丁博士说:“通常情况下,对齐工具输出包含对齐数据列表的纯文本文件。这对于计算机解析和被合并到管道中非常有用,但是人工解释可能很困难。

对齐数据的可视化可以帮助我们理解手头的问题。作为一种新技术,针对纳米孔测序技术的新工具已经实现了几种新的测序格式。

“我们发现现有的可视化工具无法解释这些格式;Alvis可以用于所有常见的对齐格式,并且可以很容易地为未来的对齐格式进行扩展。”

新的命令行工具的一个关键特点是它自动突出嵌合序列——DNA链中的薄弱环节的独特能力。这是指两个序列——来自基因组的不同部分或不同物种——错误地连接在一起形成一个序列,从而影响数据的准确性。

嵌合体序列在识别特定DNA时对生物信息学家来说是个问题。嵌合体的形成可以发生在DNA分子上,无论是在测序文库的制备过程中,在某些平台上的测序过程中,还是在试图拼接基因组时通过组装工具。

在开发该工具期间,该团队比较了使用和不使用阿尔维斯嵌合体检测的基因组组装。生成的矢量图像(example_contigalignment.pdf)显示了一个示例输出,其中直观的工具跟踪它识别为嵌合的所有读取。

“虽然嵌合序列在样本中并不占很大比例,但它们可以产生显著的影响,所以我们必须小心,在分析过程中识别它们,”马丁博士说。

“在Alvis图的嵌合数据示例中,页面上的每个矩形表示读取,其中的彩色块表示对齐。大多数嵌合体很容易看到,因为它们的排列是不同的颜色,这意味着它们映射到不同的基因组。还有一些比较微妙,因为这两种比对都是针对同一个基因组,但不同的区域。”

Alvis工具可以精确定位嵌合体序列的可视化,并输出描述嵌合体的数值数据。这表明,通过应用该工具,然后以生物信息的方式拆分嵌合体,可以显著提高组装的质量。

Martin博士补充道:“我们希望Alvis继续对其他研究人员有用,例如,纳米孔测序;通过可视化对齐来提高他们对数据的理解。”

比对是生物信息学的基础,它可以用于任何处理长读测序数据的人,以及由短读平台测序数据产生的比对。我们的研究已经证明,Alvis生成的图表可以很容易地导出到出版物中直接使用。”

# # #


郑重声明:文章仅代表原作者观点,不代表本站立场;如有侵权、违规,可直接反馈本站,我们将会作修改或删除处理。