复旦大学Nature子刊揭示氨基酸代谢失调促胰岛素抵抗的分子机制
随着单碱基精度和读取长度的提高,利用批量样本的单分子长读测序技术已广泛应用于基因组组装。通常,长读测序组装需要大量的DNA(通常来自数百万个细胞的几微克),因此大多数人类基因组组装被限制在批量基因组测序数据集,而没有保持单个细胞之间潜在的遗传异质性。然而,这在许多情况下是不切实际的。相比之下,单细胞全基因组测序(scWGS)是揭示细胞间遗传异质性的有力工具,尤其是对癌症研究。基因组组装,或单倍型组装,可以更准确地使用克隆种群的基因更相似。单细胞NGS基因组测序技术是微生物基因组组装的常用技术。然而,基于NGS平台的单细胞基因组测序技术很少用于大型复杂基因组装配,即使使用批量NGS基因组测序数据,Contig N50的装配连续性也无法达到megabase水平,如仅使用批量Illumina测序数据和SOApdenovo对人类基因组进行从头装配,得到的ContigN50为11.1kb;利用Illumina HiSeq X (pE150bp)平台对美国鼠兔从头基因组装配得到的ContigN50为∼42 kb;利用Illumina和454对端文库得对美国野牛从头基因组装配得到的ContigN50为∼20 kb。
使用少量基因组DNA甚至单细胞基因组测序数据组装人类基因组更具挑战性。它不仅需要基于单细胞TGS平台的基因组测序技术的支持,还需要良好的数据分析策略和合适的组装器。7月12日,北京大学生命科学学院生物医学创业创新中心Tang Fuchou教授团队在《Nucleic Acids Research》杂志上发表题为《单细胞水平的人类基因组从头组装》的文章,回顾了团队在第三代测序平台上可以对单细胞基因组进行测序的SMOOTH-seq技术的发展。
SMOOTH-seq能够可靠有效地检测人类单个细胞中的SVs和ecDNAs,这使得单细胞基因组的长读取量(约6kb)测序成为可能,为仅从几个单个细胞组装人类基因组提供了先决条件。该团队在pacBio HiFi和Oxford Nanopore Technologies (ONT)平台上使用SMOOTH-seq对K562(人类慢性粒细胞白血病CML细胞系)和HG002(正常二倍体淋巴母细胞细胞系)进行了测序,并基于scWGS数据集,通过不同的组装程序和严格的评估证明了基因组组装的可行性。Tang教授领导的团队利用基于TGS平台的单细胞基因组测序数据,系统地探索了影响组装的因素。此外,为了研究基因组组装需要测序的单细胞数量的下限,我们改进了SMOOTH-seq技术。并在ONT平台上对30个基因组覆盖率相对较高的二倍体HG002细胞进行测序,发现从低至30个单个细胞(平均基因组覆盖率为41.7%)的基因组组装可以达到NG50约1.35 Mb。此外,通过分析K562细胞组装基因组的结构变异(SVs),该团队发现,与直接将单细胞基因组测序数据映射到参考基因组相比,可以识别更多的插入事件,并更有效和准确地说明复杂的结构变化。他们的研究提供了原则性证据,表明从几十个单个细胞的长读单细胞基因组测序数据中,用NG50 contigs的megabase水平组装人类基因组是可行的。
De novo assembly of human genome at single-cell levels
-
人工智能研究院朱松纯、朱毅鑫教授团队在机器人自主规划有效的工具使用策略方向取得重要进展
2022-08-06 -
一个细胞接着一个细胞,科学家们构建阿尔茨海默氏症大脑变化的高分辨率地图
2022-08-06 -
雄性小鼠中HIV-1 Tat表达可促进与年龄相关的神经内分泌、认知和行为共病
2022-08-06 -
细胞中分子之间动态相互作用的光学成像
2022-08-06 -
肉毒杆菌毒素如何麻痹杀死细胞?
2022-08-06 -
挑战进化论:长读测序发现高达20%的果蝇基因来自细菌
2022-08-06 -
《Nature》噬菌体细胞核与人类细胞核的惊人相似性
2022-08-06 -
新的研究表明,导致致命脑瘤的基因也会导致儿童癌症
2022-08-06 -
脂肪肌肉质量比与老年痴呆发病风险
2022-07-30 -
《Nature》“肠漏假说”的一片关键拼图
2022-07-30