经过多年的延迟FDA批准了Teva的通用EpiPen
2020年初,新型冠状病毒肺炎大流行开始几个月后,科学家们对导致感染的病毒全基因组SARS-CoV-2进行测序。虽然此时已经知道许多基因,但蛋白质编码基因的完整补体尚未解决。
现在,在进行了广泛的比较基因组学研究之后,麻省理工学院的研究人员已经产生了他们描述的SARS-CoV-2基因组最准确和完整的基因注释。在他们发表在Nature Communications上的研究中,他们确认了几种蛋白质编码基因,并发现其他一些曾被认为是基因的基因并不编码任何蛋白质。
麻省理工学院计算机科学与人工智能实验室(CSAIL)计算机科学教授以及麻省理工学院和哈佛大学Broad研究所的成员Manolis Kellis说:“我们能够将这种强大的比较基因组学方法用于进化特征,以发现这个极其重要的基因组的真正功能性蛋白质编码内容。”
该研究小组还分析了自SARS-CoV-2分离株开始感染人类以来近2000种突变,使他们能够评估这些突变在改变病毒逃避免疫系统或变得更加重要的能力方面的重要性和传染性。
比较基因组学
SARS-CoV-2基因组由近30000个RNA碱基组成。科学家们已经确定了几个已知编码蛋白质编码基因的区域,基于它们与相关病毒中发现的蛋白质编码基因的相似性。怀疑一些区域编码蛋白质编码基因,但尚未明确将其分类为蛋白质编码基因(protein-coding genes)。
为了确定SARS-CoV-2基因组的哪些部分实际上含有基因,研究人员进行了一种称为比较基因组学的研究,他们比较了类似病毒的基因组。SARS-CoV-2病毒属于β冠状病毒之下的沙伯病毒(Sarbecovirus)亚属,其中大多数感染蝙蝠。研究人员对SARS-CoV-2,SARS-CoV(导致2003年SARS爆发)和42株蝙蝠sarbecoviruses进行了分析。
Kellis之前开发了用于进行此类分析的计算技术,他的团队还使用该技术将人类基因组与其他哺乳动物的基因组进行比较。该技术基于分析物种之间某些DNA或RNA碱基是否保守,并比较它们随时间的进化模式。
使用这些技术,研究人员确认了SARS-CoV-2基因组中的6个蛋白质编码基因,以及在所有冠状病毒中已经确立的5个基因。他们还确定编码称为ORF3a的基因的区域也编码另一个基因,他们将其命名为ORF3c。该基因具有与ORF3a重叠但出现在不同阅读框中的RNA碱基。这种基因里套基因在大型基因组中很少见,但在许多病毒中很常见,这些病毒的基因组处于选择性压力下以保持致密。这个新基因以及其他几个SARS-CoV-2基因的作用尚不清楚。
研究人员还表明,有5个被认为可能的基因区域并不编码功能蛋白,他们还排除了有更多保守的蛋白质编码基因尚未被发现的可能性。
“我们分析了整个基因组,非常有信心没有其他保守的蛋白质编码基因,”该研究的主要作者、CSAIL研究科学家Irwin Jungreis说。“我们需要进行实验研究,找出那些没有特征的基因的功能,并通过确定哪些基因是真的,我们允许其他研究人员将注意力集中在这些基因上,而不是把时间花在那些甚至没有翻译成蛋白质的东西上。”
研究人员还认识到,以前的许多论文不仅使用了错误的基因集,有时还使用了相互冲突的基因名称。为了纠正这种情况,他们召集了SARS-CoV-2共同体,并在几周前发表在《Virology》上的一篇独立论文中提出了一套命名SARS-CoV-2基因的建议。
快速进化
在这项新研究中,研究人员还分析了SARS-CoV-2自首次发现以来出现的1800多个突变。对于每个基因,他们比较了该特定基因过去进化的速度与自当前大流行开始以来进化的速度。
他们发现,在大多数情况下,那些在当前大流行之前很长时间快速进化的基因依旧进化迅速,而那些倾向于缓慢进化的基因也保持了它们的趋势。然而,研究人员还发现了这些模式的例外情况,这可能揭示了病毒在适应新的人类宿主时是如何进化的。
在一个例子中,研究人员确定了围绕病毒遗传物质的核衣壳蛋白区域,其具有比其历史进化模式预期更多的突变。该蛋白质区域也被分类为人B细胞的靶标。因此,Kellis说,该区域的突变可能有助于病毒逃避人体免疫系统。
他说:“SARS-CoV-2整个基因组中最加速的区域位于这种核衣壳蛋白的中间。我们推测那些不突变该区域的变体会被人类免疫系统识别并消除,而那些在该区域随机积累突变的变体实际上能够更好地逃避人类免疫系统并保持循环。”
研究人员还分析了引起关注的变体中出现的突变,例如来自英国的B.1.1.7菌株,来自巴西的p.1菌株和来自南非的B.1.351菌株。在刺突蛋白中发现了许多使这些变异更危险的突变,这些突变有助于病毒更快地传播并避免免疫系统。但是,这些变体中的每一个也带有其他突变。
Jungreis说:“这些变体中的每一个都有20多个其他突变,因此重要的是要知道其中哪些可能在做些事情而哪些不是。因此,我们使用比较基因组学的证据,根据哪些处于保守位置,对哪些可能很重要进行了首过猜测。”
研究人员说,这些数据可以帮助其他科学家将注意力集中在最有可能对病毒感染性产生重大影响的突变上。他们在加利福尼亚大学圣克鲁斯分校的基因组浏览器中,为希望使用该注释基因集及其突变分类的其他研究人员提供资源。
“我们现在可以去研究这些变异的进化背景,并了解当前的流行病如何适应更大的历史。对于具有许多突变的菌株,我们可以看到这些突变中的哪些可能是宿主特有的适应,哪些突变也许没有什么可以写的。”
原文检索:
Irwin Jungreis, Rachel Sealfon, Manolis Kellis. SARS-CoV-2 gene content and COVID-19 mutation impact by comparing 44 Sarbecovirus genomes. Nature Communications, 2021; 12 (1) DOI: 10.1038/s41467-021-22905-7
-
合成微生物使科学家们能够研究古老的进化神秘
2022-04-29 -
加强了恰帕斯高地土着居民的领土管理合作进程
2022-04-29 -
介绍CNVP,IUCN的新成员
2022-04-29 -
销售人员为肥胖客户推荐更多圆形产品
2022-04-29 -
黄石麋鹿的疾病隐藏成本 USU生态学家说 布鲁氏菌病会减少怀孕
2022-04-29 -
研究人员设计“智能”表面以排斥一切 但针对有益的例外
2022-04-29 -
大麻使用的性别差异开始在动物和人类的大脑研究的帮助下得到解释
2022-04-29 -
缅甸开始在全国红色名单上工作
2022-04-29 -
转染市场五年后将达到10亿美元
2015-07-08