12320

手机版

微信公众号

Science:AI模型精准预测哪种新冠突变株将引发下一波感染浪潮

2022-06-23

  201912月至今,新冠病毒(SARS-CoV-2)已经伴随我们进入第三个夏天。虽然疫情还未终结,但病毒早已不是原来的毒株。 

  202010月,英国肯特郡首次发现SARS-CoV-2的第一个变异毒株阿尔法(B.1.1.7),随后南非首次发现贝塔(B.1.351),巴西首次发现伽玛(P.1......与此同时,在印度首次发现的德尔塔(B.1.617.2)已几乎取代此前所有版本的变异毒株,并给全球人口带来最致命的打击。202111月,南非首次发现了奥密克戎(B.1.1.529)。随后,德尔塔逐渐淡出人们的视线,奥密克戎成为全球主导毒株,并且它一直在持续进化。截至目前,已有多个国家报告发现奥密克戎亚型毒株BA.2.12.1BA.4BA.5和重组变异株XQXEXM 

  目前,我国的主要流行毒株是奥密克戎亚型毒株BA.2,该毒株传播速度快、隐匿性强。吉林、上海和香港等地的大规模性疫情皆由BA.2引发。然而,近期几项研究表明,最新出现的亚型毒株BA.2.12.1的传播速度比BA.2还要快约23%27% 

  根据美国疾病控制与预防中心(CDC524日发布的数据显示,具有高度传染性的奥密克戎亚型毒株BA.2.12.1已成为美国流行的主要毒株,约占该国所有新增病例的58%。奥密克戎适应度的增强和持续进化不断引发新的疫情,这着实令人担忧。然而,在其所有的亚型毒株中,并非每一个毒株都引发了大规模感染浪潮。对于公共卫生部门而言,该如何判断哪些变异毒株会导致病例海啸,哪些毒株只是匆匆过客呢? 

  虽然科学家们已经对SARS-CoV-2有了比较全面的了解,但识别出具有重要功能的变异毒株仍然是一个挑战。 

  2022524日,麻省理工学院和哈佛大学博德研究所的研究团队在 Science 期刊上发表了题为:Analysis of 6.4 million SARS-CoV-2 genomes identifies mutations associated with fitness 的研究论文。 

  

  SARS-CoV-2大流行是以具有更高适应度的病毒新谱系出现驱动疫情反复暴发为特点。因此,快速识别新谱系并准确预测其动态,对于制定疫情应对策略至关重要。 

  在这项新研究中,科学家们开发了名为 PyR0 的机器学习模型,这是一种贝叶斯分层回归模型。PyR0可以对完整的SARS-CoV-2基因组进行可扩展分析,也可以应用于其他病毒基因组数据集和表型。 

  PyR0使用来自全球禽流感数据共享数据库(GISAID)中所有公开的SARS-CoV-2基因组数据进行训练,并在大约一个小时内完成对数百万个基因组的分析。PyR0将相似的序列组合在一起,通过共享突变来定义基因组的集群 

  通过分析,PyR0可以预测出哪些变异毒株可能会占主导地位,并导致新冠肺炎病例激增。此外,该模型还可以帮助研究人员识别病毒基因的哪些位点可能会发生变异,从而为开发应对未来更多变异毒株的疫苗找到更好的靶点 

  研究人员表示,这种基于机器学习的方法可以查看所有数据并将其结合到一个预测中,这是非常有价值的。这为确定正在出现的情况以及潜在威胁提供了帮助。 

  该研究合著者、机器学习研究员 Martin Jankowiak 博士说:“SARS-CoV-2基因组已经积累了许多突变,所以审查所有突变组合变得非常具有挑战性。这种分析的优势在于它从整体上观察整个基因组,并指出可能在实验室中没有被关注的突变情况。 

  在对截至2022120日在GISAID上可用的6466300SARS-CoV-2基因组进行了拟合后,PyR0预测出奥密克戎亚型毒株BA.2具有迄今为止最高的适应度,并且比原始毒株(谱系A)高出8.9倍,从而准确预示该毒株将在其流行国家/地区取代其他毒株,成为主导毒株。同样,PyR0还识别出202011月底之前阿尔法毒株(B.1.1.7)的竞争优势,这比世界卫生组织将其列为令人担忧的变异毒株提前了一个月。 

  

  通过确定哪些突变有助于增强特定变异毒株的适应度,PyR0还为SARS-CoV-2的传播和疫情发展提供了生物学见解。例如,了解关键突变可以帮助科学家预测新的变异毒株是否更具有传染性或逃避中和抗体的能力,从而帮助他们决定哪些突变应进行更详细的研究。 

  

  该研究表明,当前SARS-CoV-2适应度的增强源于病毒逃避免疫反应的能力。公共卫生官员在对突变的序列和特征发出预先警告后,可以实施具体措施来控制疫情;而且,知道具体的突变有助于掌握变异毒株的生存机会,从而帮助研究人员为开发应对未来更多变异毒株的疫苗选择更好的靶点。 

  总之,PyR0提供了一种全基因组自动化的方法来检测具有更高适应度的病毒谱系。通过将基于模型的谱系适应度评估与绝对病例计数相结合,该模型提供了新冠大流行前两年事件以及病毒进化的全景图。 

  该研究第一作者 Fritz Obermeyer 博士说:利用现有的海量数据和这个新方法,我们可以实时了解病毒在世界各地的演变情况,这在以前的大流行中是不可能的。 

  

   (来源:生物世界) 

  原文出处:Obermeyer F, Jankowiak M, Barkas N, et al. Analysis of 6.4 million SARS-CoV-2 genomes identifies mutations associated with fitness[J]. Science. 2022 May 24:abm1208. doi: 10.1126/science.abm1208. Epub ahead of print. PMID: 35608456. 

  链接:https://pubmed.ncbi.nlm.nih.gov/35608456/ 

相关新闻:

文件附件: