NAR:基於人工智能的新冠病毒虛擬變異評估和預警系統_風聞
中国生物技术网-中国生物技术网官方账号-2021-10-15 15:52
隨着全球新冠疫控的持續,新型冠狀病毒基因組在流行過程中持續發生變異。迄今,在全球科學技術人員的共同努力下,已經對超過400萬例病毒基因組進行了測序,並構建了多個病毒基因組數據庫。這些數據庫(如GISAID)在收集、展示數據的基礎上,包含了病毒分型、溯源分析等功能,為全球疫情的監測追蹤提供了重要的信息。然而,隨着對變異研究的深入,對變異造成的功能影響日漸成為關注的焦點。目前,在全球多個國家和地區均發現了包括Alpha、Beta和Delta在內的多種感染力增強的變異毒株,尤其是關鍵位點積累的氨基酸變異,極大地改變了病毒的免疫學特徵,增加了病毒免疫逃逸的風險,可能會降低現有疫苗、抗體、藥物等疫情控制方法的保護性,影響核酸診斷試劑的適用性,對疫情的防控構成了嚴峻挑戰。因此,現有的以收集、展示數據為主的基本數據庫已經難以滿足未來疫情防控的需求,亟需一個基於大數據的病毒變異風險評估及預警系統,對現有及未來可能出現的各種變異造成的影響進行系統性評估和解讀,從而實施更加精準有效的疫情防控策略。
中國科學院微生物研究所微生物資源與大數據中心馬俊才團隊和胡松年團隊與北京大學、中國科學院計算機網絡信息中心等團隊合作在國際知名學術期刊Nucleic Acids Research(IF=16.971)上發佈了“新型冠狀病毒變異評估和預警系統”(SARS-CoV-2Variations Evaluation and Prewaning System),簡稱VarEPS數據庫。VarEPS是全球首個對SARS-CoV-2基因組已知變異及虛擬變異進行多維度風險評估和預警的系統。

該數據庫從基因組學和結構生物學角度入手,在基於變異位點頻率評估的基礎上,從核苷酸變異發生難易程度、氨基酸替換難度、變異對蛋白質二級結構的影響、單個氨基酸突變引起的ACE2及中和抗體結合自由能變化等參數對變異進行多維度的評估,全面對已知變異和潛在的虛擬變異對病毒的功能造成的影響進行綜合分析。在此基礎上,該系統採用人工智能分類器算法,將變異株從傳播性和對中和抗體親和力兩方面進行有效分組,實現了基於病毒序列的風險評估和預警。
該系統不僅可以作為全球病毒變異監測和追蹤的工具,同時還可以基於虛擬變異和風險評估模型,為針對新型變異毒株的精準防控和抗體疫苗設計提供有效的參考信息。目前基於該系統的分析結果為精準高效應對SARS-CoV-2突發疫情提供了重要的決策依據,同時也為應對其他突發傳染性公共衞生事件提供了技術儲備。

上述研究成果已於2021年10月11日在Nucleic Acids Research上在線發表,中國科學院微生物研究所微生物資源與大數據中心高級工程師孫清嵐、舒暢為該論文的並列第一作者。中國科學院微生物研究所微生物資源前期開發國家重點實驗室胡松年研究員、高勝寒特別研究助理、國家微生物科學數據中心馬俊才研究員、吳林寰正高級工程師為該論文的共同通訊作者。該研究得到了國家重點研發計劃、中科院A類先導專項、中國科學院重點部署項目、國家自然科學基金金磚國家國際合作項目的經費支持。
該數據庫通過國家微生物科學數據中心NMDC對全球用户公開免費開放,可在www.nmdc.cn/ncovn上自由訪問。VarEPS 系統的功能界面由五個主要部分組成:“病毒和變異”、“結合能力評估”、“引物功效評估”、“統計”和“分析工具”。其中,“病毒和變異”以表格形式顯示包括譜系、單核苷酸多態性 (SNP) 數以及核苷酸和氨基酸的變異信息,並對每個病毒序列提供了所有相關突變和引物評估結果的單獨頁面。“結合能力評估”部分允許用户通過變異所在基因、譜系和抗體結合位點上的位置進行查詢,結果以表格的形式展示每個已知變異及所有虛擬變異的多維度風險評估結果,計算並顯示抗體親和力、與ACE2的結合穩定性、氨基酸替代的風險以及第一次和最後一次檢出的時間等數據。“引物功效評估”部分可評估每個突變株對RT-PCR引物效力的影響,並給出受影響的相應毒株信息。
原文鏈接:
https://academic.oup.com/nar/advance-article-abstract/doi/10.1093/nar/gkab921/6389500