117疫情觀察:詳解病毒基因序列追蹤流調大法 | 史雋·Ⅶ_風聞
返朴-返朴官方账号-关注返朴(ID:fanpu2019),阅读更多!2020-04-21 16:33
目前來看,病毒本身並沒有很大的變異可以解釋症狀嚴重程度的不同。這對疫苗研發來説是一個好消息。
撰文 | 史雋
4月20日 週一
MA累計確診 39643例
上一篇日記講到科學家們對新冠病毒進行全基因組測序,找到了西雅圖和北加州新冠病毒傳播的源頭。
最近由紐約西奈山伊坎醫學院 (Icahn School of Medicine at Mount Sinai) 和紐約大學醫學院 (N.Y.U. Grossman School of Medicine) 的兩個團隊,分別通過測序分析3月中旬以來紐約的COVID-19患者身上的新冠病毒基因序列 (兩個團隊的樣本不同),得出了基本相似的結論:新冠病毒在2月中旬就開始在紐約傳播,病毒主要是從歐洲輸入的,而不是亞洲。
然而,紐約州宣佈的第一位確診患者是一位從伊朗旅行回來的30多歲女性(3月1日確診)。這意味着在第一例確診患者被發現之前,新冠病毒已經默默地在紐約社區裏傳播開了。
圖1:預印本文章https://www.medrxiv.org/content/10.1101/2020.04.08.20056929v2
病毒侵入細胞後,會劫持細胞的分子機制來複制病毒。這個過程很快,但也很馬虎。因此,病毒兒子可能會獲得其祖先不存在的新突變。病毒兒子被釋放感染別人以後,複製產生的病毒孫子也會繼承這個突變,並且可能在此基礎上增加新的突變。通過對病毒家族的全基因組進行測序,就能追蹤病毒的突變過程。
等拿到很多的病毒家族成員的全基因組序列後,科學家們就可以用複雜的計算機程序分析比較突變,去觀察隨着子子孫孫從共同的祖先那裏衍生出來,突變是如何一步一步地產生的。因為突變產生的速度大致是一定的,如果數據足夠多,還能粗略的估計祖宗有多大年紀。
現在,世界各國的科學家們都在測序新收集到的病毒樣本。因為疫情緊急,很多科學家會把尚未發表的病毒基因序列上傳到名為GISAID的在線數據庫,和全世界共享。
西雅圖弗雷德·哈欽森癌症研究中心的Trevor Bedford(上期講了他是怎麼闢謠的:參見《117疫情觀察:羣體免疫還遠着呢 | 史雋·Ⅵ》)等病毒進化專家團隊則組織了一個名為Nextstrain的項目。當這些共享的數據出現在GSAID以後,科學家們就儘快去把這些序列下載到Nextstrain的後台,將這些序列納入全球傳播地圖,並在nextstrain.org/ncov上公佈新冠病毒的基因組流行病學的最新信息,更新病毒家族樹譜。
Nextstrain軟件平台在過去幾年逐步開發完善,曾應用於埃博拉、Zika和季節性流感等疫情,旨在讓基因組流行病學在疫情期間儘快地發揮作用。
科學家們是怎麼用病毒的序列來了解病毒傳播方式的呢?
先介紹幾個基本的概念。
有研究表明,新冠病毒的潛伏期短至2天,長至20多天。感染病毒5.1天以後,50%的人會出現症狀;感染11.5天以後,97.5%的人會出現症狀。
圖2:來源https://annals.org/aim/fullarticle/2762808/incubation-period-coronavirus-disease-2019-covid-19-from-publicly-reported
也有大型的研究證實,新冠病毒在潛伏期內就可以傳染人,出現症狀前1-3天有傳染性。
因此,一個人感染後,在出現症狀以前,就可能把病毒傳染給另一個人。這個被傳染的人也要過一定潛伏期,才會出現症狀。這兩個人出現症狀之間的時間間隔被稱為病毒的“世代間隔 (serial interval) ”。有研究估算新冠病毒的世代間隔期大約為7天。
圖3:病毒的世代間隔 (作者作圖)
新冠病毒平均每月突變兩次,也就是大約14天,2個世代間隔有一個突變。
簡化的病毒傳播鏈為如下所示:
圖4:病毒的傳播鏈 (作者作圖)
這些突變通常是很簡單的一個鹼基 “T”更改為“A”,或者可能是“G”更改為“C”。這些突變改變了病毒的遺傳密碼,不過這些小的變化一般不會令病毒產生關鍵變化,從而改變行為(如傳染力和致病性)。
但是,科學家們可以結合取樣時間和基因組的序列推斷出感染的順序。相比於傳統的流調追蹤接觸者和病例分析,這種方法是一種更新的、瞭解病毒傳播方式的辦法。
舉一個經典的例子,在《117疫情觀察:新冠無症狀感染的威脅 | 史雋·Ⅲ》裏曾經提到過,Trevor Bedford通過病毒基因測序而發現無症狀/輕症狀感染導致西雅圖地區社區傳播。
圖5:來源於Trevor Bedford的博客 (https://bedford.io/blog/ncov-cryptic-transmission/ )。
上圖中的 “ USA / WA1 / 2020”就是美國第一例被確診的COVID-19患者—— 1月15日從武漢返回西雅圖Snohomish County (斯諾霍米什縣) 的Amazon公司員工。他在1月19日被收集了鼻咽拭子樣本,隨後樣本里的病毒被美國CDC快速測序了。
該病毒的基因組與1月21日在福建採樣的“Fujian/ 8/2020“ 的基因組完全相同,福建的這個病毒也被標記是從武漢輸入的,説明這兩者很有可能是很接近的時間在武漢感染的。
“ USA / WA2 / 2020”就是上一篇日記(見《117疫情觀察:羣體免疫還遠着呢 | 史雋·Ⅵ》)提到的西雅圖流感計劃 (Seattle Flu Study) 找到的西雅圖地區最早的新冠病毒陽性樣本。它是通過回顧測序西雅圖地區從2020年1月1日至3月10日收集的有急性呼吸道感染的人的鼻拭子樣本,而找到的2月21日採樣的最早的新冠病毒陽性的樣本。這個病例被認為是美國第二個社區傳播感染的病例,取樣於一名有輕微流感症狀的少年。他在距離WA1病人的居住地約15英里處的一所高中上學。這位少年只有很輕微的症狀,沒有旅行史,並沒有和WA1病人有任何接觸。因此,他並不符合當時美國CDC測試新冠病毒的條件:“有發燒和呼吸系統症狀,並且有中國武漢的旅行史”。患者因為有類似流感的症狀就醫,因為症狀很輕,回家恢復了。
WA2病毒的基因序列和WA1的序列相比,幾乎完全一樣,只多了三個基因突變。
這個樣本採集時間是2月21日,與第一個樣本採集的1月19日間隔了差不多5周。根據上面圖4的病毒傳播鏈計算,5周的間隔時間也差不多可以累積2-3個突變。
WA1和WA2的病毒基因序列還包含一個關鍵的遺傳變異 (在基因序列18060位置上),在數據庫中59個來自武漢的樣本里面,有2個含有這一突變。假設WA2不是WA1的後代,18060位置上的突變是隨機產生的幾率大約是2/59=3%。
換句話説,有97%的幾率WA2病毒是WA1病毒的直接後代。考慮這兩個病人活動的地區只間隔了24公里,這個可能性更大了。
這意味着,那位1月15日從武漢返回西雅圖的男性在進醫院就診之前,已經把病毒傳染給了別人,而那個人是無症狀或者輕症狀,沒有引起警覺。從而導致新冠病毒在西雅圖社區裏面默默地傳播了大約5周,感染了數百人。
後來的情況證實Trevor Bedford的結論是正確的:華盛頓州從後來的病人身上分離的病毒的基因組支持了第一二個病例(WA1和WA2)之間的關聯。
再看另一個例子。
截至4月19日,Nextstrain裏面有來自美國的新冠病毒的基因序列1149條,其中馬薩諸塞州有19條,大部分都是美國CDC測序的。第一條“USA/MA1/2020”採樣於1月29日,是那位從武漢回來的麻州大學的留學生,他的基因序列和來自武漢的病毒基因序列很相近。剩下的都是在3月4日至7日間採樣,從時間上看很大可能是MA最早暴發的Biogen公司的員工樣本 (參見《波士頓新冠暴發危機:Biogen年會病毒大傳播始末》)。其中有一條孤零零的“USA/MA_1355/2020”樣本採集於3月5日,和來自英國的病毒基因序列最接近。其他的17條形成一個大簇,和來自法國的病毒基因序列接近。這英法的區別不得不讓我猜測:是因為兩國社交禮儀的不同?
看起來,馬薩諸塞州的早期病例大多是歐洲輸入的。相比於馬薩諸塞州超過36000的病例總量,這19個序列只是很少的一部分,相信以後還會有更多的序列被共享。
圖6:Nextstarin截至4月19日全球新冠病毒樹譜。圖中標註的紅點是馬薩諸塞州的樣本。來源:nextstrain.org。
新冠病毒的變異速度比流感慢得多(後者大約是前者的2~4倍)。目前來看,病毒本身並沒有很大的變異可以解釋症狀嚴重程度的不同。這對疫苗研發來説是一個好消息:“好不容易疫苗做出來,已經對付不了當前流行的病毒”,這種可能性降低了。但是,只要新冠病毒繼續感染人,它就會繼續突變。這就是為什麼科學家需要時刻追蹤病毒突變的原因——做好提前應對。
特 別 提 示
1. 進入『返樸』微信公眾號底部菜單“精品專欄“,可查閲不同主題系列科普文章。
2. 『返樸』提供按月檢索文章功能。關注公眾號,回覆四位數組成的年份+月份,如“1903”,可獲取2019年3月的文章索引,以此類推。
版權説明:歡迎個人轉發,任何形式的媒體或機構未經授權,不得轉載和摘編。轉載授權請在「返樸」微信公眾號內聯繫後台。