新冠疫情丨這份來自人工智能、大數據和雲計算的答卷,你給多少分?_風聞
云猜预测家-“超级预测者”的资讯站和训练营。2020-02-11 20:16
首發於微信:超級預測
據《連線》(Wired)雜誌報道,加拿大一家名為BlueDot的公司憑藉其人工智能平台在12月31日就向其客户發出了此次疫情的消息。人工智能一類的技術在此次疫情中扮演了怎麼樣的角色,它將要扮演怎樣的角色?人工智能能預測流行疾病嗎?為什麼流行疾病難以預測?

本期內容部分來自Forbes、Vox、Wired和英國電訊報等媒體
人工智能最早預測疫情
當一種未知的疾病首次出現,政府和公共衞生官員很難迅速收集信息並協調應對。
人工智能技術卻可以通過對世界各地的新聞報道和在線內容進行挖掘,幫助專家識別可能導致潛在流行病的異常情況——這一能力在最近爆發的疫情中得到了充分展示。
據《連線》(Wired)雜誌報道,加拿大一家名為BlueDot的公司在12月31日就向其客户發出了此次疫情的消息——早於美國疾病控制與預防中心(CDC)和世界衞生組織(WHO)。

該公司網頁上的介紹:“我們將公共衞生和醫療專業知識與先進的數據分析相結合,創建追蹤、情境化和預測傳染病風險的解決方案。”
BlueDot是利用數據評估公共健康風險的眾多公司之一。公司創始人兼首席執行官卡姆蘭·汗(Kamran Khan)同時也是一名傳染病醫生。
目前,BlueDot已經建立了一個複雜的人工智能平台,目前正在使用自然語言處理(NLP)和機器學習(ML)來處理大量非結構化的文本數據,目前支持65種語言,跟蹤超過100種不同疾病。
旅行者的行程信息和航班路線等其他數據可以幫助瞭解疾病可能的傳播方式和具體地點。在一月早些時候,BlueDot的研究人員預測,在中國大陸出現新冠病毒後,亞洲其他城市也會出現新冠病毒。
汗在接受採訪時説道,公司的系統還可以利用一系列其他數據,比如一個地區的氣候、温度,甚至當地家禽的信息,來預測個人是否感染了某種疾病、地區是否可能引發疫情。
2016年,BlueDot在寨卡病毒出現在美國佛羅里達州的前六個月就預測了它的爆發。

BlueDot向客户發送的預警
日前,流行疾病監測公司Metabiota也通過觀察飛行數據得出了關於此次疫情的預測:泰國、韓國、日本將是本次新冠疫情的高風險地區。
據悉,Metabiota還可以根據疾病的症狀、死亡率和可獲得的治療等信息,估計疾病傳播造成的社會性風險。
人工智能的優勢在於對所有的數據源進行整合。因此,全球範圍內的從業人員均在着手研發基於人工智能的流行病預測模型,希望藉此以應對潛在的危機。
但創造一個能從個體層面上精確模擬流行疾病爆發的人工智能,卻仍然有待於未來。
為何流行疾病難以預測?
我們可以做些什麼,來防止未來的疫情爆發?
這也是疫情預測這個新興科學領域的核心。
BlueDot通過人工智能監測平台率先預測和發佈武漢出現傳染疫情的新聞,得到了媒體的廣泛關注——藉助大數據沉澱基礎和人工智能的推斷,人類成功地預測了未來。
在過去的幾個世紀裏,科學家對世界的預測越來越準確:行星的軌道、潮汐的漲落和颶風的路徑。充分理解自然和物理系統,並對其做出準確的預測,確實可以看作是人類巨大的成就之一。

微軟(Microsoft)聯合創始人比爾‧蓋茨(Bill Gates)2018年也曾預(警)測(告)説,下一次在全世界傳播的大型流行疾病可能是我們從未見過的傳染病。蓋茨還警告説,世界沒有足夠的能力來應對病毒性疾病傳播的影響。
對未來進行預測的理念與行動很大程度上始於艾薩克·牛頓(Isaac Newton)對事物的判斷:存在一種穩定的自然規律,而這些規律支配了我們周圍的自然現象。
如今,快速執行大型計算的能力輔助了牛頓主義的觀點,即只要有足夠的數據和計算能力,就可以預測最複雜的現象。
然而,對流行疾病進行預測的效度仍舊是有限的。
因為在流行疾病中,最重要的變量均是不斷變化的。對流行病進行預測,與天氣預報一樣,收集實時數據對於提高預測疫情的能力可能至關重要。
科學家對流行疾病進行建模的想法基於這樣一個概念,即每次疫情的發展軌跡是可以預測的。

張文宏“流感非感冒,老虎不是貓”演講截圖
假設疾病是由傳染性病原體引起的。疾病的傳染性可以用其“繁殖係數”來衡量,即R0,R0描述病原體在特定人羣中傳播的可能性。
在此種假設下,R0是一個穩定的變量。
但它並不穩定。例如寨卡病毒,其R0的範圍在0.5到6.3,在可以製造一場會自行消散的流行疾病到一場長時期的流行疾病之間不等。
寨卡病毒R0值範圍如此之廣並非因為統計上的不確定性,而是各種因素都會導致不同環境下的R0值不同。
一種流行疾病的特徵病原體的傳染性、傳播速度、疫苗的可獲得性等等,這些均可以在一場疫情中飛快地變化。
這也決定了科學家們只能在疫情中預測動態。

流行疾病像是一系列嘈雜的事件,其中許多變量扮演着重要但不斷變化的角色。這種疾病沒有潛在的真相,只有不穩定的細節集合,並隨着疾病的蔓延而變化。
所以,科學家們不再假設每次爆發都遵循相同的規則。在比較一次疫情與另一次疫情時,他們牢記每一次爆發的相異之處。
即使兩種疫情都植根於同一種傳染性病原體,但許多細節上的差異意味着科學家可能需要重新界定他們如何模擬每種疾病。為了更好地瞭解這些細節,科學家需要大量的實時數據。
這也回答了另一個問題:為何疾病監測仍然是科學中風險最高的領域之一。
ABC時代,我們如何抗疫?
ABC(人工智能、大數據、雲計算)技術帶來的變革有目共睹。
在此次疫情中,它們也發揮了重要的作用。
騰訊雲於1月24日向中山大學藥學院羅海彬教授團隊提供了批量GPU雲服務器免費使用權,幫助該團隊推進病毒藥物的篩選工作。
同時,騰訊雲還向北京生命科學研究所、清華大學生物醫學交叉研究院的實驗室提供了大量標準的CPU算力以及對象儲存能力,幫助他們進行基因測算的離線計算任務。
雲計算的關鍵在於其高性能的算力,能夠幫助實驗室快速篩選數億級別的化合物數據庫,從而加快針對新冠狀病毒的研究工作。
丁香園·丁香醫生則在第一時間製作了“疫情實時動態”,第一財經商業數據中心推出實時更新的“定製防疫地圖”。類似的實時查詢工具還有不少,大數據分析技術是它們的核心所在。
大數據分析不僅可以用來支撐服務疫情態勢研判、疫情防控部署,也可以對流動人員進行疫情監測、精準施策。

“丁香園疫情實時動態”界面(截圖時間:2月10日15時)
2月1日,浙江省疾控中心上線自動化全基因組檢測分析平台,該平台利用阿里達摩院研發的AI算法,可將原來數小時的疑似病例基因分析縮短至半小時。
與目前醫院普遍採用的核酸檢測方法不同,該平台採取的是全基因組檢測技術,可對疑似病例的病毒樣本進行全基因組序列分析比對。
阿里達摩院算法專家顧斐表示,整個檢測過程包括提取樣本、建庫以及數據分析等步驟,其中,AI主要提升分析環節的效率。
2月4日,響應工信部對人工智能企業加速賦能的倡議書,中關村管委會對外發布“首批抗擊疫情的新技術新產品新服務清單”。
該清單包括86家中關村企業的138項新技術新產品新服務,涵蓋病毒檢測、疫苗研發、臨牀治療、醫療防護、智能診斷、疫情分析與發佈等與抗擊疫情相關的各個方面。

曠視AI測温系統落地海淀,測温精度誤差僅為±0.3攝氏度
近日,曠視科技的近百人研發團隊經過十天的奮戰,正式上線了人工智能測温系統,並已經在海淀政務大廳和海淀區部分地鐵站展開試點應用。
該系統可以通過前端紅外相機鑑別人流中的高温人員,再根據疑似發燒者的人體、人臉信息,通過行人再識別技術,輔助高密度人員流動場景下的工作人員快速定位發燒者。
相比人工近距離檢測手段和傳統的發熱篩查系統,智能測温系統既可以有效防止疫情擴散,又能減少對公眾的干擾,提高通行效率。
青島悟牛智能科技有限公司利用自身技術優勢在最短的時間內改裝出了消毒機器人,投入到當地多家醫院的治療一線。
除此之外,人工智能還可以根據地區預測潛在新病例的數量,以及哪些類型的人羣面臨的風險最大;可以幫助優化策略的增強;可以預測病毒從動物傳播到人類的熱點地區。
一旦確定了已知的疫情,衞生官員就可以根據環境條件、醫療條件和傳播方式,利用人工智能來預測病毒將如何傳播。人工智能還可以用於指導公共衞生官員在危機期間如何分配資源。
機器學習則可以閲讀數百億的數據點和醫療記錄中的臨牀文件,並建立起與感染或未感染該病毒的患者之間的聯繫;可以評估和優化隔離策略控制傳播;可以開發增強疫苗接種策略的方法。
人工智能對公共衞生領域進行預測的歷史可以追溯至2008年。彼時,谷歌推出了一項服務,試圖利用人們的搜索查詢來發現流感爆發。

如前所述,創造類似BlueDot能夠準確預測疾病傳播的人工智能,已經成為世界各地研究人員的首要任務。或許在未來,人工智能將成為對抗流行疾病的第一道新防線。
但問題仍舊存在,人工智能通常存在歧視和偏見;而對於隱私侵犯的潛在憂慮,也是在人工智能這一技術發展時所必須面臨的問題。