陳根:機器學習,預測新冠存活率_風聞
陈根-知名科技作家为你解读科技与生活的方方面面。2022-01-20 09:50
文/陳根
機器學習是人工智能領域最為廣泛的應用之一。機器學習是統計分析時代向大數據時代發展必不可少的核心打磨,是開採大數據這一新“石油”資源的工具。
比如,在基礎應用領域,環境監測、能源勘探、天氣預報等基礎應用領域,通過機器學習,加強傳統的數據分析效率,提高預報與檢查的準確性;再如銷售分析、畫像分析、庫存管理、成本管控以及推薦系統等商業應用領域。
**此外,在疾病預測方面,機器學習也越來越多地為人們提供可靠的幫助。**疫情期間,研究人員就曾通過機器學習來預測新冠肺炎患者的生存率。2020年3月,來自華中科技大學同濟醫學院附屬同濟醫院、華中科技大學人工智能與自動化學院、劍橋大學植物科學學院的研究人員利用了可解釋機器學習算法,對預測新冠肺炎患者存活率的生物標誌物進行了揭示。
研究人員對武漢同濟醫院收治的404例新冠肺炎感染患者進行血液樣本數據收集並進行回顧性分析。通過機器學習工具,研究團隊最終選擇了3種生物標誌物來預測個體患者的生存率,準確性超過90%:LDH(乳酸脱氫酶)、淋巴細胞和hs-CRP(超敏C-反應蛋白)。特別是,僅LDH水平較高這一項指標就能夠用於區分絕大多數需要立即就醫的病例。
現在,柏林夏裏特醫學院的研究人員也成功通過一個機器學習模型利用血漿蛋白來預測新冠肺炎患者的生存率,而這要比結果早幾個星期。
具體來看,在新研究中,研究人員分析了在349個時間點採集的血樣中321種蛋白質的水平,這些血樣來自德國和奧地利的兩個獨立醫療中心正在治療的50名新冠肺炎重症患者。隨後,通過特定的****機器學習方法被用來尋找所測量的蛋白質和病人生存之間的聯繫。

隊列中的15名患者死亡;從入院到死亡的平均時間為28天。對於活下來的病人,住院時間的中位數是63天。研究人員確定了14種蛋白質,隨着時間的推移,與在重症監護下無法存活的病人相比,存活的病人的蛋白質變化方向相反。
研究小組隨後開發了一個機器學習模型,根據相關蛋白質的單一時間點測量來預測生存率,並在24名COVID-19重症患者的獨立驗證隊列中測試了該模型。該模型在這個隊列中表現出準確的預測能力,正確預測了19名患者中的18名生存者和5名死亡者的結局。
機器學習進入人們的生活已經是不爭的事實,隨着技術水平的不斷提高,機器學習將越來越多地為人們提供人力所難及的支持,對於此次機器學習展現出來的成績,研究人員總結説,如果在更大的隊列中得到驗證,血液蛋白檢驗可能有助於識別具有最高死亡風險的患者,以及檢驗某種治療是否會改變單個患者的預測軌跡。