陳根:卷積神經網絡,有效識別不明原發灶_風聞
陈根-知名科技作家为你解读科技与生活的方方面面。2021-05-21 10:47
文/陳根
原發灶不明癌症(CUP)是一類“經過詳細檢查,但始終無法確認癌症原發灶”的轉移性癌症統稱,在所有癌症患者中佔比1%-2%。這類患者往往會經歷各種各樣的檢查,但最終只能依據經驗聯合使用放化療,經濟負擔較重而且普遍預後較差,中位生存時間僅為2.7**-16個月。**
一直以來,研究者都在利用基因組學技術尋找CUP的起源,但研究結果往往不盡人意。同時,基因組學檢測對於CUP患者來説也是一項不小的經濟負擔。因此,如何實現對原發灶不明癌症的溯源,是醫學界長期面臨的挑戰。
得益於人工智能(AI)的發展,現如今,通過將AI圖像識別技術和醫學影像資料相結合,在多個醫學影像讀片或診斷任務中,AI已經能夠達到甚至超越專業醫生的水平。近日,來自哈佛大學的研究人員就實現了AI與癌症診療的完美結合。
研究人員****通過學習大量患者的蘇木精伊紅染色(H&E)病理切片,以弱監督的方式訓練出一個CNN模型(命名為TOAD)。在讀取一張病理切片後,TOAD能夠對人體的18種組織進行預測打分,通過對預測分數進行排序,可以找到癌症最可能的組織來源。
研究人員從公共數據庫和百翰婦女醫院中收集了來自29107名患者的32537 張H&E染色切片,分別標記為18種原發癌源。按照70%、10%、20%的比例劃分為訓練,驗證和測試數據。通過反覆的訓練和優化模型,TOAD在測試數據中的Top-1準確率為83.4%,Top-3準確率為95.5%,Top-5準確率已經能夠達到98.1%****。
為了探究TOAD是否具有普適性,研究者又從223家醫學中心收集了682名患者的數據進行預測。在這些數據中,TOAD的Top-1準確率為79.9%,Top-3準確率為93.4%,表現依然十分出色。
此外,研究人員又從152家醫學中心收集了743名患者的數據,這些患者均在診療過程中的某一個時段被診斷為CUP,其中的317名患者經歷徹底的臨牀和輔助檢查之後,最終確定了腫瘤來源。研究者選擇了這317名患者的切片進行原發灶預測。
結果表明,雖然TOAD對於這些數據的Top-1準確率下降到了60.6%,但是Top-5準確率仍能達到92.1%。這説明即使是面對臨牀中最難診斷的CUP患者,TOAD仍可通過讀取病理切片有效縮小癌症的可能來源。
未來,如果這項研究投入臨牀使用,那麼僅需一張普通的病理切片,醫生就能圈定原發灶不明癌症的範圍,這不僅可以大幅減輕腫瘤科醫生的工作難度,也可提高診療的準確性和效率性。