《華爾街日報》:AI現在為您服務
Lee Hood and Nathan Price
憑藉醫學訓練,醫生擁有豐富的知識、經驗、智慧和判斷力。然而,即便是最傑出的人腦也無法記憶或解讀當前關於人類健康與疾病信息總量的冰山一角。就在幾年前,大多數醫療決策還完全依賴於醫生在做出決定時頭腦中的知識。如今,得益於人工智能的快速發展,這一狀況正開始改變。
催生出ChatGPT及類似大語言模型的這場技術演進,正使AI成為歷史上應用最迅猛的技術之一,它將深刻改變我們的生活和工作方式。其中最重要的變革將發生在醫療健康領域。隨着這些系統背後的技術進步,AI很快會像醫生、護士、候診室和藥房一樣,成為我們醫療體驗中不可或缺的部分。事實上,用不了多久,AI就會在很大程度上取代或重新定義所有這些元素。
一系列AI"決策支持系統"已在幫助醫生在診療時獲取海量信息。這些系統充分發揮計算機與生俱來的優勢——近乎即時地存儲、調取和關聯海量信息——並將其與人類專家直覺推理和創造性思維的能力相結合。
當早期所謂的"專家系統"在20世紀80-90年代首次開發時,曾遭到許多醫生的牴觸,他們擔心計算機很快會主導醫療決策,將"醫生的觸覺"排除在外,並束縛那些與計算機分析意見相左的醫生的手腳。但這種情況並未發生。研究表明,這些系統在幫助醫生髮現可能遺漏的潛在結果方面越來越出色,同時並未剝奪他們最終的決策權。
我們正快速邁向一個時代,屆時“半人馬醫生”——融合人類智慧與人工智能輔助的最佳部分——將能夠做出大膽的醫療決策,同時大幅減少意外後果。這一點至關重要,因為僅在美國,醫療失誤每年就導致約25萬人死亡。可以説,人工智能賦能的醫療已經挽救了無數生命,這並非誇張。
例如,一款名為MedAware的人工智能程序幫助醫生避免意外開錯藥物。該系統由Gidi Stein博士首創,起因是他聽聞一名9歲男孩因醫生點錯選項而死亡——本該開具哮喘藥卻誤開了血液稀釋劑。此類錯誤普遍得可怕:約70%導致不良反應的用藥錯誤屬於處方錯誤。
這個問題為何如此普遍不難理解。美國食品藥品監督管理局已批准數萬種處方藥產品,其中許多名稱極為相似。比如諾和靈與諾和鋭、長春鹼與長春新鹼、羥嗪與肼屈嗪。考慮到醫生以字跡潦草著稱,可以想象在處方多為手寫的年代這會造成多大困擾。即便在數字時代,簡單的拼寫錯誤或一時記憶模糊仍可能導致開錯藥。
當醫生開具的處方與MedAware評估的患者醫療需求不匹配時,系統會發出警報。若醫生試圖開具可能與患者現有藥物產生負面相互作用的藥物——另一個醫生從不核對的常見錯誤——系統也會提示。全球使用MedAware的醫院中,醫生仍擁有最終決定權。該系統只是提供額外核查,這對超負荷工作的疲憊醫生尤為有益。
圖片説明:埃德蒙·德哈羅還有另一個優勢。犯錯的風險常使醫生不敢創新思考,將治療方案侷限在少數熟悉的選擇上。這些做法最佳狀態下雖基於臨牀試驗,但結合人工智能與個人數據雲的力量,我們能做得比"遵循平均值"更好。AI輔助的醫生能在提供推薦治療方案前,快速自信地評估數萬種可能結果——綜合考慮個人獨特的基因構成、生化指標、生活方式和病史。
臨牀決策支持系統還能幫助檢測結果更個性化,根據年齡、性別、種族、疾病亞型等因素調整參考範圍。麻省總醫院計算機科學實驗室開發的AI工具DXplain,能根據臨牀表現提供可能的診斷。隨機對照試驗顯示,使用DXplain的家庭醫學住院醫師在30個臨牀病例的診斷測試中表現顯著提升,準確率從74%提高到84%。
如今臨牀決策支持系統還用於輔助實驗室檢測和結果解讀,提供異常指標預警。它們有時能幫助避免使用高風險或有創診斷方案,選擇更安全的替代方法。例如肝活檢雖是判斷乙肝丙肝損傷程度的金標準(比無創檢測更準確),但AI模型能整合影像學、血液標誌物和遺傳學等多源數據,無需活檢即可獲得更高準確率。
病理報告驅動着許多關鍵醫療決策,人工智能可用於執行諸如自動腫瘤分級等任務。一項研究表明,人工智能分析膀胱腫瘤的準確率可達93%。如今其他AI系統被應用於患者安全、臨牀管理、成本控制和診斷支持領域。當患者電子健康檔案顯示其符合臨牀試驗條件時,某決策支持系統會向醫生髮出提醒;另一系統則能確保文檔準確性——例如確認脾切除術後患者已接種預防細菌感染的疫苗。在臨牀專家資源有限的地區,這類系統能提供遠超當地原有水平的專業護理,具有重大價值。
儘管仍存在阻力,但越來越多醫生開始尋求AI系統作為輔助工具。診斷權力格局變動之際,總有人會抵制新技術。但那些將AI融入實踐的醫生,將為患者(及自身)提供卓越服務。最優狀態下,這些系統如同集結了成千上萬名專家同時高速協作。由於AI運行成本普遍低廉,其在優化診療和大幅降低成本方面潛力驚人。
醫療AI的進步主要得益於可用數據量的激增。所有大型醫療機構都積累了海量電子健康檔案(EHRs),記錄患者診療全過程。2017年研究發現,每位患者年均產生80兆字節數據,包括影像資料、基礎檢測結果、預後信息等。這尚未計入基因組學、血液分析、腸道微生物組分析和可穿戴設備數據——當我們開始整合這些更龐大的數據集時,它們都將成為每位患者數據雲的一部分。
通過將患者數據輸入深度知識系統進行分析和解讀,醫生可以得出針對個體的前沿診斷和治療方法。佛羅里達大學開發的GatorTron是早期利用大型語言模型進行此類應用的嘗試,該系統通過900億字的電子病歷數據進行訓練,使其能夠提取臨牀概念並回答醫學問題。
為了迎接計算機系統能夠推理、決策並向人類解釋其決定以獲得最終批准的未來,人工智能需要取得新的進展。傳統的計算機"專家系統"難以擴展,因為隨着規則的堆積往往會變得複雜,導致決策樹異常錯綜複雜。相比之下,人類思維並非純粹基於規則。與計算機不同,我們非常擅長識別何時不應將規則應用於特定案例或邏輯在何處失效。人類大腦的奇蹟之一就是能夠應對意外情況。
基於知識的人工智能系統迫切需要類似於推動數據驅動人工智能系統取得突破的進步。這將帶來一個"深度學習"與"深度推理"相結合的世界,使人工智能能夠理解隱含關係,而不僅僅是那些專門編程到其代碼中的關係。這一挑戰之所以如此困難,是因為與深度學習不同,在深度學習中增加大量計算能力和數據推動了飛躍,而我們需要概念上的進步才能實現深度推理。
然而很快,這類系統將成為醫生在數據爆炸、醫學認知與洞察力激增的時代中不可或缺的助手。在近期最可能實現的協作模式中,人工智能將提供一系列附有醫生可理解説明的決策建議,使其能夠批判性評估底層邏輯。這高度契合了專科醫生指導全科醫生為患者制定最終診療方案的方式。AI不僅將成為強大的健康管理工具,更會成為卓越的教學輔助手段。
隨着自然語言處理技術的進步,特別是ChatGPT等大型語言模型的出現,人類與計算機終將能就患者狀況展開縝密的推理論證,通過即時交流共同探討各種可能性。醫生將保留最終決策權,同時從海量新數據與知識的學習整合壓力中解放——這些本是做出最優決策的必要條件。深度推理終將揭示人類僅憑自身無法察覺的關聯與概念。
當AI開始揭示覆雜洞見而非簡單數據時,醫生將扮演什麼角色?若這些干預措施有效,即便人類無法解釋其原理,我們是否仍會採納?這看似激進,但需知現有許多藥物療法雖作用機制未完全闡明卻依然奏效,人類生理系統的驚人複雜性始終令我們歎服。
歷來如此。早在人類理解為何這些化學物質能減輕疼痛和炎症之前,古蘇美爾人和埃及人就已經開始利用柳樹等富含水楊酸的植物製作藥物。儘管由此衍生的現代藥物阿司匹林已問世165年有餘,但其對人體作用機制的研究至今仍在繼續。我們推測,人工智能將如同阿司匹林:即便無法完全理解其原理,人類仍會因其有效性而持續使用。這需要信念的飛躍,但創新往往意味着在真相大白前,需在未知領域探索一段時間。
胡德博士是表型健康公司首席執行官、系統生物學研究所聯合創始人兼教授,普賴斯博士是索恩健康科技公司首席科學官。本文節選自他們4月4日由哈佛大學出版社出版的新書《科學健康時代》。
更正與説明肝活檢用於評估乙型和丙型肝炎的損傷程度,而非診斷病毒存在(需通過血液檢測)。本文早期版本錯誤地將活檢描述為"診斷乙型和丙型肝炎的金標準"。(4月11日修正)