《華爾街日報》：ChatGPT即將為您看診——醫生開始用AI回答患者問題

Nidhi Subbaraman

2023-04-28

每位醫生的醫療建議背後都藴含着豐富的知識，但很快，全國各地的患者可能會從另一個來源獲得建議：人工智能。

在加利福尼亞州和威斯康星州**，**OpenAI的“GPT”生成式人工智能正在閲讀患者信息並起草醫生的回覆。這項操作是一個試點項目的一部分，三個醫療系統正在測試人工智能是否能減少醫務人員回覆患者在線諮詢的時間。

加州大學聖地亞哥分校健康中心和威斯康星大學健康中心於四月開始測試該工具。斯坦福醫療保健計劃於下週初加入推廣。總共有大約二十多名醫療保健工作人員正在試用該工具。

加州大學聖地亞哥分校健康中心的首席醫生瑪琳·米倫正在協助領導人工智能測試，她已經在自己的收件箱中測試GPT約一週。她表示，早期人工智能生成的回覆需要大量編輯，她的團隊一直在努力改進回覆。他們還在添加一種“牀邊態度”：如果患者提到旅行歸來，草稿中可能會包括詢問他們旅途是否順利的一句話。“它提供了我們想要的人情味，”米倫博士説。

有初步數據表明，人工智能可以增加價值。根據週五發表在《JAMA內科學》雜誌上的一項研究，ChatGPT在回應患者在線發佈的查詢時得分高於真實醫生，該研究由一組醫生對帖子進行了盲評。

斯坦福醫療保健機構計劃很快加入AI項目的推廣行列。照片：《華爾街日報》的Ian Bates隨着許多行業將ChatGPT作為商業工具進行測試，醫院管理者和醫生們希望這種AI輔助能緩解員工倦怠問題，這是疫情期間激增的難題。根據美國醫學會的數據，在行政任務中，信息洪流和健康記錄管理是主要原因之一。

總部位於威斯康星州維羅納的Epic公司開發了“MyChart”工具，患者可通過該工具與醫療提供者溝通，其登錄次數從2020年第一季度的1.06億次激增至2023年第一季度的2.6億次。Epic的軟件使醫院能夠以電子方式存儲患者記錄。

本月早些時候，Epic和微軟宣佈，醫療系統將通過Epic的軟件和微軟的Azure雲服務獲得OpenAI的GPT技術。微軟已投資OpenAI，並正在其產品中集成人工智能工具。醫院正在試用GPT-3，這是驅動ChatGPT的大型語言模型的一個版本。

ChatGPT在回答醫學問題方面的能力令計算機科學家感到困惑——儘管它被指會編造信息——包括其能夠通過美國醫師執照考試。微軟AI平台企業副總裁埃裏克·博伊德表示，OpenAI的語言模型並未專門針對醫學數據集進行訓練，但在教會其識別模式的海量數據集中包含了醫學研究和醫學信息。

“與ChatGPT合作的醫生可能是最佳傳信者，“加州大學聖地亞哥分校計算流行病學家、《美國醫學會雜誌》研究報告作者之一約翰·艾爾斯表示。

米倫博士稱，這項AI試點讓部分醫護人員感到興奮。“醫生們已經精疲力竭，他們正在尋找任何希望的曙光。“米倫博士表示，該醫院系統的患者消息量從疫情前的每月5萬條激增至疫情後的每月超8萬條，在某些疫情月份甚至超過14萬條。

她表示，醫生及其團隊正疲於應對額外的工作負擔。“我的日程表上根本沒有空閒時間。我的團隊也非常忙碌。”

現在當米倫醫生點擊患者消息時，AI會立即顯示回覆草稿。Epic研發高級副總裁塞斯·海恩表示，AI會參考患者消息中的信息及其電子病歷生成回覆。他補充説，所有醫療數據都按照聯邦患者隱私保護法規進行保護。

加州大學聖地亞哥分校健康中心於四月開始測試一款人工智能工具。圖片來源：邁克·布萊克/路透社系統提供從草稿開始的選項——若內容無誤可直接編輯或發送原樣信息——亦可選擇空白回覆重新撰寫。AI在生成回覆時會參考患者病歷，例如提及他們正在服用的藥物或最近一次就診時間。“它幫助我們快速啓動，“她表示，這節省了調取患者檔案所需的數秒鐘時間。

目前聖地亞哥團隊已禁止AI回答任何涉及醫療建議的查詢。威斯康星大學健康中心首席信息官切羅·戈斯瓦米表示，威斯康星州的10名醫生同樣僅允許AI回覆有限類型的患者諮詢，包括處方申請和文件索取需求。

管理人員和醫生們表示，該工具可能帶來變革——但前提是它能有效運作。斯坦福醫療保健胃腸病學家帕特里夏·加西亞指出，若草稿需要過多事實核查、修改或耗費大量時間，醫生將失去信任。她所在團隊計劃下週開始試用GPT處理消息：“只有當它能簡化工作時，醫生們才會持續使用。”

據某醫生團隊研究顯示，用於該研究的ChatGPT版本在回答網絡醫療諮詢時表現顯著優於醫生。《美國醫學會內科雜誌》新研究中，作者們分析了Reddit論壇r/askDocs上的健康諮詢帖，該論壇由經認證的醫療從業者提供專業解答。

在這項研究中，作者從該論壇10月份發佈的帖子中提取了195個問題及醫生的回覆。隨後他們將這些問題輸入ChatGPT，並記錄下人工智能的答案。

由五位醫療專業人員組成的團隊，將AI回答與Reddit上醫生的回覆進行了質量和同理心評分。在不知道答案來源的情況下，評估者給ChatGPT回答打出"優秀"或"非常優秀"的比例是醫生回答的四倍。此外，僅有4.6%的醫生回答被評為"具有同理心"或"極具同理心”，而ChatGPT的這一比例達到45%，是醫生的十倍。

該研究的合著者、加州大學聖地亞哥分校健康中心首席數字官兼首席醫療官克里斯托弗·朗赫斯特表示，研究數據説服他嘗試引入AI試點。“現有研究表明這確實有效——那麼，讓我們看看能否將其轉化為實際應用。“他説。

聯繫記者尼迪·蘇巴拉曼請致信[email protected]

更正聲明早期版本的ChatGPT在回答網絡醫療諮詢方面優於醫生。本文先前版本錯誤表述為最新版ChatGPT表現更佳。（2023年4月28日修正）

本文發表於2023年4月29日印刷版，標題為《ChatGPT醫生為您看診》。