AI醫生來了,靠譜嗎?_風聞
医学界-医学界官方账号-为你提供可靠、有价值的内容是我们的存在方式。09-07 18:35
AI可以成為人人可享的高水平健康助手。
撰文 | 文 慧
責編丨汪 航
“AI發現了我的檢查結果異常,並根據症狀變化,敦促我去了急診,救了我的命。”
今年初,知名科技論壇“Hacker News”首頁發佈了這樣一則真實案例。一名患者用親身經歷表示,“這正是我們希望AI做的事情——幫助早期發現病症。”
生病了,問AI,已成為一種普遍現象。越來越多的人選擇將症狀、檢查報告等信息傳遞給AI,等待其生成相應的建議,再據此決定下一步行動。
對此,學界雖持積極態度,但也有隱憂。NEJM AI近期發佈的來自麻省理工學院媒體實驗室(MIT Media Lab)團隊的研究指出,人們存在過度信任AI的問題——即使其生成的醫療建議準確度較低,仍會覺得滿意,並傾向於聽從。
在關乎生命健康的事情上,如何充分發揮AI能力的同時降低風險?
業內普遍認為,可行的解決方案是讓醫生等專業人士參與構建“安全底線”,用垂直精準的醫療專業型AI代替通用型AI,為用户提供更加科學、相對可靠的醫療建議。
改變就醫的AI,正在被過度信任?
“咳嗽吃什麼有效?”“心慌頭暈可能是什麼病?”“BI-RADS 4級代表什麼?”就醫前先問問AI,已成為全球趨勢。
NEJM AI的主編、哈佛醫學院生物醫學信息學系主任Isaac Kohane教授曾撰文表示,“無論是出於絕望、失望還是好奇,已有大量患者開始藉助AI獲取醫療建議,包括二次診斷意見,有時甚至取得了顯著的治療效果。”
Bethany Crystal是受益者之一。她因身體不適前往全科醫生處就診,並接受了全面的身體檢查。
然而,回家後,她的不適感加劇,皮膚上出現了紅色小斑點。她將症狀拍照上傳至AI系統諮詢,經過多次追問,AI建議她前往醫院進行血液檢查。當她將此前做的檢查報告上傳後,AI提醒她血小板計數偏低,並強烈建議她立即前往急診就醫。
就診後,Bethany Crystal寫下了自己的經歷,“當我缺乏做出明智決策的背景信息時,是AI幫助拼湊了足夠的細節,讓我意識到了情況的緊迫性。”
像她這樣的故事不勝枚舉。一名患者在常規洗牙一週後出現右側面部劇烈疼痛和下垂,AI提示其可能是誘發了面部帶狀皰疹。最終,患者前往醫院接受了相關治療,不僅有效緩解疼痛,還降低了疼痛性神經病變的發生風險。
AI,可以讓患者隨時隨地獲取寶貴的健康信息,但情況並非全然樂觀。
Annals of Internal Medicine(《內科學年鑑》)於8月在臨牀案例版塊報道了一則“有趣”的案例:一名患者為避免攝入過量食用鹽,試圖在飲食中摒棄氯化鈉。在諮詢某知名通用型AI後,誤信其建議,改用溴化鈉替代。三個月後,患者出現明顯的溴中毒症狀。
採信AI給出的錯誤醫療建議可能會導致不良後果,那人們能分辨出AI回覆是對還是錯嗎?
今年5月,NEJM AI發表了一項全面評估非專業人士如何感知AI生成的醫療建議的研究,共招募了300名普通公眾作為參與者,他們分別就高準確度的AI回覆、低準確度的AI回覆和醫生撰寫的回覆作出評價。
結果顯示,面對三種答案,參與者無法辨識其間的質量差異。在可理解性、可信性、有效性、完整性/滿意度等方面,高準確度的AI回覆都顯著高於醫生撰寫的答案,而即使是準確度較低的AI生成回覆,在所有評估指標上的表現均與醫生回覆相當,甚至有所優勝。
“這顯示即便AI生成的答案中包含不準確的信息,信任與滿意可能會使參與者接受有害或無效的醫療建議。”研究對此表達了擔憂。
值得信任的醫療AI長什麼樣?
上述研究還顯示,當回覆明確標註為“由醫生提供”時,會獲得更高的信任度。
此外,專家監督對最大限度發揮AI能力並降低風險至關重要。研究稱,AI在用於提供醫療建議時,應與醫療專業人員合作,建立醫生參與AI生成信息傳遞的機制。
相較於通用型AI,越來越多的醫療專業型AI意識到這一點,正不斷加大與醫院及醫生的合作力度,構建更為可靠的醫療大模型。
以螞蟻集團的AI健康管家“AQ”為例,其在螞蟻醫療大模型的基礎上,學習了權威教材、醫典藥典、權威醫學文獻等巨量的專業醫療資料,並有上千名專業醫學人士、專家進行標註修正。
AQ專科智能體則更為垂直深入,聯合了全國10餘所頂級三甲醫院組成專業顧問團,3名院士領銜300餘位名醫,在智能體中開通了AI分身,進行了大量臨牀經驗、標準化病歷等訓練。
北京友誼醫院消化內科團隊給AI模型輸入了大量專科文獻,還針對科室臨牀經驗進行了模型加訓;
上海仁濟醫院泌尿外科從醫院選取了2000個標準化病歷用於訓練AI,涵蓋98%常見泌尿系統疾病類別;
浙江大學醫學院附屬第二醫院“Jack安心智能體”學習了王建安院士瓣膜病團隊精選審核的心臟瓣膜病權威知識庫,針對300餘種典型臨牀瓣膜病問題,醫生團隊對模型輸出進行有針對性的標註與修正……
在皮膚病學領域,領銜者是我國皮膚與真菌病領域頂級專家——中國工程院院士廖萬清教授。
他説,“在我的專業領域——醫學真菌病學中,培養鏡檢是診斷金標準,卻異常耗時費力,且依賴經驗。如今,AQ深度學習模型在識別各種真菌方面展現出令人矚目的效率與準確性。”

AQ的皮膚識別功能
只需要10秒,AQ就能對皮膚症狀進行智能解析與精準評估。用户上傳皮膚病灶照片,即可獲得免費的識別服務和專業的治療建議。據瞭解,目前,這一功能可以識別痤瘡、濕疹、火癤子、蕁麻疹、汗皰疹、銀屑病、白癜風等50種常見皮膚疾病。
如有疑問,可以在AI診室或是選擇“醫生分身”進行免費健康諮詢,結合多輪問答技術和支持千億參數視覺語言識別的多模態能力,AI也可以“像醫生一樣”進行追問,閲讀檢查結果。
面對這樣的場景,AQ表現出了足夠審慎的態度。
“對依據不足的、不確定的,不給出明確回答。”北京友誼醫院消化內科陳奕均醫生表示,科室醫生曾通過“信息誤導測試”,對AQ智能體進行了檢驗。
回覆後,AQ會標註並非診療意見,如果有進一步需要,應建議及時就醫,以醫生的意見為準。而當用户有就診需求時,AQ連接的超5000家公立醫院、近百萬醫生服務資源也可讓用户及時找到專業支持,從虛擬走向真實。
在醫療健康領域,AI能做的越來越多
作為“健康管家”,除了交互式的問診諮詢,AQ還在進一步拓展邊界,提供的服務超過100項。
面對檢查檢驗報告裏專業的名詞、複雜的指標、看不懂的影像,非專業人士往往一頭霧水:這是什麼意思?上上下下的箭頭到底有多危險?哪裏是正常器官哪裏是病灶?
在AQ的“報告解讀”功能中,用户只需拍攝一張照片或上傳文件資料,即可由AQ進行報告解讀。
該功能不僅支持分析單次報告的結果,還能對多份報告進行對比分析,解讀準確率高達90%以上。此外,AQ還能為諮詢者生成信息重點和健康提醒,幫助用户更有效地“對症”解決問題。

AQ還為用户建立了健康檔案。用户授權後,可以在AQ記錄各項健康數據,AQ會根據資料提供個性化的服務。例如:
“運動健康”可根據用户的身體狀況量身定製運動方案,如有膝蓋損傷不宜跑跳,三高患者運動要和緩且長期堅持;
“飲食健康”則可拍照記錄飲食情況,並結合體重基數、疾病史等因素,提供個性化的飲食方案;
“就醫資料夾”能夠統一管理所有過往的就醫材料,只需上傳或拍照,即可通過OCR智能識別錄入,便於醫生查閲,同時支持添加家庭成員信息;
“用藥計劃”可提醒用藥,確保按時按量服藥。AI智能識別藥盒功能還能幫助建立家庭小藥箱,從此不必再擔心説明書丟失或看不懂説明書。
通過健康檔案,有家族病史的用户可以針對性地進行預防;睡眠、體重等數據不理想的用户可以調整生活習慣;慢性病患者可以監控各項指標變化,管理病情;需要治療的患者可以打造專屬的“就醫助手”……
如此,讓自己成為自身健康的第一責任人,將是一件既簡單又輕鬆的事情。
8月26日,國務院印發了《關於深入實施“人工智能+”行動的意見》,提出“探索推廣人人可享的高水平居民健康助手,有序推動人工智能在輔助診療、健康管理、醫保服務等場景的應用,大幅提高基層醫療健康服務能力和效率。”
在2個月前的AQ應用發佈會上,螞蟻集團副總裁張俊傑曾表示,AQ在AI時代扮演的角色,就是要實現醫療服務更近、城鄉差距更小、健康管理更貼心。
輔助診療、健康管理、醫保服務等場景的應用,都已在AQ實現了真正意義上的串聯。隨着進一步的開放共建,AQ的健康服務將走向更智能、更便捷、更高質、更普惠。
參考資料:
1.https://hardmodefirst.xyz/chatgpt-saved-my-life-no,-seriously,-im-writing-this-from-the-er
2.Audrey Eichenberger, Stephen Thielke, Adam Van Buskirk.A Case of Bromism Influenced by Use of Artificial Intelligence. AIM Clinical Cases.2025;4:e241260. [Epub 5 August 2025]. doi:10.7326/aimcc.2024.1260
3.Pataranutaporn, P., Sarabu, C., Cecchi, G. A., & Maes, P. (2024). People overtrust AI-generated medical advice despite low accuracy. NEJM AI, 1(3), AIoa2300015. https://doi.org/10.1056/AIoa2300015