支付寶進軍大模型醫療應用,技術一號位:我們有4個切入點_風聞
量子位-量子位官方账号-1小时前
白小交 發自 凹非寺
量子位 | 公眾號 QbitAI
大模型醫療應用還在早期,最大挑戰還是在數據的處理上,國內至少還需要兩到三年來解決;
創業公司還有機會,只要找到合適的切入點。這個行業只有撐死的,沒有餓死的。
面對來勢洶洶的大模型應用浪潮,支付寶醫療技術一號位魏鵬這樣説道。
今年,螞蟻大舉進軍醫療,已是再明顯不過。作為螞蟻大模型應用三大領域之一(其餘是金融與生活),落地進展顯得尤為矚目。
模型層面,支付寶醫療大模型,在中英文醫療考試、基準測試達到甚至超過GPT-4水準。
場景方面,他們先後聯合浙江衞健委、上海市第一人民醫院率先落地數字人應用。今年外灘大會上,支付寶正式推出AI健康管家,吸引了多地衞健委、三甲醫院以及專科專家等20餘個專業智能體首批入駐。

因此談大模型在醫療方面的應用,本身在領域內有十年深耕的螞蟻支付寶,一定是繞不開的玩家。
為此,我們同支付寶醫療技術一號位魏鵬,聊了聊當前大模型醫療應用的行業發展與技術挑戰。
核心觀點如下:
支付寶進軍醫療AI,主要有四個切入點:醫保問答、全科醫生、同院內服務的串聯、專科智能體;
大模型參數量在百億參數就夠,重點不在數量在質量。
在醫療領域,情感、道德和人文關懷是非常重要的。
AI在醫療領域的主要作用是提高效率,醫生的角色是不可替代的。
在不改變原意的基礎上,量子位做了如下整理。
對話支付寶醫療技術一號位1、支付寶進軍醫療,主要有四個切入點
量子位:現在大模型在醫療行業的應用很火也很熱,螞蟻進軍醫療,怎麼切入?
魏鵬:我們現在有四個切入點。
第一個就是醫保問答,類似於政策類諮詢。首先這跟支付寶APP契合度很高。
很多用户都其實在問一些政策類問題,那我們從實際用户需求出發。市面上的一些通用大模型產品,他們回答也比較泛泛,質量參差不齊。
當然這部分也得益於我們同醫保局的深入合作。醫保局他們也面臨着大量的客户諮詢需求,但很多政策解讀和相關文件並不公開或者很難檢索查找,有時還會涉及複雜圖表解讀。這些其實通過我們圖像解析、檢索增強等方面技術可以解決。
我們跟醫保局包括像一些問題生成、標註標準、評判標準等方面都建立了很深度的鏈接。目前我們在北上杭這塊準確率,基本上能做到百分之八九十,還在繼續優化中。
第二個是全科醫生。醫療領域面臨一個主要問題是,AI目前還無法替代專業醫生進行診斷。因此我們更多地將AI定位為輔助醫生的角色。
比如,當你去醫院時,可能不確定應該掛哪個科室的號,這時全科醫生就能提供幫助。你可以與全科醫生交流,提供一些基本信息,他們會根據你的症狀給出初步判斷,可能會建議你去神經科、消化科等特定科室。全科醫生會收集你的相關信息,並給出一些建議。對於慢性病患者,他們還會提供日常的健康建議,包括對一些健康指標的解讀。

這就是我們對全科醫生角色的定義。目前,我們的整體發展方向正是如此。
我們認為,AI在提供日常醫療科普、解讀檢驗報告和建議以及掃描藥品包裝瞭解藥物用途等方面具有潛力。例如,用户可以通過拍照識別藥物,瞭解其治療的疾病。
此外,我們還會根據用户的具體症狀,提供多輪問詢服務,並將信息彙總,以便轉交給專業問診平台。通過這種方式更精準地定位用户的需求,給到合適的醫生那裏進行診斷。
這樣的流程不僅節省了時間,也提高了效率。
量子位:背後邏輯是什麼?
魏鵬:當前醫療應用這個階段,不僅僅單純是技術或產品問題,它其實還涉及到人文道德的層面。
從個人角度來看,患者通常更願意面對真人醫生進行診斷;從社會層面來看,它肯定是需要人來承擔這樣的責任。因此,醫生的角色是不可替代的。
AI在醫療領域的主要作用是提高效率。
實際上,醫生的大部分時間都花在了詢問病人問題上,而真正用於做出決策和治療的時間相對較短。尤其是對於那些資深醫生來説,他們更願意將時間投入到解決複雜和棘手的病例上。但醫生的時間是有限的,因此如何充分利用醫療資源是一個重要問題。在這一點上,AI可以發揮重要作用,通過處理重複性工作來提升效率。
2、大模型醫療應用還在早期,最大挑戰在數據
量子位:第三個切入點呢?
魏鵬:第三個是院內服務的串聯,這主要是為了提升醫療服務的效率。我們同浙江衞健委合作打造了數字人安診兒。這也是因為浙江數字化建設較為全面。所有醫院數據都能與衞健委打通,包括患者的報告/掛號記錄都能在系統中查到。
以安診兒作為樣板間,我們也繼續跟各個地方醫院進行對接合作:直接跟醫院信息系統(HIS)進行打通。
這需要制定一個標準,比如不同的接口標準,以及如何在醫院內實現AR導航、查看報告記錄、解讀報告等功能。此外,還包括掛號和排號通知等服務,目的是將整個就醫流程在醫院內落地。
量子位:挑戰在什麼地方?
魏鵬:挑戰之一是不同醫院的HIS系統開發水平參差不齊。有時候需要與醫院去做對接協調。一個HIS系統涉及多家研發機構。
所以這部分的挑戰,更多還是來源於ToB或者toH這種私有化定製的這個訴求。這並不是技術層面上的挑戰。
量子位:像安診兒這樣的標杆產品,以數字人為代表,會是這次大模型落地的技術必選項嗎?除此之外,還有必備的技術點位?
魏鵬:數字人無疑是未來發展的必然趨勢。此外,數字人的發展可能需要結合情感語音技術。我們正在努力攻克這方面的難題。在醫療領域,情感、道德和人文關懷是非常重要的。因此,數字人在提供服務時,不僅要技術先進,還要兼顧人文關懷,不能顯得冷漠無情。我們的目標是打造既有技術精度又有人文温度的數字人。
量子位:第四個切入點是什麼?
魏鵬:我們正在探索也是最難的一部分,就是專科智能體。AI能夠像專家一樣,或者專科資深醫生一樣,跟用户去交互。
目前還只是做了個開始。因為這部分涉及一些挑戰。
最主要的就是數據問題。試想一下,那種非常厲害的醫生平時太忙了。整個診斷過程不會很詳細很明確地寫出來,而像那些病歷、診療記錄往往也很潦草,數據無法很好地提取和利用。
如果沒有充分的數據,模型就很難學習。
我們同杭州有這方面意願的醫生一起去探索,包括像他們願意按照真正的質量標準,幫我們去改寫病例/住院記錄;還有像通過醫生口述的方式,共同將診斷過程通過知識圖譜(KG)的模式沉澱下來。

量子位:數據這塊,是不是整個行業應用最大的挑戰?
魏鵬:嗯對,對於AI這塊,數據其實是非常大挑戰。
比如像政策解讀,我們技術同學花很長時間去搞懂政策文件怎麼去接入。首先得搞懂裏面講的是什麼,然後找到合適的技術方案去做解析,比如是RAG、向量數據庫,還是知識圖譜?此外你還需要考慮如何處理數據塊,某些場景可能需要使用長文本上下文來全面解讀信息。
其次是醫療數據信息更加需要專業、權威、可信。我們之前發現了不少Badcase。比如有人問“懷孕幾周後可以墮胎”,模型錯誤地回答説兩週可以進行。後來我們調查發現,其實是有醫生在網上回答過這個問題。
這個案例讓我們意識到,很多時候數據不準確是導致模型回答錯誤的主要原因。這也導致我們模型訓練過程中標註成本非常高。
量子位:模型參數量,業內有沒有形成一個共識?
魏鵬:目前我是覺得百億參數,就像我們百靈現在65B,前面差不多72B這個量級。不過大語言模型在使用上,我個人覺得參數量不是問題,主要還是數據的質量。這個參數量應該能讓模型學到很多的支持。
包括現在業界主流也是認為現在公開數據基本上已經學完了,那怎麼去做?
像數據合成,核心還是解決模型的推理問題,可能在數學、代碼這部分能力會用得多一點。
但醫療這塊我覺得還處於數據的獲取/處理上,首先把公開“髒”數據清洗一下,還有看怎麼能夠把院內數據充分利用起來,充分清洗和改寫成模型能夠學習的。這些解決了之後才會考慮説怎麼去合成數據。
量子位:現在還處於早期的階段,大概什麼時候能解決這些問題。
魏鵬:國內可能需要一段時間,我覺得至少可能兩三年。這部分領域還是太專了,也很深。我們願意跟這個行業去做合作。
量子位:這個所定義的“深”指的是什麼呢?
魏鵬:首先要提高識別率,我們需要大量醫生的參與,尤其是那些能夠提供真實報告數據的醫生。醫生需要對數據進行精確標註,尤其是那些高難度的病例,比如癌症篩查的影像資料。普通的醫生可能難以識別出癌症的細微特徵,這就需要資深專家的介入。
為了積累這些數據,我們需要與醫院建立長期合作關係,因為每種疾病,比如一線治療,都需要多年數據的積累以及技術上的深入解讀。
這樣看來,要實現真正的普惠,我們還有很長的路要走。核心問題還是數據,我們需要與醫生和醫院建立更深的合作關係。
量子位:中醫方面的計劃呢?
魏鵬:這也是數據方面的問題。
因為在國內,中醫領域的數據相對來説是比較豐富和全面的。基於這樣的考慮,我們決定進入中醫這個領域,但目前我們也還是比較謹慎的。
從技術角度來看,中醫的理論體系可能相對於西醫來説沒有那麼明確,很多時候它的表述也更加模糊。因此,我們還在持續探索,試圖找到更好的方法。相關的語料庫正在擴充,需求也在增加,但如何能夠真正做好,我們的技術和產品團隊正在考慮如何構建評測集。
這兩方面的工作我認為還需要時間來逐步完善。正如我剛才提到的,這屬於專科類的範疇。
3、創業公司還是有機會,只有撐死沒有餓死,主要在找切入點
量子位:現在想進軍醫療的,你覺得他們還有機會嗎?
魏鵬:行業裏有句話:只有撐死的,沒有餓死的。找到一個好的切入口就行。
量子位:你覺得什麼樣特質的公司能笑到最後?
魏鵬:第一是長期主義,第二是目標核心,要去解決問題,能夠充分跟政府、醫院、ISV在內的整個生態建立好關係。比如像醫生端,他們是否能有動力去支持這件事情。
量子位:現在有沒有形成一個評測標準?
魏鵬:我們現在評測標準本身裏面有一些維度,比如像專業性、事實性、完整性、用户體感。
用户體感就是用户自己去標註,來判斷是不是像醫生來交流。
量子位:之前張亞勤提到這樣一個演變趨勢:信息智能——具身智能——生物智能,醫療有會不會經歷這樣的趨勢?
魏鵬:整體大方向肯定是往這個趨勢走,但關鍵還是得找到一個切入點,比如怎麼跟機器人去做結合,現在摸索更多的還是輔助手術/操作這種。
量子位:最後總結一下,區別於其他領域,大模型對於醫療是一個怎樣的變革?
魏鵬:首先,核心就是效率。之前也有類似的問答系統,但它背後主要基於決策樹,回答能力有限。但現在有大模型之後,整個效率也會更高一點。
第二,這個場景天然就涉及到多輪交互的需求。只要解決好這個需求,就能顯著提升整體體驗。很多小問題,AI就可以幫忙處理。比如一些政策性問題,無需親自去醫保部門去諮詢。這些實際上都是效率的顯著提升。
醫療資源本就稀缺,無論是過呢還是國外,只要能提高整體效率,對這個領域就已經是巨大的貢獻。
如果能在一個點上做到極致,就已經很好了。追求全面而不求精,我認為並不符合當前的場景和需求。