靠賣藥賺不到錢後,AI公司終於認真思考醫療行業了_風聞
知危-知危官方账号-19分钟前
在中國,醫療 AI 主要有三種類型:醫療影像、醫學基因編譯以及智慧診療。
對於智慧診療類型,許多公司都有較強的互聯網醫療基因,比如京東健康、阿里健康、平安好醫生等。過去多年來,這類公司主要依靠互聯網賣藥模式盈利。
在疫情期間,互聯網賣藥營收全面大增。但如今這個市場已成紅海,同質化競爭嚴重,由疫情特殊時期帶來的營收機會也早已消失,相關公司在這方面的收入都進入了瓶頸期。
那麼,智慧診療公司今後將如何構建新的競爭優勢?
這回,競爭要素終於聚焦到了 AI 上。
近年來國家也密集出台政策推動智慧診療的發展,比如2024年11月,國家醫保局將AI輔助診斷技術納入醫療服務價格項目立項指南。
為深入瞭解智慧診療公司如何在 AI 上建立新的優勢,知危編輯部和京東健康智能算法部負責人、京東健康探索研究院首席科學家王國鑫進行了對話。
京東健康自 2014 年開始運營,以線上醫藥零售業務為基礎,並擴展到在線診療,近年基於 AI 技術開發了一系列 AI 診療助手產品。
在王國鑫看來,用 AI 去解決醫療的業務問題,是一個很自然的選擇,“ 醫療和別的行業相比並沒有更加特殊,只要是人工智能跟行業結合,都會有巨大的想象力,以及面臨現實中逐步演進的漫長過程。”
但 ChatGPT 的出現確實帶來了全新的機會,“ ChatGPT 不僅是優秀的技術,也是優秀的產品,根本在於改變了人和機器的交互模式,實現了從鼠標到觸摸屏再到自然語言、圖像、聲音的飛躍。”
而 DeepSeek 的發佈對中國醫療 AI 也有很大的推動作用,“ DeepSeek 的意義在於,中國人的 AI 技術終於達到了國際認可的接近全球最領先的水平。而且 AI 還沒有面臨智能牆的限制,還能繼續提升。DeepSeek 這樣的國產優秀團隊,極大地刺激了各行各業對於中國技術團隊的認知,以及國家對於 AI 領域的技術戰略的投入,當然,醫療行業也不例外。”
從互聯網賣藥到智慧診療,這樣的模式變遷是一種質的變化,因為這意味着醫療 AI 企業要實際與醫院一起參與到患者的診療過程中,因此要做出好的醫療 AI 產品,必須對醫療行業本身有非常深刻的理解。
王國鑫向知危介紹道,“ 醫療、法律、金融是人類專家參與最多,交互最頻繁、信息密度最大的三個重要行業。一些行業更強調 AI 的半自動化或全自動化,比如交通、物流、電廠、製造業、農業等,但 AI 醫療需要人類和機器的共同配合。”
“ 這也是醫療、法律、金融這三個行業率先應用大模型或者大模型更適用的原因。具體而言,判斷一個行業是否適用大模型,以及應用大模型具有高價值,就看是不是有高知識密度,專家型人才聚集,以及高服務成本。”
醫療行業的高服務成本體現在必須有龐大機構作為支付方,“ 我們國家對大部分國民提供了醫保兜底,今天如果一個患者需要看專家,絕大部分醫院都能提供半小時以內到位的醫療服務,這在另一個國家是不可能的。”
而且,相比法律、金融,醫療行業還有其特殊性和複雜性,“ 醫療行業幾乎是人類所有職業中,細分程度最高,規則最複雜,出錯後果最嚴重的行業。所以醫療 AI 商業化中最大的困難,就在於它解決的是人類生命健康上的問題,這也是幾乎所有複雜性的來源。”
但醫療行業存在一個不可能三角,即可及性、成本和質量不能同時擁有,“ 比如我們的醫療總體上是普惠化的,但如果今天想看一個超級牛的專家,一般來説就需要支付很高的成本,這個成本支付的是佔用專家的時間,這個時間如此寶貴源於培養高水平專家需要付出的巨大成本。”
因此,結合醫療本身的行業特點和中國醫療現狀,構成了獨特的發展驅動力,“ 像我們這麼大的國家,無論是醫療成本問題、衞生經濟學問題、地區差異問題,都導致對通過使用類人服務來提升整個醫療行業、醫院、患者的體驗,和降低成本上,有巨大的動力。”
具體到 AI 層面,就是利用 AI 技術吸收全國頂級醫院、頂級醫生的醫療知識和技術,降低服務成本,從而普及到各級醫院中去,以惠及全國所有患者。
要實現這種普惠化,並考慮到數據安全性,私有化部署大模型是一種可行的路徑。據瞭解,目前國內已有近百家醫院完成 DeepSeek 本地化部署,主要為知名大型三甲醫院,比如復旦大學附屬華山醫院、深圳大學附屬華南醫院等,本地化部署主要是為了支持臨牀決策、病歷質控、影像分析、科研輔助、醫院管理等場景應用。
但這種方式本身並不夠普惠,私有化部署成本比雲服務高得多,滿血版 DeepSeek 一體機價格基本都是百萬級別,不是普通醫院負擔得起的,這還不算實際運行中產生的運維和人力成本。
王國鑫解釋道,“ 是不是所有醫院都具備訓練醫療模型的能力,能夠支付招聘優秀工程師的成本,並具備足夠優質的訓練數據,是存在疑問的。實際上,在中國,大部分專病療法相關 AI 課題都需要多中心的聯合訓練。多中心就是大量的優秀的醫院聯合在一起研發。所以我很懷疑是否所有單個醫院都有足夠的能力去做這件事。所以醫療大模型的研發,需要像我們這樣的垂域領域企業同步支持多家醫院,來推動大型課題研發,以解決數據共通性的問題。”
但要實現多中心聯合訓練,最核心的難題是醫療數據共享,技術層面的難題比如數據標準、數據質量等都還是其次,根本還是在於權利上,“ 這裏面涉及到數據確權的問題,目前醫療數據的特點是權利不清晰,我們並不知道它屬於患者、醫院或科室,甚至廠商。比如説一個患者今天做 X 光檢查,影像是不是屬於廠商並沒有確定的答案。有政策面的問題,也有敏感性的問題,人們對於關乎切身利益的東西都是極其關注的。所以任何醫療數據的共享,都是重要的法律和倫理問題。”
那麼,如何推動這個問題的解決呢?
王國鑫表示:“ 從政策方面看,過去幾年國家一直在研究數據要素流通。我們的優勢是能集中力量幹大事,所以數據要素流通的研究其實是全國性的。北京如今也有很多先行試點,推動醫院進行脱敏數據的資產化,只不過目前案例還比較少。從過去幾年我們工作的實際情況來看,總體還是走課題加科研轉化。”
“ 比如説我們可以跟醫院進行聯合課題的申報,在一個單獨課題的情況下,可以進行脱敏科研數據的一定程度的共享,當然這不涉及到數據的轉移,更多是以更合規數據處理的方式來進行,比如説就在院內完成模型的訓練。理論上,醫院不可能把醫療數據轉移給任何一家公司。”
“ 所以,對於第三方而言,醫療數據的使用只能是點對點的。坦誠地説,這其實阻礙了純技術的發展。但醫療領域的特殊性就在於,我們不能完全用一個純技術發展的視角來看待人類倫理的問題。”
因此,王國鑫認為,要解決醫療數據資源難題,一方面需要推動醫療數據的資產化,另一方面醫療 AI 公司必須要做好未來廣泛依賴合成數據的準備,以及更好地挖掘醫療現有開放數據的準備,“ 比如,其實有很多疾病案例數據是存在於醫療論文之中的,它們可開放獲取,而且不涉及到敏感信息。我們可以基於這些數據進一步模擬醫生或者患者的情況,從而產生更高價值的數據。”
在近期發表的論文 “ Citrus: Leveraging Expert Cognitive Pathways in a Medical Language Model for Advanced Medical Decision Support ” 中,王國鑫的團隊就提出了這樣的方法。( 注:Citrus 指京東健康的醫療大模型京醫千詢 )

https://arxiv.org/pdf/2502.18274
論文中提到,醫學專業知識是通過臨牀實踐培養獲取的,臨牀實踐需要高度複雜的醫學推理技能,涵蓋患者諮詢、診斷、鑑別診斷和治療等。
因此,用於智慧診療的醫學語言模型要想成功地輔助臨牀決策,不僅要處理海量醫療數據,還要模擬專業醫療人員複雜的認知過程。
臨牀實踐中的醫學推理涉及兩種推理方法:“ 模式識別法 ” 和 “ 假設-演繹法 ”。前者基於臨牀觀察和經驗總結來發現模式,更加直觀,後者根據已知的醫學理論,基於症狀組合來確定疾病。
模式識別能力通常接觸大規模、高質量的醫學數據集學習得到,假設-演繹推理能力則需要通過合成的思維鏈數據訓練得到,思維鏈數據通過模擬專家的推理過程獲得。
模型生成推理思維鏈的過程如下,對一個推理起點和多個診斷終點,其能夠生成大量的備選思維鏈,並結合外部知識保證診斷能力:
模型列出現有臨牀信息,作為推理的起點。
基於現有信息,提出可能的診斷,作為推理的終點。
進行正向推理,建立從起點到終點的邏輯路徑。
使用另一個模型評估推理的有效性。
重複步驟 3-4,模型將嘗試建立更多不同的邏輯路徑。最後對可能的診斷進行排序,確定是否可以做出診斷。
如果做出診斷,則輸出結果並結束推理。
如果無法做出診斷,則返回步驟 1,並嘗試請求外部知識以收集更多信息。
該方法在多個開源基礎模型中,在各種醫學基準測試中實現了顯著的性能提升。Citrus 模型( 京醫千詢 )及其訓練數據都已經開源。
王國鑫再次強調,“ 所有做醫療 AI 或者做行業AI 的團隊,都需要有這樣的覺悟,就是在未來漫長的幾年裏,需要有不同的模型團隊來廣泛地合成類真實數據,從而進一步降低對患者數據、醫院數據或行業數據的使用。這是一個很重要的方向,我們也在持續探索。”
在獲取合成數據的好處時,也要面臨相應的風險,比如它可能讓生成的多樣性不夠,甚至讓模型退化或訓練直接崩潰。
Nature 曾經發表一篇封面論文《 AI models collapse when trained on recursively generated data 》,表明隨着大模型循環用自己生成的數據訓練自身,到最後模型會完全偏離原來的數據分佈,要麼生成內容範圍很狹窄,要麼乾脆在胡言亂語。

圖源:Nature volume 631, pages755–759 (2024)
王國鑫認為,合成數據導致模型退化這是有可能的,但合成數據這條路仍然必須走下去。
“ 我們當然希望數據的多樣性很強,真實性又很高,但在醫療領域這不現實。舉一個醫療影像的例子,如果只在北京做醫療影像,那就幾乎沒有南方患者的影像數據。人和動物都有很強的地域性特徵,包括身體狀況、疾病甚至影像表現等。”
但正如之前提到的,得到多中心的具有廣泛代表意義的數據是醫療 AI 領域中最難、最痛苦的部分。
“ 合成數據確實存在造成模型退化的可能,因為需要從一個強模型或者通過強化學習的方式不斷去合成新數據。那麼這批數據的應用或者監控,就變得比較困難。其實基於強化學習的範式,不斷地推動數據合成,應該是能夠把模型的水平再抬高一定水平的,然後再配合一部分真實數據進行校準。”
相比痛苦地尋找真實數據,這個方法的效率高得多。
“ 強化學習跟監督學習相比最大的特點,就是它具有一定的數據探索能力。只是強化學習需要很好的環境設置,從而讓它的探索方向更能被評估。比如 DeepSeek-R1-Zero 就是完全基於強化學習的,它讓模型通過自由的探索找到正確的發展路徑。未來在很多端到端的智能體研究都會走這個方向。這其實很像 AlphaGo 的發展過程,AlphaGo 後期的版本 AlphaZero 是不需要棋譜的,而是靠兩個 AlphaGo 的智能體不斷的下國際象棋、圍棋和日本將棋,從而從零提升模型能力的。當然,強化學習本身的難點也不少,探索很容易,但是訓練方法、獎勵模型設計、超參數都是比較難調試的,訓練也不太穩定。”
王國鑫補充道,除了真實數據、數據合成,其它數據獲取方法還包括真實數據的改寫等。
醫療數據除了難獲取,其領域知識上的特點即細分性和動態性,也帶來了另一個層面的難題。
王國鑫表示,“ 醫療行業的細分程度非常高。即便是從患者的角度來看,目前去任何醫院,對患者來説最大的難題就是掛什麼科室的號。常用的疾病編碼少説得有一兩千個,而且不同的專科醫院、不同的專家所擅長的疾病差異很大。每一個疾病或每一個專科背後,都有一個巨大的學術機構來支撐,有很多優秀的專家甚至院士對其進行研究。”
“ 並且,醫療也是一個快速發展中的行業,人類今天對於很多疾病其實還沒有形成正確的認識,比如最受關注的腫瘤疾病。所以,醫療AI不僅僅是對過去知識的學習,而是持續學習、持續應用的。縱觀整個生物學、基因學、生化組學、製藥學的發展,其實它們的發展速度並不比 AI、計算機技術慢,尤其在美國這樣的高成本醫療的社會。AI 甚至還增大了醫療的發展速度,比如最近獲得諾貝爾生理學獎的就是 AlphaFold。”
“ 甚至,作為醫生其職業生涯是很漫長的,需要持續學習。在這個過程中,大模型也需要深度參與進來,這屬於 AI 醫療教育的問題。”
“ 最後,包括數學推理、代碼推理等推理模型都有一個特點,就是它有正確答案。我可以通過問題-正確答案配對的方式不斷地校正模型,但坦誠地講,醫療領域的一大特點就是開放性,很多問題不見得真的有正確答案。患者同樣的症狀可能指向多種不同的疾病。”
綜上,知識密度高,專家型人才聚集,隱私屬性強,細分程度高,知識更新快,以及開放性或不確定性,這幾個特點闡釋了醫療大模型落地時面臨的主要困難,“ 這導致在落地醫療大模型時,我們希望AI能夠做到既通用又專用,但這是非常困難的。”
“ 所以,醫療大模型不能僅僅是在某些通用基準上刷了榜單,拿到好成績就行了。更重要的是能夠逐步地掌握回答專科專病甚至重大專科專病問題的能力。同時,醫療大模型還要能跟上知識的快速更新。”
對於模型本身而言,由於醫療必須是專家決策,或者説所有決策必須有專家認可,那麼醫療大模型就需要有比較強的可解釋性,“ 我不認為純黑盒的醫療大模型在醫療領域有任何應用價值,這也是和很多行業所不同的地方。”
“ 對於醫療領域,很長的一段時間內,通用大模型是比不上垂域大模型的。當然通用大模型所沉澱的訓練方法以及優秀經驗,垂域大模型也需要快速吸收。通用大模型探索的是 AGI,而醫療大模型探索的是如何讓具體醫療場景符合醫療規範的問題。”
“ 其實,隨着模型越做越深,向專病發展的時候,也能自然地推動和擁有這類核心數據的醫院進行科研合作。”
但直接適應醫療的碎片化特點去獨立地逐個落地 AI,則是不夠經濟的做法,也不適合這一代的AI。“ 數據稀缺、信息個體化是個長期存在的問題,需要解決如何像人類醫生那樣快速地進行小數據學習( 比如 In-context Learning ),並實現強推理能力。比如 Figure AI 機器人公司,據稱其 Helix 模型的第一個場景在寶馬公司訓練了 12 個月,但第二個場景只用 30 天就做出來了。對於醫療 AI,也希望能實現類似的路徑,利用沉澱的經驗或者説預訓練、遷移學習去越來越快地攻破越來越多的醫療細分領域。”
“ 所以,合成數據、知識更新、預訓練,這三條路對於醫療大模型是必然的,通用數據領域中存在的很多花裏胡哨的技巧,在行業 AI 面前都沒什麼用。”
通過克服上述各個難題,並攻破所有醫療細分領域,就能實現醫療大模型的 ChatGPT 時刻嗎?醫療大模型最終能夠取代人類醫生嗎?
王國鑫表示,“ ChatGPT 沒有取代人類,它是一個交互式的模型。醫療大模型的 ChatGPT 時刻也不是其在某種程度上替代了醫生。而是在很剛性的醫療場景下, AI 和醫生共同服務患者,形成標準化的服務,甚至能夠寫到指南里。所以醫療大模型落地的方向應該是,一方面對患者的健康管理有更廣泛普適的服務模式,比如隨時隨地的醫療健康諮詢或個人健康助手。
“ 這個需求實際上並不只是醫療問題,而是源於人們內心對健康的焦慮。你可以看到,互聯網上充斥着多種不同的醫療 ‘ 權威 ’,就源於這種焦慮,但大眾很難判斷這些信息的真實性。雖然大模型也有幻覺,但一個普適的醫療大模型一定是沒有商業化利益且能提供最安全的醫療服務。”
“ 最後,在所有醫院的實踐環節中,都需要持續地去探索哪些環節可以利用 AI 帶來效率提升,以及對最終的醫療服務是否帶來增益。如果在這個過程中,患者受益,醫生、醫院的成本也降低,那麼就應該把它進一步的推向指南,甚至推向醫療管理的要求。對於這多方面的要求的滿足即流程效率提升、服務增益、成本降低等,電子病歷就是很好的例子。”
“ 換個角度來説,醫療大模型的 ChatGPT 時刻無非就是在醫療服務的這幾個方面有旗艦型產品出現。”
最後,王國鑫向知危介紹了京東健康如何踐行上述理念。
京東健康從 2017 年開始,就開始做互聯網醫療,如今每天有 49 萬人在京東健康完成線上問診,“ 要達成這一成就,沒有 AI 就實現不了,在這個過程中我們也積累了大量數據。”
就在近日,京東健康還將醫療大模型 “ 京醫千詢 ” 升級為 2.0 版本,重點提升了 AI 輔助重大專科專病診療的能力。傳統 AI 依賴靜態數據,而 “ 京醫千詢 ” 2.0 強調臨牀診斷的動態推理,避免過度羅列所有可能性,利用患者數據結合循證數據庫和臨牀案例庫,直接給出有效的答案,提高了臨牀實用性。目前,“ 京醫千詢 ” 2.0 已經能針對惡性腫瘤、心腦血管等疾病為臨牀醫生提供個性化診療建議。
“ 只靠 AI 也無法解決問題,我們還必須要依靠供應鏈,比如説我們合作的醫院、藥店、服務機構,用京東的話講叫實物供應鏈和服務供應鏈。否則它和其它互聯網產品沒有什麼區別。”
“ 所以,我們認為京東健康是在互聯網醫療領域或者健康領域掌握的實體機構和細分領域最多的一個公司。醫療 AI 的商業化才剛剛開始。與其講護城河,不如講跑得快不快。護城河是防守思維,AI 競爭拼的是進攻思維。比如到現在很難講 OpenAI 的護城河是什麼,Claude、Google 甚至 DeepSeek 離 OpenAI 並不遙遠,所以在 AI 這個領域到最後拼的是持久力和快速迭代的能力。在醫療行業競爭拼的則是戰略定位、資源投入和對行業的理解。”
對任何做行業大模型的公司,行業理解都是永遠不可忽視的,“ 對於做醫療 AI 的公司,有些偏向技術,有些偏向行業。對於前者,在國內是很珍貴的力量,目前還是太少了。只是重技術的可能更希望快速商業化,這在醫療行業是很困難的。但不管是哪種傾向,哪怕是競爭關係,我們也希望能夠共同去推進醫療 AI 的發展。”
外部環境的變化,讓王國鑫看到醫療 AI 正重啓快速發展的腳步,“ 目前最大的變化,其實是在於醫院、醫生、專家對人工智能的認識上。相較於之前的保守態度,如今這個羣體對於 AI 的引入持更加開放的態度,對於我們是一個很大的鼓舞,畢竟我們和醫療行業是需要共同研發和推進醫療 AI 的。當然,這個變化必然是由國家自上而下的政策導向和推進才能實現。”
“ 用實在的話來説,每一個人,包括我,也都希望到老的那一天,可以得到更加體面、有尊嚴的醫療服務。”