百川智能首個全場景深度思考模型Baichuan-M1-preview發佈

2025-01-24

【環球網科技綜合報道】1月24日，百川智能發佈了首個全場景深度思考模型Baichuan-M1-preview。該模型同時具備語言、視覺和搜索三大領域推理能力的模型。另外，它還解鎖了醫療循證模式，實現了從醫療證據檢索到深度推理的完整端到端服務，能夠快速、精準地回答醫療臨牀、科研問題。

據悉，Baichuan-M1-preview現已在百小應中正式上線。

為了更好地繁榮AI醫療生態，助力醫療事業發展，百川智能還同時推出了首個開源醫療增強大模型Baichuan-M1-14B。作為一個全場景深度思考模型，Baichuan-M1-preview的能力全面，具備強大的語言推理、視覺推理及搜索推理能力。

據介紹，Baichuan-M1-preview的另一大亮點是解鎖了醫療循證模式。在面對複雜醫學問題時，會將專業可靠的醫療知識作為推理依據，幫助用户作出醫療決策。

為實現這一能力，百川智能自建了涵蓋億級條目的循證醫學知識庫，囊括了國內外海量醫學論文、權威指南、專家共識、疾病與症狀解析、藥品説明等專業醫療內容，且以天為單位進行動態更新，及時收錄醫療領域的新突破、新進展。

通過“醫療循證模式”，Baichuan-M1-preview實現了從證據檢索到深度推理的完整端到端服務，能夠有效地解決醫療場景中信息過載、不確定性和碎片化等痛點。

此外，為了推動AI技術在醫療領域的創新發展，增強AI醫療技術的透明度和可信性，提高醫療服務的可及性，繁榮AI醫療生態，百川智能還開源了Baichuan-M1-preview的小尺寸版模型Baichuan-M1-14B。

為了提升Baichuan-M1-14B的醫療能力，百川智能多管齊下：數據構建方面，面向細分醫療場景，收集了萬億級 token 的嚴肅醫療數據，涵蓋了千萬級的中/英文專業醫療論文、院內真實中/英文醫療病例，億級的醫療問答、醫療問診、臨牀數據等，還對全網數據進行了包括醫療科室、醫療內容以及醫療價值在內的分類評估，確保模型能學習到有價值且全面的醫療知識。

在此基礎上，百川智能還針對病例、醫學教材、醫學指南等不同類別的高質量醫療數據生成了超千億 token 的多樣化數據，包含了醫療複雜決策推理鏈條、決策依據以及問答對等多樣化形式。這些合成數據擁有豐富的知識呈現形式以及與醫生一致的思維過程，進一步強化了Baichuan-M1-14B的醫學知識能力和醫療推理能力。

進入到模型訓練階段，百川智能運用首創的多階段領域提升方案，將整個訓練過程分為通識提升、醫療基礎知識提升、醫療進階知識提升三個階段，依次提升模型的基礎語言、高階及疑難病症應對等能力。此外還在 CoT 訓練框架中創新的引入了ELO強化學習法，優化思維鏈路徑，避免傳統獎勵模型偏差，提升了模型的生成質量與邏輯推理能力。（青雲）