百川智能首個全場景深度思考模型Baichuan-M1-preview發佈
【環球網科技綜合報道】1月24日,百川智能發佈了首個全場景深度思考模型Baichuan-M1-preview。該模型同時具備語言、視覺和搜索三大領域推理能力的模型。另外,它還解鎖了醫療循證模式,實現了從醫療證據檢索到深度推理的完整端到端服務,能夠快速、精準地回答醫療臨牀、科研問題。
據悉,Baichuan-M1-preview現已在百小應中正式上線。
為了更好地繁榮AI醫療生態,助力醫療事業發展,百川智能還同時推出了首個開源醫療增強大模型Baichuan-M1-14B。作為一個全場景深度思考模型,Baichuan-M1-preview的能力全面,具備強大的語言推理、視覺推理及搜索推理能力。
據介紹,Baichuan-M1-preview的另一大亮點是解鎖了醫療循證模式。在面對複雜醫學問題時,會將專業可靠的醫療知識作為推理依據,幫助用户作出醫療決策。
為實現這一能力,百川智能自建了涵蓋億級條目的循證醫學知識庫,囊括了國內外海量醫學論文、權威指南、專家共識、疾病與症狀解析、藥品説明等專業醫療內容,且以天為單位進行動態更新,及時收錄醫療領域的新突破、新進展。
通過“醫療循證模式”,Baichuan-M1-preview實現了從證據檢索到深度推理的完整端到端服務,能夠有效地解決醫療場景中信息過載、不確定性和碎片化等痛點。
此外,為了推動AI技術在醫療領域的創新發展,增強AI醫療技術的透明度和可信性,提高醫療服務的可及性,繁榮AI醫療生態,百川智能還開源了Baichuan-M1-preview的小尺寸版模型Baichuan-M1-14B。
為了提升Baichuan-M1-14B的醫療能力,百川智能多管齊下:數據構建方面,面向細分醫療場景,收集了萬億級 token 的嚴肅醫療數據,涵蓋了千萬級的中/英文專業醫療論文、院內真實中/英文醫療病例,億級的醫療問答、醫療問診、臨牀數據等,還對全網數據進行了包括醫療科室、醫療內容以及醫療價值在內的分類評估,確保模型能學習到有價值且全面的醫療知識。
在此基礎上,百川智能還針對病例、醫學教材、醫學指南等不同類別的高質量醫療數據生成了超千億 token 的多樣化數據,包含了醫療複雜決策推理鏈條、決策依據以及問答對等多樣化形式。這些合成數據擁有豐富的知識呈現形式以及與醫生一致的思維過程,進一步強化了Baichuan-M1-14B的醫學知識能力和醫療推理能力。
進入到模型訓練階段,百川智能運用首創的多階段領域提升方案,將整個訓練過程分為通識提升、醫療基礎知識提升、醫療進階知識提升三個階段,依次提升模型的基礎語言、高階及疑難病症應對等能力。此外還在 CoT 訓練框架中創新的引入了ELO強化學習法,優化思維鏈路徑,避免傳統獎勵模型偏差,提升了模型的生成質量與邏輯推理能力。(青雲)