大模型之家2025年1月熱力榜:深度推理成關鍵,算力革命開啓新徵程_風聞
大模型之家-带您探索人工智能领域的重磅资讯、解码热点话题3小时前

隨着2025年的開啓,全球人工智能行業又迎來了一個關鍵的里程碑時刻。深度推理已然成為大模型發展的新風尚。過去,大模型更多側重於數據的堆砌和簡單的模式識別,雖能在一定程度上滿足基礎應用需求,但在面對複雜問題時常常捉襟見肘。如今,隨着行業對模型智能水平要求的不斷提高,深度推理能力已成為衡量大模型優劣的關鍵指標。
在這一科技浪潮湧動的時期,大模型 “拼多多” DeepSeek R1系列模型的橫空出世,無疑成為了行業內一顆璀璨的新星。這一發布,不僅打破了以往AI發展進程中的諸多常規認知,更開啓了一個全新的AI時代。**AI的 “aha 時刻” 在這一刻驚豔登場,意味着我們在人工智能的探索之路上邁出了具有突破性意義的一步。**同時,R1系列模型僅需更少的算力需求就能實現與OpenAI o1系列模型同等的效果,這一成果猶如一顆重磅炸彈,在全球AI行業中激起了千層浪,吸引了無數從業者、研究者以及投資者的目光,預示着AI技術在普及和應用層面將迎來一次重大的飛躍。
在《2025年1月大模型熱力榜》中,共收錄了220家大型模型及其所屬企業。其中,百度、360、智譜和商湯等人工智能企業持續領跑榜單。這些企業在AI技術研發、產品創新以及應用拓展等多個維度展現出了強大的實力與深厚的潛力,引領着行業的發展潮流,為人工智能的進步與普及貢獻着關鍵力量。

另一方面,來自深度求索的DeepSeek憑藉R1大模型強勢上榜。1月20日,DeepSeek正式發佈了DeepSeek-R1模型。該模型完全通過強化學習訓練,摒棄了傳統的監督微調方式。在性能上,DeepSeek-R1在數學、代碼和自然語言推理等任務上可媲美OpenAI o1正式版,在AIME 2024、MATH-500等主流評測集上得分與o1相近。同時,DeepSeek還開源了DeepSeek-R1-Zero和DeepSeek-R1兩個660B模型,並蒸餾了6個小模型。其API服務定價具有優勢,英偉達、亞馬遜、微軟等科技巨頭紛紛支持搭載或上線該模型,中國的天翼雲、秘塔AI等也積極應用,展示出其廣泛的影響力。
美國當地時間2025年1月6日,美國國防部將商湯加入“中國軍事企業清單”。商湯科技1月7日發表聲明稱此舉毫無事實依據,對此表示強烈反對。同時商湯方面還強調,該清單的主要影響是名單上實體公司不能成為美國國防部的供應商,對商湯業務沒有實質影響。公司將盡快就此事與各方積極溝通,以確保獲得公正的對待,並最大限度保護公司和股東的利益。
**1月15日,科大訊飛正式發佈深度推理模型X1。該模型是當前業界全國產算力平台上唯一的深度推理模型,中文數學能力對標OpenAI的o1模型。**據悉,X1模型將在訊飛AI學習機、數學教學助手、醫療等真實場景中率先應用,為用户提供更智能、便捷的服務體驗。
同日,**MiniMax發佈並開源了新一代01系列模型,包括基礎語言大模型MiniMax-Text-01和視覺多模態大模型MiniMax-VL-01。**該系列模型通過大規模應用線性注意力機制,打破了Transformer傳統架構的記憶瓶頸,能夠處理高達400萬token的輸入。這一輸入長度是GPT-4o的32倍,Claude-3.5-Sonnet的20倍,展現了其強大的處理能力。
**1月16日,阿里雲通義開源了全新的數學推理過程獎勵模型Qwen2.5-Math-PRM。**據悉,該模型的72B及7B尺寸版本在性能上均大幅超越了同類開源過程獎勵模型。尤其在識別推理錯誤步驟的能力上,Qwen2.5-Math-PRM以7B的小尺寸就成功超越了GPT-4o。此外,通義團隊還開源了首個步驟級的評估標準ProcessBench,這一標準填補了大模型推理過程錯誤評估的空白。
同日,**階躍星辰自研的推理模型Step Reasoner mini已正式上線。**作為Step系列模型家族的首個推理模型,Step Reasoner mini擅長主動規劃、嘗試和反思,通過慢思考和反覆驗證的邏輯機制,為用户提供準確可靠的回覆。該模型不僅擅長解決邏輯推理、代碼和數學等複雜問題,還具備文學創作等通用領域的能力。目前,階躍星辰自研的Step系列基座模型矩陣已全面覆蓋語言、多模態和推理等領域。
**1月20日,豆包即時語音大模型正式推出,並在豆包APP全量開放。**該模型是一款集語音理解和生成於一體的模型,實現了端到端的語音對話功能。相比傳統級聯模式,豆包即時語音大模型在語音表現力、控制力、情緒承接方面表現驚豔,同時具備低時延、對話中可隨時打斷等特性,併發布全新AI Coding產品Trae(trae.ai),實現從Copilot向Autopilot的演進。同日,商湯善惠宣佈完成數千萬元A輪融資,本輪融資由金沙江創投領投,微木資本、嘉實基金和金弘基金等知名資管平台和產業資本跟投,此次融資將重點投向零售AI算法研發創新、海外市場拓展戰略方向。
1月21日,由百度文庫和百度網盤聯合打造的AI創作新物種“自由畫布”開啓公測,百度副總裁,文庫事業部、網盤事業部負責人王穎透露,百度文庫AI功能MAU已突破9000萬,DAU年同比增長230%;付費用户超4000萬,位居全球第二、中國第一。
1月22日,字節旗下豆包大模型1.5正式發佈。據介紹全新 Doubao-1.5-pro 模型綜合能力顯著增強,在知識、代碼、推理、中文等多個權威測評基準上獲得最佳成績,綜合得分優於 GPT-4o、Claude 3.5 Sonnet 等業界一流模型,模型效果達到全球領先水平。
**1月24日,百川智能發佈了國內首個全場景深度思考模型Baichuan-M1-preview。**該模型是國內目前唯一同時具備語言、視覺和搜索三大領域推理能力的模型。在數學、代碼等多個權威評測中,Baichuan-M1-preview的表現均超越了o1-preview,展現了其在多領域推理方面的獨特優勢。此外,作為國內唯一專注醫療領域的頭部大模型公司推出的深度思考模型,它還解鎖了醫療循證模式,實現了從醫療證據檢索到深度推理的完整端到端服務,能夠快速、精準地回答醫療臨牀、科研問題。