騰訊發佈自研推理模型混元T1 性能比肩DeepSeek | 聯合早報
zaobao
(北京/香港綜合訊)中國科技巨頭騰訊推出自研人工智能(AI)模型混元T1,性能比肩深度求索(DeepSeek)模型,但價格更便宜,反映中國AI競爭日益激烈。
騰訊混元星期五(3月21日)在微信公眾號説,混元T1是騰訊自研的強推理模型,特點是吐字快、能秒回,擅長超長文處理,且摘要幻覺低。
騰訊介紹,混元T1的吐字速度是每秒60至80 tokens(處理文本的最小單元),遠快於DeepSeek-R1模型。由於R1在生成答案前,需進行深度思考,並列出思維鏈,因此存在回應速度慢的短板。
綜合測試結果,混元T1在邏輯推理能力優於R1和OpenAI的o1,但在數學和代碼能力測試中劣於R1。
混元T1沿用了騰訊2月底發佈的混元Turbo S架構,這有助降低訓練和推理成本。但騰訊沒有披露模型的參數量級,尚不清楚該模型使用了多少數據訓練。
延伸閲讀
[DeepSeek為中國經濟注入強心針 扭轉投資敍事
](https://www.bdggg.com/2025/zaobao/news_2025_03_21_747292)
人工智能領域萬馬奔騰 李開復預計最終勝出只是少數
目前混元T1已在騰訊雲官網上線,輸入價格為每百萬tokens 1元(人民幣,下同,0.2新元),輸出價格為每百萬tokens 4元,價格是R1的四分之一。
DeepSeek今年1月底發佈低成本高效能的R1開源模型後,不少中國科技大廠紛紛跟進推出開源模型,如阿里巴巴的通義千問QwQ-32B、字節跳動的豆包等。
這些企業都通過進一步壓縮訓練成本、提高訓練效率,最終向客户提供更便宜的服務,讓模型競爭日益激烈。
中國AI專家、零一萬物創始人李開復星期五(3月21日)接受《南華早報》專訪時表示,該公司已將所有賭注押在DeepSeek上。
他説,R1模型推出後,許多中國軟硬件廠商紛紛將服務與該模型對接,其公司如此押注的理由也是顯而易見。
成立於2023年的零一萬物是最早關注大語言模型的獨角獸企業之一,該公司原從事模型開發,但在R1模型推出後,轉而為企業部署DeepSeek模型提供解決方案。
李開復坦言,在DeepSeek等開源替代方案的衝擊下,初創企業已難以證明開發昂貴模型的必要性。