騰訊混元T1 AI推理模型在性能與價格上對標深度求索 | 南華早報

Coco Feng

2025-03-23

騰訊控股發佈了一款名為混元T1的新型人工智能（AI）推理模型，在性能與定價方面均對標深度求索公司的R1模型。這家中國科技巨頭於週五推出的最新產品採用大規模強化學習技術——深度求索在其1月發佈的R1推理模型中也運用了相同技術。

該版本是繼T1預覽版在其智能助手元寶上測試運行後推出的正式版。在評估模型知識儲備的大規模多任務語言理解（MMLU Pro）基準測試中，T1以87.2分的成績超越深度求索R1的84分，但略遜於OpenAI去年12月發佈的o1推理模型（89.3分）——後者正是ChatGPT開發商的成果。T1在其他基準測試中同樣表現優異：2024年美國數學邀請賽（AIME）測評獲得78.2分（R1為79.8分，o1為79.2分）。騰訊數據顯示，在中文能力方面，T1於C-Eval綜合評估中取得91.8分的優異成績，與R1持平，並優於o1的87.8分。

該模型在定價策略上也向深度求索看齊——後者正是這家明星中國初創企業的主要優勢所在。T1的輸入定價為每百萬tokens收費1元人民幣（約合0.14美元），輸出費用為每百萬tokens4元。其輸入費率與R1保持一致（日間每百萬tokens1元，夜間僅0.25元）；輸出定價也具可比性——R1日間輸出費率為每百萬tokens16元，夜間降至4元。

騰訊宣稱自己是業內首家採用谷歌Transformer與卡內基梅隆大學及普林斯頓大學聯合研發的Mamba混合架構的企業。這家中國科技巨頭表示，與純Transformer架構相比，該混合方案通過降低內存佔用"顯著減少了訓練和推理成本"。