騰訊混元T1 AI推理模型在性能與價格上對標深度求索 | 南華早報
Coco Feng
騰訊控股發佈了一款名為混元T1的新型人工智能(AI)推理模型,在性能與定價方面均對標深度求索公司的R1模型。這家中國科技巨頭於週五推出的最新產品採用大規模強化學習技術——深度求索在其1月發佈的R1推理模型中也運用了相同技術。
該版本是繼T1預覽版在其智能助手元寶上測試運行後推出的正式版。在評估模型知識儲備的大規模多任務語言理解(MMLU Pro)基準測試中,T1以87.2分的成績超越深度求索R1的84分,但略遜於OpenAI去年12月發佈的o1推理模型(89.3分)——後者正是ChatGPT開發商的成果。T1在其他基準測試中同樣表現優異:2024年美國數學邀請賽(AIME)測評獲得78.2分(R1為79.8分,o1為79.2分)。騰訊數據顯示,在中文能力方面,T1於C-Eval綜合評估中取得91.8分的優異成績,與R1持平,並優於o1的87.8分。
該模型在定價策略上也向深度求索看齊——後者正是這家明星中國初創企業的主要優勢所在。T1的輸入定價為每百萬tokens收費1元人民幣(約合0.14美元),輸出費用為每百萬tokens4元。其輸入費率與R1保持一致(日間每百萬tokens1元,夜間僅0.25元);輸出定價也具可比性——R1日間輸出費率為每百萬tokens16元,夜間降至4元。
騰訊宣稱自己是業內首家採用谷歌Transformer與卡內基梅隆大學及普林斯頓大學聯合研發的Mamba混合架構的企業。這家中國科技巨頭表示,與純Transformer架構相比,該混合方案通過降低內存佔用"顯著減少了訓練和推理成本"。