騰訊發佈新模型稱輸出速度比DeepSeek快 | 聯合早報

zaobao

2025-02-28

中國科技巨頭騰訊發佈一款快思考模型，並稱其輸出答案的速度比深度求索（DeepSeek）的R1模型快。

綜合證券時報網、彭博社和《21世紀經濟報道》報道，騰訊星期四（2月27日）正式發佈新一代基座模型混元Turbo S。

騰訊混元團隊介紹，區別於DeepSeek-R1、混元T1等需要“想一下再回答”的慢思考模型，混元Turbo S能夠實現“秒回”，更快速輸出答案，吐字速度提升一倍，首字時延降低44%。

團隊指出，混元Turbo S通過在架構上採用Hybrid-Mamba-Transformer融合模式，降低了訓練和推理成本，部署成本隨之大幅下降，“持續推動大模型應用門檻降低”。

在定價方面，混元Turbo S輸入價格為每百萬tokens0.8元（人民幣，下同，0.15新元），輸出價格為百萬tokens2元，相比前代混元Turbo模型價格下降數倍。

延伸閲讀

阿里發佈下一代推理模型與DeepSeek等競爭騰訊還分享了數據，顯示混元Turbo S在常用的人工智能（AI）測試中與DeepSeek的V3模型具有競爭力。

團隊説，通過長短思維鏈融合，混元TurboS在保持文科類問題快思考體驗的同時，基於自研混元T1慢思考模型合成的長思維鏈數據，顯著改進了理科推理能力，實現模型整體性能明顯提升。

DeepSeek上個月發佈的AI大模型DeepSeek-R1，憑藉低成本和高性能在全球引起廣泛關注，也重振了人們對中國科技公司創新能力的信心。

中國科技巨頭阿里巴巴旗下通義千問（Qwen）團隊本週也發佈最新推理模型深度思考（QwQ）預覽版，可能與OpenAI和DeepSeek等行業領先對手競爭，讓全球AI競賽進一步升温。