騰訊發佈新模型 稱輸出速度比DeepSeek快 | 聯合早報
zaobao
中國科技巨頭騰訊發佈一款快思考模型,並稱其輸出答案的速度比深度求索(DeepSeek)的R1模型快。
綜合證券時報網、彭博社和《21世紀經濟報道》報道,騰訊星期四(2月27日)正式發佈新一代基座模型混元Turbo S。
騰訊混元團隊介紹,區別於DeepSeek-R1、混元T1等需要“想一下再回答”的慢思考模型,混元Turbo S能夠實現“秒回”,更快速輸出答案,吐字速度提升一倍,首字時延降低44%。
團隊指出,混元Turbo S通過在架構上採用Hybrid-Mamba-Transformer融合模式,降低了訓練和推理成本,部署成本隨之大幅下降,“持續推動大模型應用門檻降低”。
在定價方面,混元Turbo S輸入價格為每百萬tokens0.8元(人民幣,下同,0.15新元),輸出價格為百萬tokens2元,相比前代混元Turbo模型價格下降數倍。
延伸閲讀
阿里發佈下一代推理模型 與DeepSeek等競爭 騰訊還分享了數據,顯示混元Turbo S在常用的人工智能(AI)測試中與DeepSeek的V3模型具有競爭力。
團隊説,通過長短思維鏈融合,混元TurboS在保持文科類問題快思考體驗的同時,基於自研混元T1慢思考模型合成的長思維鏈數據,顯著改進了理科推理能力,實現模型整體性能明顯提升。
DeepSeek上個月發佈的AI大模型DeepSeek-R1,憑藉低成本和高性能在全球引起廣泛關注,也重振了人們對中國科技公司創新能力的信心。
中國科技巨頭阿里巴巴旗下通義千問(Qwen)團隊本週也發佈最新推理模型深度思考(QwQ)預覽版,可能與OpenAI和DeepSeek等行業領先對手競爭,讓全球AI競賽進一步升温。