火山引擎放大招:發佈豆包1.5深度思考模型,還有Agent隱藏彩蛋_風聞
智谷趋势-智谷趋势官方账号-新中产的首席财富顾问。微信500强。昨天 22:08
模型能力,始終是第一位的。
這是過去幾個月,大模型產業界得出的經驗。
在模型能力沒有代差的時候,新穎功能、流量傳播,都能讓一款AI產品迅速走紅、拿到融資、坐上牌桌;而技術徹底突破後,大家發現沒有護城河,用户也沒有忠誠度——人們會毫不留情拋棄舊產品,轉向更前沿的技術。
2025年春節,DeepSeek意外性的爆紅,掀翻了大模型格局。
而中國的科技大廠,在經過最初衝擊後,很多調整了戰略:
阿里的重心,轉向「阿里雲+Qwen模型」,馬雲多次現身站台;騰訊擁抱DeepSeek,並開放微信等國民應用,推動騰訊元寶、混元模型的進度;百度一反常態,轉向開源、免費開放文心,並把核心搜索業務接入DeepSeek-R1。
AI也已是字節最重要的業務和技術方向。
「豆包大模型+火山引擎」,是近幾年國內企業服務市場的最大變數,對模型能力、AI基建、產業生態全面猛攻。
4月17日,在「2025 火山引擎 Force Link AI 創新巡展」的杭州站活動,豆包1.5·深度思考模型正式發佈,視覺理解、文生圖系列模型升級,火山引擎也展示了AI應用開發、推理模型部署的最新產品。
在豆包大模型更新之後,業內發現4月將又是新一輪「神仙打架」。
OpenAI的正式版o3、DeepSeek-R2、Anthropic的Claude 4、馬斯克的Gork-3.5和阿里Qwen-3,預計都將在近期更新。
沒有人知道,AGI會在什麼時間點、以什麼形式到來,但是企業都不會錯過這場「變革」。在快速、低成本將大模型應用到業務和場景中,抓住新的機會。
只有主動成為變革者,才能看到變革到來。
01
此次豆包1.5·深度思考模型的發佈,先劃幾個重點:
· 主線版本Doubao-1.5-thinking-pro,性能超越DeepSeek-R1,接近OpenAI o3-mini-high和Gemini 2.5 pro
· 多模態版本的Doubao-1.5-thinking-pro|m,實現「視覺理解+深度思考」,可基於「圖像」推理思考
· 豆包1.5·深度思考大語言模型總參數為200B,成本、效率和延遲都顯著優化

具體來看,豆包1.5·深度思考大語言模型採用混合專家模型(MoE)架構,總參數量200B,實際激活參數僅有20B。
對比同性能的先進模型,DeepSeek-R1滿血版參數是671B,豆包在訓練和推理成本的優勢明顯,並且實現20毫秒的極低延遲。
從性能上看,該模型在數學、代碼、科學等權威基準測試中表現優秀。在AIME 2024 測試中獲得 86.7 分,Codeforces 評測達到 55.0 分,GPQA 測試達到 77.3 分,達到或接近全球第一梯隊水平。體現了模型在STEM、編程等專業領域推理能力的優越性。

提問部分截圖

回答部分截圖(有裁切)
這是一道難度較高的邏輯推理題目,豆包1.5·深度思考模型也輕鬆拿捏了。
豆包1.5·深度思考模型先深度思考了故事,理解和提煉其中關鍵信息,並對四個妖怪的情況逐一假設推理,囊括不同條件和可能性,通過自我反思、迭代,迅速推出正確答案。
除了推理任務,豆包1.5·深度思考模型也展示了顯著的泛化能力,在創意寫作、人文知識闡述等領域表現不俗,能勝任更廣泛、複雜的場景。
我們給出了這道題目:
夜深人靜,廚房裏空無一人。但對於廚房用具們來説,這正是它們進行深刻哲學思辨的時刻:一個飽經滄桑、慈祥睿智的舊鐵鍋。一個鋒利、思考生命意義的菜刀。一個信奉實用主義的冰箱。一個追求效率的微波爐。
請創作一個故事,讓他們展開一場有意思的對話或冒險

在回答中,我們注意到豆包1.5·深度思考模型包含了即時信息,並且有一個「隱藏彩蛋」。
從思考過程,我們能看到這並非單純的「聯網搜索」功能,而是「邊想邊搜」:先思考問題、進行多輪搜索、評估內容並迭代,最後才得出更全面、準確的回答。



目前,「邊想邊搜」在豆包app中已經上線,具備部分agent的特性,能處理自動規劃、決策等使用場景。
此次更新,豆包1.5·深度思考模型,還將視覺理解、多模態能力融入了深度思考。
這意味着,模型能夠像人類一樣,基於「看見」去聯想和思考,這極大拓寬了模型的使用場景,並能執行更復雜的任務。
在實際測試中,視覺理解+深度思考的表現,是驚豔的。
只通過一張航拍圖片,就推理出圖片拍攝的地點,「青海大柴旦翡翠湖」。

在推理過程中,豆包1.5·深度思考模型多模態版詳細識別並分析了湖泊的顏色、礦物的結晶、地貌、人類開發活動,這些圖片中的微小細節,並像偵探一樣展開推理。
我們用廣州、上海、深圳的一些航拍、景點圖片進行了測試,準確率相當高。



豆包1.5·深度思考模型多模態版可以看懂圖標,並結合深度思考後,就能執行較為複雜的企業級任務了。
比如根據項目流程圖,快速定位問題所在,給出精準、合理、可執行的操作建議。
目前,豆包1.5·深度思考模型已通過火山引擎開放API,供企業和開發者使用,也可以在火山方舟平台直接體驗。
此外,豆包·視覺理解模型也迎來升級,提升了視覺定位和視頻理解能力,企業可以基於這些能力打造更加有趣的商業化應用。
基於視頻理解能力,加上向量搜索,對家中的監控視頻進行語義搜索。比如,愛寵人士在家裏安裝了監控,接入AI後可以詢問AI寵物一天的活動情況。

豆包·文生圖模型升級到3.0,在最新的文生圖領域權威榜單 Artificial Analysis 競技場中,已超越業界諸多主流模型,排名全球第一梯隊。

此次更新,讓文字生成更精準、排版更美觀,大幅提升了人像生成真實感,並做到直出2K高清原圖。
02
大模型的衝擊,極大提升了中國企業對AI、數字化的認知,點燃了客户投入和應用新技術的熱情。
這改變了中國雲計算、企業服務市場的格局。
To B服務是一個先發優勢、規模效應明顯的行業。阿里雲、騰訊雲、華為雲先行耕耘十幾年,基礎設施、客户資源、政企關係的優勢根深蒂固。
字節旗下的火山引擎,入局時間雖然較晚,但全力抓住了大模型的東風。
2023年,OpenAI和ChatGPT的震撼,在國內掀起大模型開發潮,並迅速白熱化到「百模大戰」;微軟、亞馬遜、谷歌等海外雲廠商,迅速上線大模型服務,並將AI整合進自家的應用產品,進入了高速增長期。
當年6月,火山引擎打造了「火山方舟」大模型服務平台,提供一站式的大模型精調、推理、部署等服務。國內眾多知名大模型廠商,當時都跑在火山引擎上。
而進入2024年,「百模大戰」迅速終結,堅持自研大模型的廠商,收束到少數大廠和AI明星創企。
火山引擎預判了風向驟變:1.大模型的算力需求,從模型訓練轉向模型推理;2.大模型落地產業,企業客户的AI應用需求激增。
彼時,企業要用上大模型,仍是一件吃力不討好的事情,至少存在:開發難度大、模型不實用、AI幻覺、數據安全、人才和成本有限等諸多痛點。
在火山引擎看來,這需要提供更強的模型能力,並升級底層設施,為企業提供AI應用的開發平台和配套工具。
· 2024年2月,AI應用開發平台「釦子」上線,封裝各大模型API,方便開發者快速調用
· 2024年5月,發佈HiAgent平台,幫助企業快速開發AI應用和智能體
· 2024年5月,豆包大模型正式發佈,並大幅降低推理成本
至此,「豆包大模型+火山引擎」正式形成,成為雲和AI市場的新鋭。
火山引擎的核心策略,正是:「更強模型、更低成本、更易落地」。
在模型方面,豆包大模型家族,已包含通用模型、深度思考、語音識別、文生圖等全模態模型。
在成本上,豆包主力模型在去年5月定價僅為僅0.0008元/千Tokens,比行業價格低99.3%。
火山引擎總裁譚待表示,豆包大模型通過技術優化降低成本,定價有合理毛利,從不賠錢換市場。
這也符合大模型提效降本的規律,阿里雲、百度的大模型都跟隨降價,B端模型價格進入“釐”時代。根據李飛飛團隊發佈的《2025人工智能指數報告》,過去2年大模型推理成本下降了280倍,這讓AI加速融入生產生活,企業對AI的採用率,從2023年的55%上升到2024年的78%。
2024年12月,豆包視覺理解模型的定價0.003元/千Tokens,比行業價格低85%;2025年1月,豆包大模型1.5全系產品提質不加價,推理成本的優化,讓毛利率提升到50%。
他們要證明,通過模型技術、工程能力、軟硬件結合,可以降低模型成本——讓AI變得高效、經濟和易獲取。
今年,行業聚焦的重點已經轉向AI Agent,火山引擎也帶來了Agent開發平台和相關工具:
· OS Agent,將構建Agent的解決方案直接開放給客户,助力企業和個人打造專屬的通用Agent
· UI-TARS,一款打造通用智能體的大模型,已上線火山方舟平台
· AI雲原生·ServingKit推理套件,幫助企業快速部署高性能、低成本的推理服務,大幅降低GPU消耗
在現場,火山引擎展示了OS Agent跨場景的通用能力,可以直接操作瀏覽器、手機、工具和其他AI完成任務。
比如,直接操作剪映做剪輯,用瀏覽器搜索商品比較iPhone價格。
在AI基建層面,火山引擎認為,下一個十年是「AI雲原生」時代。
從「以GPU為核心」到「以模型為核心」,提供新一代計算、網絡、存儲產品,包括新一代GPU實例、vRDMA網絡連接、EIC彈性急速緩存等服務,打造更穩定、高高性能、安全的AI基建。
據浙商證券,2025年,字節開支翻倍至1600億,其中AI算力採購預算900億,還有700億用於數據中心建設和配套硬件。
從底層算力到上層應用,從全模態模型到開發平台,火山引擎的全棧AI 服務,讓企業開發AI應用變得更加簡單,加速AI應用落地進程。
03
事實也證明,火山引擎的策略是對的。
在去年12月,豆包大模型的日均Tokens調用量已達4萬億;截至今年3月底,日均調用量已經超過12.7萬億。從去年豆包剛發佈時計算,在不到一年時間裏,豆包大模型調用了增長了106倍。

這條增長曲線,與中國雲市場的走勢不謀而合。

據IDC數據,6月到12月,中國公有云大模型調用量增長到了日均9522億Tokens,半年增長近10倍。
IDC分析稱,這主要得益於大模型能力的快速提升,以及模型調用降價策略。
2024年,中國公有云大模型調用量達到114.2萬億Tokens。
其中,火山引擎以46.4%的市場份額,位居中國市場第一,之後是百度智能雲(19.3%)和阿里雲(19.3%)。

可以説,火山引擎憑藉「更強模型、更低成本、更易落地」的優勢,將自己嵌入了AI應用在中國普及的進程裏。
火山引擎已經在金融、汽車、消費、智能終端、電商、教育等行業落地,覆蓋幾乎所有主流應用場景。
目前,火山引擎已合作80%的汽車品牌,提供汽車雲、智能座艙等服務,並與一汽紅旗、東風、吉利、長城等24家車企成立「汽車大模型生態聯盟」。
在智能終端行業,火山引擎已和小米、OPPO、vivo、榮耀、聯想、三星、華碩等廠商合作,覆蓋超4億個終端設備。
從長遠來看,「豆包大模型+火山引擎」的崛起,展現了字節在技術、產品、生態的綜合實力。
豆包1.5·深度思考的發佈,視覺、語音等全模態模型,如此全面的佈局,滿足不同行業和場景的需求,使火山引擎成為助力更多企業探索AGI的夥伴。
火山引擎證明通過技術和工程優化,可以在降本增效、AI普及的同時,完成商業閉環,擴大在中國B端企業市場的影響力。
在服務中國企業的過程裏,火山引擎除了提供AI和算力,也將字節發展中積累的增長方法、技術能力和應用工具全部開放。把先進方法論落地成企業的體驗創新、數據驅動、敏捷迭代等數字化能力,實現業務增長。
同時,火山引擎在實踐中面對高難度、更復雜的企業級場景,也在反哺經驗倒推產品和模型能力提升。
而面向未來,火山引擎總裁譚待表示,「目前大模型的應用還只能摘一些低垂的果實」。
在2025年,他們希望讓更多人用好大模型,同時「做真正複雜的Agent」,用大模型幫助人類做更長時間的任務。
譚待表示,「如果説2024年是中國AI應用的元年,那2025年極有可能是AI Agent應用的元年。」