火山引擎放大招：發佈豆包1.5深度思考模型，還有Agent隱藏彩蛋_風聞

智谷趋势-智谷趋势官方账号-新中产的首席财富顾问。微信500强。昨天 22:08

2025-04-21

模型能力，始終是第一位的。

這是過去幾個月，大模型產業界得出的經驗。

在模型能力沒有代差的時候，新穎功能、流量傳播，都能讓一款AI產品迅速走紅、拿到融資、坐上牌桌；而技術徹底突破後，大家發現沒有護城河，用户也沒有忠誠度——人們會毫不留情拋棄舊產品，轉向更前沿的技術。

2025年春節，DeepSeek意外性的爆紅，掀翻了大模型格局。

而中國的科技大廠，在經過最初衝擊後，很多調整了戰略：

阿里的重心，轉向「阿里雲+Qwen模型」，馬雲多次現身站台；騰訊擁抱DeepSeek，並開放微信等國民應用，推動騰訊元寶、混元模型的進度；百度一反常態，轉向開源、免費開放文心，並把核心搜索業務接入DeepSeek-R1。

AI也已是字節最重要的業務和技術方向。

「豆包大模型+火山引擎」，是近幾年國內企業服務市場的最大變數，對模型能力、AI基建、產業生態全面猛攻。

4月17日，在「2025 火山引擎 Force Link AI 創新巡展」的杭州站活動，豆包1.5·深度思考模型正式發佈，視覺理解、文生圖系列模型升級，火山引擎也展示了AI應用開發、推理模型部署的最新產品。

在豆包大模型更新之後，業內發現4月將又是新一輪「神仙打架」。

OpenAI的正式版o3、DeepSeek-R2、Anthropic的Claude 4、馬斯克的Gork-3.5和阿里Qwen-3，預計都將在近期更新。

沒有人知道，AGI會在什麼時間點、以什麼形式到來，但是企業都不會錯過這場「變革」。在快速、低成本將大模型應用到業務和場景中，抓住新的機會。

只有主動成為變革者，才能看到變革到來。

此次豆包1.5·深度思考模型的發佈，先劃幾個重點：

· 主線版本Doubao-1.5-thinking-pro，性能超越DeepSeek-R1，接近OpenAI o3-mini-high和Gemini 2.5 pro

· 多模態版本的Doubao-1.5-thinking-pro|m，實現「視覺理解+深度思考」，可基於「圖像」推理思考

· 豆包1.5·深度思考大語言模型總參數為200B，成本、效率和延遲都顯著優化

具體來看，豆包1.5·深度思考大語言模型採用混合專家模型（MoE）架構，總參數量200B，實際激活參數僅有20B。

對比同性能的先進模型，DeepSeek-R1滿血版參數是671B，豆包在訓練和推理成本的優勢明顯，並且實現20毫秒的極低延遲。

從性能上看，該模型在數學、代碼、科學等權威基準測試中表現優秀。在AIME 2024 測試中獲得 86.7 分，Codeforces 評測達到 55.0 分，GPQA 測試達到 77.3 分，達到或接近全球第一梯隊水平。體現了模型在STEM、編程等專業領域推理能力的優越性。

提問部分截圖

回答部分截圖（有裁切）

這是一道難度較高的邏輯推理題目，豆包1.5·深度思考模型也輕鬆拿捏了。

豆包1.5·深度思考模型先深度思考了故事，理解和提煉其中關鍵信息，並對四個妖怪的情況逐一假設推理，囊括不同條件和可能性，通過自我反思、迭代，迅速推出正確答案。

除了推理任務，豆包1.5·深度思考模型也展示了顯著的泛化能力，在創意寫作、人文知識闡述等領域表現不俗，能勝任更廣泛、複雜的場景。

我們給出了這道題目：

夜深人靜，廚房裏空無一人。但對於廚房用具們來説，這正是它們進行深刻哲學思辨的時刻：一個飽經滄桑、慈祥睿智的舊鐵鍋。一個鋒利、思考生命意義的菜刀。一個信奉實用主義的冰箱。一個追求效率的微波爐。

請創作一個故事，讓他們展開一場有意思的對話或冒險

在回答中，我們注意到豆包1.5·深度思考模型包含了即時信息，並且有一個「隱藏彩蛋」。

從思考過程，我們能看到這並非單純的「聯網搜索」功能，而是「邊想邊搜」：先思考問題、進行多輪搜索、評估內容並迭代，最後才得出更全面、準確的回答。

目前，「邊想邊搜」在豆包app中已經上線，具備部分agent的特性，能處理自動規劃、決策等使用場景。

此次更新，豆包1.5·深度思考模型，還將視覺理解、多模態能力融入了深度思考。

這意味着，模型能夠像人類一樣，基於「看見」去聯想和思考，這極大拓寬了模型的使用場景，並能執行更復雜的任務。

在實際測試中，視覺理解+深度思考的表現，是驚豔的。

只通過一張航拍圖片，就推理出圖片拍攝的地點，「青海大柴旦翡翠湖」。

在推理過程中，豆包1.5·深度思考模型多模態版詳細識別並分析了湖泊的顏色、礦物的結晶、地貌、人類開發活動，這些圖片中的微小細節，並像偵探一樣展開推理。

我們用廣州、上海、深圳的一些航拍、景點圖片進行了測試，準確率相當高。

豆包1.5·深度思考模型多模態版可以看懂圖標，並結合深度思考後，就能執行較為複雜的企業級任務了。

比如根據項目流程圖，快速定位問題所在，給出精準、合理、可執行的操作建議。

目前，豆包1.5·深度思考模型已通過火山引擎開放API，供企業和開發者使用，也可以在火山方舟平台直接體驗。

此外，豆包·視覺理解模型也迎來升級，提升了視覺定位和視頻理解能力，企業可以基於這些能力打造更加有趣的商業化應用。

基於視頻理解能力，加上向量搜索，對家中的監控視頻進行語義搜索。比如，愛寵人士在家裏安裝了監控，接入AI後可以詢問AI寵物一天的活動情況。

豆包·文生圖模型升級到3.0，在最新的文生圖領域權威榜單 Artificial Analysis 競技場中，已超越業界諸多主流模型，排名全球第一梯隊。

此次更新，讓文字生成更精準、排版更美觀，大幅提升了人像生成真實感，並做到直出2K高清原圖。

大模型的衝擊，極大提升了中國企業對AI、數字化的認知，點燃了客户投入和應用新技術的熱情。

這改變了中國雲計算、企業服務市場的格局。

To B服務是一個先發優勢、規模效應明顯的行業。阿里雲、騰訊雲、華為雲先行耕耘十幾年，基礎設施、客户資源、政企關係的優勢根深蒂固。

字節旗下的火山引擎，入局時間雖然較晚，但全力抓住了大模型的東風。

2023年，OpenAI和ChatGPT的震撼，在國內掀起大模型開發潮，並迅速白熱化到「百模大戰」；微軟、亞馬遜、谷歌等海外雲廠商，迅速上線大模型服務，並將AI整合進自家的應用產品，進入了高速增長期。

當年6月，火山引擎打造了「火山方舟」大模型服務平台，提供一站式的大模型精調、推理、部署等服務。國內眾多知名大模型廠商，當時都跑在火山引擎上。

而進入2024年，「百模大戰」迅速終結，堅持自研大模型的廠商，收束到少數大廠和AI明星創企。

火山引擎預判了風向驟變：1.大模型的算力需求，從模型訓練轉向模型推理；2.大模型落地產業，企業客户的AI應用需求激增。

彼時，企業要用上大模型，仍是一件吃力不討好的事情，至少存在：開發難度大、模型不實用、AI幻覺、數據安全、人才和成本有限等諸多痛點。

在火山引擎看來，這需要提供更強的模型能力，並升級底層設施，為企業提供AI應用的開發平台和配套工具。

· 2024年2月，AI應用開發平台「釦子」上線，封裝各大模型API，方便開發者快速調用

· 2024年5月，發佈HiAgent平台，幫助企業快速開發AI應用和智能體

· 2024年5月，豆包大模型正式發佈，並大幅降低推理成本

至此，「豆包大模型+火山引擎」正式形成，成為雲和AI市場的新鋭。

火山引擎的核心策略，正是：「更強模型、更低成本、更易落地」。

在模型方面，豆包大模型家族，已包含通用模型、深度思考、語音識別、文生圖等全模態模型。

在成本上，豆包主力模型在去年5月定價僅為僅0.0008元/千Tokens，比行業價格低99.3%。

火山引擎總裁譚待表示，豆包大模型通過技術優化降低成本，定價有合理毛利，從不賠錢換市場。

這也符合大模型提效降本的規律，阿里雲、百度的大模型都跟隨降價，B端模型價格進入“釐”時代。根據李飛飛團隊發佈的《2025人工智能指數報告》，過去2年大模型推理成本下降了280倍，這讓AI加速融入生產生活，企業對AI的採用率，從2023年的55%上升到2024年的78%。

2024年12月，豆包視覺理解模型的定價0.003元/千Tokens，比行業價格低85%；2025年1月，豆包大模型1.5全系產品提質不加價，推理成本的優化，讓毛利率提升到50%。

他們要證明，通過模型技術、工程能力、軟硬件結合，可以降低模型成本——讓AI變得高效、經濟和易獲取。

今年，行業聚焦的重點已經轉向AI Agent，火山引擎也帶來了Agent開發平台和相關工具：

· OS Agent，將構建Agent的解決方案直接開放給客户，助力企業和個人打造專屬的通用Agent

· UI-TARS，一款打造通用智能體的大模型，已上線火山方舟平台

· AI雲原生·ServingKit推理套件，幫助企業快速部署高性能、低成本的推理服務，大幅降低GPU消耗

在現場，火山引擎展示了OS Agent跨場景的通用能力，可以直接操作瀏覽器、手機、工具和其他AI完成任務。

比如，直接操作剪映做剪輯，用瀏覽器搜索商品比較iPhone價格。

在AI基建層面，火山引擎認為，下一個十年是「AI雲原生」時代。

從「以GPU為核心」到「以模型為核心」，提供新一代計算、網絡、存儲產品，包括新一代GPU實例、vRDMA網絡連接、EIC彈性急速緩存等服務，打造更穩定、高高性能、安全的AI基建。

據浙商證券，2025年，字節開支翻倍至1600億，其中AI算力採購預算900億，還有700億用於數據中心建設和配套硬件。

從底層算力到上層應用，從全模態模型到開發平台，火山引擎的全棧AI 服務，讓企業開發AI應用變得更加簡單，加速AI應用落地進程。

事實也證明，火山引擎的策略是對的。

在去年12月，豆包大模型的日均Tokens調用量已達4萬億；截至今年3月底，日均調用量已經超過12.7萬億。從去年豆包剛發佈時計算，在不到一年時間裏，豆包大模型調用了增長了106倍。

這條增長曲線，與中國雲市場的走勢不謀而合。

據IDC數據，6月到12月，中國公有云大模型調用量增長到了日均9522億Tokens，半年增長近10倍。

IDC分析稱，這主要得益於大模型能力的快速提升，以及模型調用降價策略。

2024年，中國公有云大模型調用量達到114.2萬億Tokens。

其中，火山引擎以46.4%的市場份額，位居中國市場第一，之後是百度智能雲（19.3%）和阿里雲（19.3%）。

可以説，火山引擎憑藉「更強模型、更低成本、更易落地」的優勢，將自己嵌入了AI應用在中國普及的進程裏。

火山引擎已經在金融、汽車、消費、智能終端、電商、教育等行業落地，覆蓋幾乎所有主流應用場景。

目前，火山引擎已合作80%的汽車品牌，提供汽車雲、智能座艙等服務，並與一汽紅旗、東風、吉利、長城等24家車企成立「汽車大模型生態聯盟」。

在智能終端行業，火山引擎已和小米、OPPO、vivo、榮耀、聯想、三星、華碩等廠商合作，覆蓋超4億個終端設備。

從長遠來看，「豆包大模型+火山引擎」的崛起，展現了字節在技術、產品、生態的綜合實力。

豆包1.5·深度思考的發佈，視覺、語音等全模態模型，如此全面的佈局，滿足不同行業和場景的需求，使火山引擎成為助力更多企業探索AGI的夥伴。

火山引擎證明通過技術和工程優化，可以在降本增效、AI普及的同時，完成商業閉環，擴大在中國B端企業市場的影響力。

在服務中國企業的過程裏，火山引擎除了提供AI和算力，也將字節發展中積累的增長方法、技術能力和應用工具全部開放。把先進方法論落地成企業的體驗創新、數據驅動、敏捷迭代等數字化能力，實現業務增長。

同時，火山引擎在實踐中面對高難度、更復雜的企業級場景，也在反哺經驗倒推產品和模型能力提升。

而面向未來，火山引擎總裁譚待表示，「目前大模型的應用還只能摘一些低垂的果實」。

在2025年，他們希望讓更多人用好大模型，同時「做真正複雜的Agent」，用大模型幫助人類做更長時間的任務。

譚待表示，「如果説2024年是中國AI應用的元年，那2025年極有可能是AI Agent應用的元年。」