火山引擎的“低姿態”,和“多雲多模型”的未來_風聞
深响-深响官方账号-全球视野,价值视角。07-03 13:44
©️深響原創 · 作者|何文
在爭辯中,在實踐中,大模型於國內的發展趨勢漸漸清晰。
相比幾個月前的“狂熱”,大模型入局者開始變得冷靜,落地產業已成共識。而在市場端,來自零售、金融、製造、政務等領域的客户也表現出了蓬勃且明確的需求,大模型被各界視為智能化升級的關鍵抓手。
此情此景下,基於供給側大模型持續迭代,大模型應用側正在迎來快速發展。客户也逐漸找到務實的應用之道,出於成本和具體場景的考慮,企業對大模型的應用往往是“多線並行”,有主力模型也有協助模型。這意味着行業需要千億參數的通用大模型,也需要百億、十億參數的模型。
這些趨勢共同説明的問題是:大模型要滲透到千行百業,需要有更多的模型提供方和需求方,需要一個繁榮的生態。
這樣的生態必然是多方努力的結果。而就在趨勢逐漸明晰的時候,火山引擎邁出了新的一步。
火山方舟,搭台做服務
6月28日,在2023火山引擎V-Tech體驗創新科技峯會上,火山引擎發佈了大模型服務平台“火山方舟”。這是一個連接着大模型供給方和需求方的服務平台。
**你可以把它理解為集合多家旗艦店的商城,客户可以在上面接觸優質的大模型,並基於火山方舟的功能,低門檻地應用大模型。**目前,MiniMax、智譜AI、復旦MOSS、百川智能、IDEA、瀾舟科技、出門問問等企業旗下的大模型已經“登陸”火山方舟。根據火山引擎方面的披露,火山方舟的首批邀測企業包括了金融、汽車、消費等眾多行業的客户。
火山引擎總裁譚待介紹“火山方舟”首批大模型合作伙伴
具體而言,火山方舟的重點功能分為模型廣場、模型精調、模型評測、模型推理、應用插件和運營幹預工具。每項功能都有它的針對性。
例如,供應方可以在模型廣場上進行模型的創建、上傳、部署,需求方則能看到模型效果並快捷體驗。熟悉大模型的人都會知道,要在實際場景裏應用大模型,基於自家數據的訓練和精調必不可少。火山方舟的模型精調簡化了這個步驟,客户只需選擇模型並上傳標註數據集即可完成精調。此外,客户也將在這個過程中建設和積累自己的精調數據集,形成自己寶貴的數據資產。
其他功能指向的同樣是大模型使用方的痛點。以模型評測為例,市面上有那麼多模型,客户會希望在購買服務前先做測評。簡而言之,火山方舟希望為大模型供需雙方“搭好台”,讓雙方能更專注地“做好自己的事”,更高效地觸及彼此。
火山引擎智能算法負責人吳迪介紹“安全互信計算”
為此,火山方舟上投入了自身的所有優勢和資源,比如充沛的算力、高速訓練模型、安全互信機制。為了推動企業搭上大模型快車,火山方舟還在“搭台”的同時,為企業提供更多服務支持。峯會上,北京銀行CIO龔偉華表示,北京銀行將與火山方舟合作,在算力優化、模型精調等方面展開研究,共同推動金融風控、營銷等模型應用落地。
無論是對於模型供給方,還是需求方,火山方舟都是一個標準的“服務平台”。這一定位相當特別,你很難用一個簡單的“支持方”或是“撮合者”來描述火山方舟。
該如何理解火山方舟的定位?一切都要回到一個最基本的問題:當前的大模型市場,到底需要什麼?
在有需要的地方,做擅長的事
在如何佈局大模型的問題上,目前許多公司都給出了答案。他們發佈了自研大模型,發佈了基於自身模型打造的模型平台,強調的是“來接入我們的模型”。相比之下,火山引擎似乎沒有想當“主角”的意思。
一方面,這次發佈的火山方舟是完全開放的,來自外部的優質大模型都能登陸平台,企業客户可以根據實際需要自由選擇模型。另一方面,火山方舟也不僅僅是賣算力或提供技術底座,它還深入到了和模型提供方、企業客户的合作中,幫着模型提供方降低訓練和推理的成本,幫着企業去做應用落地。
這些相對“低姿態”的動作,是火山引擎基於對行業的判斷做出的。在今年4月的“FORCE原動力”大會上,火山引擎總裁譚待表示,企業使用多家雲服務已成常態,同時各行業也都擁有自己的私有訓練語料,大模型會在千行百業中生長,並形成多模型共生甚至協作的生態。“未來將是‘多雲多模型’的時代。”
有了對行業的判斷,火山引擎接下來做的是深入市場,瞭解趨勢中的企業需要什麼。在峯會後的交流中,譚待表示,模型廠商的需求主要是“儘快把自己的大參數模型訓練出來”,企業關心的則是如何把大模型應用在具體的營銷、客服場景中,以及如何處理好成本和安全的問題。
火山引擎在其中找到了發揮自身價值的空間——模型廠商擔心算力和工程穩定性,火山引擎就提供技術支持;大模型要真正應用,安全信任和推理成本問題必須解決,火山方舟就實現了安全互信計算,並通過模型精調支持、訓推一體和公有云的彈性,幫助廠商降低成本,助力市場上大模型的“百花齊放”。
**“百花齊放”是市場的明確需求。**模型應用側的企業是極度務實的,他們看重的是效果好不好,成本高不高。一個強大的通用大模型固然很好,但在某些具體場景會顯得“大材小用”,且在財務上也不划算。因此,千億、百億、十億參數的模型都有市場價值。
譚待打了個比方:通用大模型好比工資高的博士,但不少應用場景只是“小學數學題”水平,用付給博士的價格去解小學題顯然是不合理的。因此不少企業會選擇精調後的中小模型,在獲得媲美大模型效果的同時,降低推理成本。
但這會帶來另一個問題,要同時應用多個模型,還要在這些模型上做精調,一是得有足夠多模型可以選,二是要有足夠豐富便捷的工具可以用。所以你會發現,火山方舟的每個功能都是從實際的供需痛點延伸出來的。它更多地聚焦在市場需求上,做自己擅長的事,推動大模型在千行百業的滲透。
一個好的技術創新一定是普適的、普惠的。它不是隻為解決“大問題”的重器,也不是隻有少數人買得起的昂貴方案。“多雲多模型”生態是大模型普適、普惠的一種可能性,而火山引擎正在做的,是讓這種可能性來得更快,更有持續性。
持續性指的是,大模型技術會不斷迭代,企業需求也在變化,行業需要一個讓供需兩端穩定對接,並隨着時代發展不斷變化的“統一的工作流”。這也是火山方舟試圖實現的,基於火山方舟,模型將應用於場景,場景數據又將反哺模型。這樣的“模型-場景”數據閉環對供需兩端都有價值,也是大模型新可能性的來源。
基於“火山方舟”,抖音集團內部已有十多個業務團隊在代碼糾錯等研發提效場景,文本分類、總結摘要等知識管理場景,以及數據標註、歸因分析等方面進行探索。與此同時,來自不同行業的客户也在積極探索大模型落地的方式。
隨着各方實踐持續進行,關於大模型的着眼點和着手點都將變得更豐富。一個豐富的大模型生態正在被構建,而這需要不同層別、不同環節的從業者的共同努力。沒有誰能靠一己之力做完所有的事。從火山方舟的一系列功能和發力點來看,火山引擎在知行合一的路又進了一步。