如果 MaaS 是個偽命題,大模型時代的“雲”應該怎麼建?_風聞
极客公园-极客公园官方账号-17分钟前

大模型競賽,這家雲巨頭不迷信萬能模型。
作者 | ray
編輯| 鄭玄****
2024 年的大模型產業,註定將是會被反覆提起的歷史一頁。
這一年,被按下加速鍵的市場,剛剛過半,就已經顯示出冰火兩重天的格局:
算法的單模態擴展到多模態,趨勢如燎原之火,讓全球陷入對世界模型暢想的狂歡中醺然欲醉;
一級市場卻逐漸走向熄火,投資人從向大牛要論文,變成了向企業要收入,百模齊發迅速被簡化為幾家獨角獸之間的資本與技術持久戰;
雲服務巨頭,則以一種標準制定者,以及頂級大模型團隊背後力量的角色出現,成為市場中隱形的手。在他們的主導下,過去 IaaS、PaaS、SaaS 的角色分工,在 AI 時代被芯片層、框架層、模型層和應用層取代,又迅速進化為基礎設施、工具和應用的新「三層架構」。
技術的發展,基礎設施的成熟,讓千行百業都產生了所有生意都值得在大模型時代重做一遍的信仰。
但如何低成本、高質量的重新做一遍,是所有企業,必須回答的關鍵問題。
一定程度上,今天凌晨舉辦的 2024 年 亞馬遜雲科技 紐約峯會,可以作為觀察這個時代之問的最佳切口。
01
沒有一個模型可以一統天下,MaaS 或許是個偽命題
一個新的業內聲音是,MaaS(模型及服務),或許會是一個輝煌又短暫的概念。
亞馬遜雲科技作為三大海外雲服務巨頭中最注重大模型企業業務,同時也是規模最大的一個,顯然是這個觀點的堅定支持者。
包括今天凌晨的紐約峯會,多個公開場合,亞馬遜雲科技高管們都在宣揚同一個理念:「(現實落地中),不可能依賴單一、萬能的大型語言模型應對各種任務。」
將這句話,翻譯的直白些,就是現實中,沒有一個大模型可以一統天下。
一方面,在算法落地中,技術、時延和成本之間往往會形成穩定的不可能三角,面對不同需求,往往對應着不同的最優解法。比如與 GPT4 系列叫板的 Claude 3.5,其實一共分三個版本,其中相對輕量級的 Haiku 版本,反而憑藉着低時延與低成本優勢,在實際案例部署中更受歡迎。
即使單純聚焦到技術的單一維度,「最強模型」也同樣是個偽命題。依舊是拿最新 Claude 3.5 與 GPT-4o 做橫向參數對比,Claude-3.5-Sonnet 在物理、化學和生物學幾項中超過了 GPT-4o,但是在數學、天文等科目中,則GPT-4o 更佔優。

既然需求多元、技術評價多維,那亞馬遜雲科技的思路,就要打贏這場仗,需要的是一場「人民的戰爭」,儘量接入最多的大模型在平台之上供用户選擇。目前,Amazon Bedrock,已經接入了三十多家世界頂流大模型。其中既包括亞馬遜自研的基礎模型 (Amazon Titan),也包括了 6 家 AI 公司的第三方模型(如 AI21 Labs、Anthropic、Stability AI 等)。
更多的模型接入之外,過去一年多時間裏,Amazon Bedrock 還推出了一系列功能輔助模型微調與上線:如 RAG(檢索增強生成)、模型微調和定製功能、開發工具 Agents、模型安全功能 Guardrails for Amazon Bedrock 等。
在此基礎上,本次發佈會上,針對開發工具 Agents for Amazon Bedrock,亞馬遜雲科技繼續推出兩大重磅新功能。
(1)保留交互記憶——用户與算法的每輪對話的摘要將被保留,進而在航班預定、點外賣等複雜多步驟任務中,能夠自動為用户推薦滿足其座位偏好、餐食選擇偏好的決策。真正做到讓大模型適應每個用户獨特需求和偏好做到千人千面。
(2)代碼解釋功能上線——該功能可以在安全的沙盒環境中動態生成和運行代碼片段,並能夠處理複雜的用例,使得大模型能力提升到可以處理包括數據分析、數據可視化、文本處理、求解方程式和優化問題。
不過,無論是成為覆蓋最廣的大模型貨架,還是提供最全的工具箱,都不是亞馬遜雲科技野心的全部。它的目標是成為整個時代的基礎設施。
02
亞馬遜雲如何佈局生成式 AI 的三大關鍵層次
比單純否定 MaaS 更難的,是建立新的技術與規範。
對亞馬遜雲科技來説,一個新的命題是,如果 MaaS 不成立,那亞馬遜雲科技又將如何應對來自不同客户的不同需求?
對外,亞馬遜雲科技選擇將 AI 開發者生態做大。截止當前,亞馬遜雲科技已經在 200 個國家和地區培訓了超過 3100 萬名生態開發者,提前一年多實現了到 2025 年為全球 2900 萬人提供免費雲計算技能培訓的目標。
對內,亞馬遜雲科技的答案則可以結合其在過去一年中在基礎設施算力層、工具層、AI 應用層三大維度的不斷拼圖補全,可以窺見亞馬遜雲科技對整個市場的認知與針對性解法。

算力層,做厚用於基礎模型訓練和推理的基礎設施。這一層主要服務於有大模型訓推能力的企業,為他們提供芯片、存儲、網絡在內的基礎設施服務。高性能低成本與綠色,是亞馬遜雲科技的核心優勢。目前已經有 Anthropic、Mistral AI、Hugging Face 等眾多明星 AI 團隊在亞馬遜雲科技進行大模型的訓練。

關於如何構建高性能計算集羣, 一方面,亞馬遜雲科技繼續提供來自英偉達的計算實例,英偉達多款先進算力均率先在亞馬遜雲科技落地,包括亞馬遜雲科技將提供基於 NVIDIA Grace Blackwell GPU 的 Amazon EC2 實例,以加速構建及運行數萬億參數的規模大型語言模型的性能,亞馬遜雲科技將提供首款搭載英偉達 Grace Hopper 超級芯片的雲 AI 超級計算機,以及首款採用英偉達 GH200 NVL32 的 NVIDIA DGX cloud。這些將在 Amazon EC2 實例上可用,可以讓用户能輕鬆擴展至數千個 GH200 超級芯片。
另一方面,亞馬遜雲科技也在持續投入自研芯片。針對大模型的訓練與推理兩個最重磅環節:亞馬遜雲科技的推理芯片 Inferentia 已經升級至二代,並專門針對包含數千億個參數的生成式大模型進行了優化,與一代 Inferentia 相比,吞吐量提高了 4 倍,延遲降低了 10 倍。訓練側的加速芯片 Trainium 也同樣升級到二代,專門針對超 1000 億甚至萬億參數模型的深度學習訓練打造。
在成本側,眾所周知雲計算是一個典型的具有規模效應的市場,玩家市場份額越高,單位算力的平均成本就越低:2023 年,亞馬遜雲科技在全球雲服務市場的市場佔比為 31%,營收高達 908 億美元,連續多年蟬聯全球第一。其中,僅在 AI 領域:全球就有 96% AI 獨角獸將產品部署在亞馬遜雲科技,福布斯 AI50 榜單裏的玩家,也有 90% 將其產品運行在亞馬遜雲科技。

而針對 AI 在近些年來變身高耗能行業,亞馬遜雲科技則在發佈會上官宣,通過能效提升、增加服務器利用率以及建立光伏、風能站點,購買綠證等行為,目前亞馬遜雲科技已經實現全球基礎設施 100% 使用可再生能源,相較計劃,提前了七年。

第二層,進一步完善中間工具層 Amazon Bedrock 以及各種附加功能。這一層,主要服務於對大模型有深度應用需求,但沒有開發能力的企業。亞馬遜雲科技提供的除了全球主流大模型公司產品之外,同時提供各種微調、知識庫、測試比較、安全等多種工具。僅過去一年半,亞馬遜雲科技針對不同需求,GA(正式可用)的數量有 326 個之多,是其他供應商總和的兩倍。

其中,模型微調能力,是這一層級企業對大模型需求的重中之重。此次發佈會上,除了保留交互記憶、代碼解釋兩大新功能上線之外,亞馬遜雲科技 還針對 Amazon Bedrock 中的已有明星模型 Claude 3 Haiku 版本,提供了微調能力。SK 電信和路透社是其微調功能最先體驗者。其中,路透社通過微調,其專屬版本的 Claude 3 Haiku 任務性能提高了高達 40%。
在工具側,針對已有的 Guardrails for Amazon Bedrock 功能(幫助模型過濾有害信息與敏感信息,可攔截高達 85% 的有害內容)亞馬遜雲科技做了進一步升級,將其變成獨立的 API,除了能夠深度耦合 Amazon Bedrock 平台,同時也可以支持非 Amazon Bedrock 平台上的各種生成式 AI 模型。
另外,亞馬遜雲科技還為 Guardrails API 添加了一項名為 Contextual Grounding 的新功能,可以通過語境分析降低 75% 的大模型幻覺的產生。
應用層則定位於企業級生成式 AI 助手,核心產品是 AI 助手 Amazon Q 為核心的一系列開箱即用 AI 應用集合。這一層主要針對有大模型使用意願,但不想投入過多技術精力的企業,幫助他們降低 AI 的開發成本。
本次的發佈中,亞馬遜雲科技重點推出了一個名叫 Amazon App Studio 的新功能。通過 Amazon App Studio,用户通過對話,就能建立自己的企業級應用程序。相較傳統的企業搭建應用雛形,引入大模型填充細節,Amazon App Studio 從設計源頭就引入大模型,並通過可視化的方式,將應用程序搭建的代碼量一步降低 80%,一個不擅長寫代碼的 IT 項目經理,也可以在幾分鐘內完成一位資深程序員幾周才能解決的業務問題。
舉個簡單例子,一家傳統企業要創建一個庫存管理程序時,只需要告訴 Amazon App Studio 我要生成這個程序,然後在接下來的多輪交互中,不斷細化「最高權限只能 CEO 具備」「同意按鈕只能審閲者能使用」「某種類型商品出庫必須經過三級審批」等等具體的要求,一個完整的程序就能在幾分鐘內創建完成。
理想總是很豐滿,但正如同大模型百人場景的 POC 與萬人場景的應用難度不可同日而語,亞馬遜雲科技這一套新時代基礎設施的成立與否,也需要來自實踐的檢驗。
03
大模型的答案,還是要回行業裏找
伴隨着亞馬遜雲科技在基礎設施、工具、AI 應用三大維度的拼圖不斷被補全,所有生意都值得在大模型時代重做一遍,幾乎成了大部分企業的信仰。
最新發布的 Amazon App Studio,在測試期間,已經展現出了其對傳統軟件開發模式的顛覆:
作為全球審計龍頭,德勤成為 Amazon App Studio 第一批吃螃蟹的用户。在其首席顧問 JB McGinnis 看來,德勤的客户來自全球各地不同行業,每個客户都有不同的任務和流程要求,藉助 Amazon App Studio,只需幾句話就能輕鬆地從想法轉變為應用程序,整體運營效率與客服服務質量被極大提升。
醫療大數據及分析服務提供商 HealthVerity 也成為了最早嚐到 Amazon App Studio 甜頭的客户。過去公司需要至少安排五名程序員開發和維護公司的低代碼平台,依然無法滿足安全合規需求,App Studio 則做到了對開發人員時間精力的完全解放,普通員工也能在幾分鐘內構建自己的應用程序。
即便在合規要求最嚴格的金融市場,上雲、用 AI 也早已成為共識。
早在 2022 年,從 MRX 期權交易所和債券交易所 (NBE) 開始,納斯達克就已經逐步將其北美市場的業務遷移到亞馬遜雲科技 之上,到了去年,納斯達克又將旗下另一家期權交易所 GEMX 遷移到 亞馬遜雲科技,上雲後,延遲改善了 10%,納斯達克整體能處理的消息流量比五年前增加了四倍,每條信息的成本降低了 80%。Amazon Bedrock 幫助下,納斯達克的分析師進行市場信息提煉、分析的時間減少了 33%。
生物製藥領域,大模型則徹底顛覆了過去百年的行業生產模式。
拜耳在醫療保健和農業領域擁有 150 多年的歷史和專業知識。在這一領域,伴隨着全球人口的急劇膨脹,地球糧食總產量需要增產至少 50% 才能滿足人類所需。這一背景之下,在技術開發側,拜耳選擇合作亞馬遜雲科技,通過 Amazon Q,拜耳減少將模型從概念驗證過渡到生產和最終業務採用所需的開發週期,降低了 70% 以上拜耳開發了圖像分析管道將開發人員的開發時間降低了 70% 以上。
以上並非個例,基礎設施的迭代升級正推動行業應用的爆發,形成正向循環,所有生意在大模型時代被再次重構,正成為現實。
04
結尾
關於這一輪大模型熱潮,過去相當長一段時間,市場都將最多的目光放在了算法本身的進步之上,隨之而來,Open AI、Anthropic、Stability AI 在內,一眾明星算法公司被捧上神壇。
產業鏈的力量,在一定程度上被忽視了:從底層的芯片、雲服務,到中間層的模型,再到最上層的應用,整個大模型產業鏈的各個環節之間,如同互相嵌合連接的精密傳動儀器,任何一個環節的進步與迭代,都會掀起整個市場的漣漪不斷傳導擴散。
其中,雲服務等基礎設施範式的存在,如同整個板塊的地基。地基之上,算法可以從 CV 火到 NLP,體量可以從最初的十幾層網絡增長至如今的大模型,內容維度也可以從文字、圖像上升到視頻。
但一個常識是,上層的算法應用越想改變世界,最底層的地基就要越穩固。
亞馬遜雲科技的進步,也是整個大模型產業鏈不斷向前飛奔過程中,被極大低估的一環。
參考資料:《擁抱雲原生加速推進數字創新 選擇亞馬遜雲科技從容邁向新時代》https://baijiahao.baidu.com/s?id=1792572052533259617
本文為極客公園原創文章,轉載請聯繫極客君微信 geekparkGO