科技雲報到:從大模型到雲端,“AI+雲計算”還能講出什麼新故事_風聞
科技云报到-深度原创企业级IT内容行家53分钟前
科技雲報到原創。
2024年的大模型產業,註定將是會被反覆提起的一頁。
這一年,被按下加速鍵的市場剛剛過半,就已經顯示出冰火兩重天的格局。算法的單模態擴展到多模態,趨勢如燎原之火,讓全球陷入對世界模型暢想的狂歡中;一級市場逐漸走向冷靜,投資人開始頻頻向企業要收入,百模齊發迅速被簡化為幾家獨角獸之間的資本與技術持久戰。
雲服務巨頭則以一種標準制定者,以及頂級大模型團隊背後力量的角色出現,成為市場中隱形的力量。在他們的主導下,過去IaaS、PaaS、SaaS的角色分工,在AI時代被芯片層、框架層、模型層和應用層取代,又迅速進化為基礎設施、工具和應用的新“三層架構”。
技術的發展,基礎設施的成熟,讓千行百業都產生了所有生意都值得在大模型時代重做一遍的信仰。
但如何低成本、高質量的重新做一遍,是所有企業,必須回答的關鍵問題。

從“業務靠近技術”到“技術靠近業務”
如今,“AI轉型”正逐步取代“雲轉型”,成為IT行業的新趨勢,AI也已成為硅谷最具想象力的概念。
2025年,是大模型落地的關鍵年。一方面,大模型Scaling Law的曲線趨緩,基礎模型廠商開始收斂,基礎模型動輒一次數億美元的投入,以及不斷推高的人才密度等高門檻,意味着只有少數企業能夠留在牌桌。
另一方面,大模型落地的緊迫感前所未有,大家都期待大模型產生實實在在的價值,且超出以往的技術能力範疇,全行業都在默契又統一地走向落地。
在ChatGPT爆發的初期,似乎是由新技術創造了新的市場,但是,並非所有的企業都需要一個ChatGPT,而所有企業都需要生成式AI。革命性技術發展的早期看起來是從無到有,在成熟期則是從“業務靠近技術”走向“技術靠近業務”,大模型越往後發展越需要對行業的理解、對產業的專耕。
對於企業來説,要直接將大模型運用好難度較大,畢竟大模型的複雜性、對技術能力和資源等方面的要求較高;而如果拋開行業化這一環節,直接去基於大模型開發具體應用,距離又太過遙遠,缺乏有效的銜接過渡。
其中的關鍵就是技術和行業結合,在當下的生成式AI產業敍事邏輯中,比以往任何時候都需要“行業化”。行業化起着降低大模型技術落地門檻的重要作用,它能夠聚焦提煉出各個行業普遍存在的共性難題,進而為大模型更好地適配不同行業提供基礎。
相比於新技術落地的其他環節,行業化是一個容易被忽略的部分,卻又往往需要最專業的廠商投入大量的資源做具體的事,大多數企業享受了行業化帶來的便利,卻對大模型落地這一層級的變化感受不明顯。
事實上,以ChatGPT為代表的生成式AI技術興起的近兩年,業內普遍關心AI應用的爆發時間。但從任何高科技行業發展的歷史來看,但凡應用要爆發,就離不開“降本”這一要素。
模型價格決定了應用使用成本,因為用户使用應用會調用大模型,需要消耗Token,而大模型訓練和推理的成本高,API的調用成本就會高,從而限制企業用户、開發者的應用開發步伐。
這就迫使大模型廠商,一方面要不斷迭代大模型,在百模大戰中以能力勝出;另一方面要降本提效,通過模型機構優化、分佈式推理和混合調度等手段進行優化、大幅壓縮成本,來不斷降低API調用價格,推動應用興起。
隨着AI技術的普及和深入應用,雲廠商也面臨着越來越多的挑戰。一方面,企業需要更加定製化、差異化的AI解決方案來滿足其獨特的業務需求;另一方面,AI技術的複雜性和不確定性也使企業在應用過程中面臨諸多風險。
與五六年前相比,當前AI行業正在發生根本性轉變,其中最明顯的趨勢是,生成式AI的廣泛應用使業務部門成為技術創新的重要推動力,企業希望通過AI技術來解決實際問題、提升業務效率。
而這也驅使雲廠商在業務開展方面出現了一系列新的變革。在AIGC時代,如何積極響應用户需求,通過提供開箱即用的數據分析能力幫助企業快速接入AI技術,成為這個時代雲廠商需要思考的難題。
在模型開發方面,雲廠商需要思考如何提升模型落地的工廠化能力,降低硬件成本、提高硬件性能,為企業提供更加穩定、高效的AI運行環境。
其中,把握並識別企業需求是一大難點。企業往往只會提出諸如需要更快、更便宜的GPU這類直觀需求,但不會透露更深層次的具體需求,如何運用創新辦法來解決相應需求是一大痛點。
為千行百業開啓數字化新篇章
當前,雲服務商的競爭已經從技術維度延展到企業的實際業務需求方面,這也成為亞馬遜雲科技在AI上的佈局重點之一。
在re:Invent 2024全球大會期間,亞馬遜雲科技不僅展示了其在生成式AI領域的深厚積累,更通過一系列新發布,展示了從模型到應用的全面佈局。
作為亞馬遜雲科技推出的新一代基礎模型,Amazon Nova旨在為用户提供多模態、高性能且成本效益顯著的生成式AI解決方案。該系列包括Micro、Lite、Pro、Premier等多個版本,分別適用於不同場景下的需求。Micro作為文本到文本的模型,以極低成本提供低延遲響應;Lite則為成本極低的多模態模型,可快速處理多種輸入;Pro在準確性、速度和成本間取得平衡,滿足多種複雜需求;而Premier則將是功能最為強大的多模態模型,可處理複雜推理任務並指導定製模型蒸餾。
除了基礎模型外,亞馬遜雲科技還推出了新一代圖像生成模型Amazon Nova Canvas和視頻生成模型Amazon Nova Reel。Canvas能夠幫助客户生成高質量圖像,並具備圖像編輯功能,最高可生成2K分辨率的圖像;Reel則以先進的視頻生成質量和低延遲著稱,提供了性能和成本效益之間的平衡,讓視頻製作更加普惠化。
為更好地支持生成式AI應用的構建與擴展,亞馬遜雲科技推出了Amazon Bedrock平台。該平台提供了從模型選擇、推理優化到多智能體協作等一系列工具和服務,旨在幫助用户輕鬆地將生成式AI能力整合到生產環境中。
在模型選擇方面,Amazon Bedrock Marketplace匯聚了來自領先供應商的100多個新興和專業基礎模型,用户可以通過統一界面發現、測試並部署所需模型。在推理優化方面,Amazon Bedrock推出了延遲優化選項和模型蒸餾功能,前者基於Amazon EC2 Trn2實例實現更好的推理性能,後者則通過蒸餾技術提升模型運行速度和降低成本。
此外,Amazon Bedrock還支持GraphRAG和自動推理檢查功能,分別用於提升數據關聯性和預防模型幻覺引起的事實性錯誤。
除了技術和工具的創新外,亞馬遜雲科技還通過Amazon Q系列產品加速了生成式AI在業務場景中的應用。Amazon Q Developer和Amazon Q Business分別為開發人員和企業用户提供了強大的生成式AI助手功能。
從行業戰略角度看,亞馬遜雲科技的首要目標是利用領先的雲計算、生成式AI和機器學習技術,賦能各行業客户構建業內創新解決方案。
亞馬遜雲科技正在通過多種方式將這一目標變為現實。比如,目前亞馬遜雲科技已推出超過40種針對特定行業的專屬服務,以及450多個行業專屬解決方案。通過這些定製化服務與解決方案,亞馬遜雲科技助力各種規模的企業加速應用雲計算並降低成本,賦能行業專屬的工作負載。這些解決方案正以前所未有的速度推動組織創新,助力客户實現突破性里程碑,併為其所在行業帶來創新性成果。
同時,亞馬遜雲科技助力企業加速開啓上雲之旅,其重點領域涵蓋關鍵系統的遷移和現代化、將本地數據工作負載遷移上雲,以及滿足各行業的業務需求。通過聚焦這些核心領域,亞馬遜雲科技幫助各行業客户降低成本(基礎設施成本最多可減少66%)、提升運營效率(開發人員生產力最多可提高30%)、加速創新步伐,同時應對複雜挑戰並提高可持續性。
生成式AI是亞馬遜雲科技的另一項重要戰略之一。對此,亞馬遜雲科技與各行業企業攜手合作,通過提供企業級安全與隱私保護、多種領先基礎模型的選擇、堅持數據優先的方法,以及高性能、低成本的基礎設施,助力生成式AI創新應用加速落地,充分釋放生成式AI的變革潛力。
比如在醫療領域,亞馬遜雲科技提供為醫療行業設計的專屬服務、企業級安全保障以及符合HIPAA標準的工具組件,包括可用於自動生成臨牀文檔的Amazon HealthScribe、增強臨牀問題解決能力的Amazon Q、可自動將醫療語音轉換為文本的Amazon Transcribe Medical,以及準確、快速地從非結構化醫學文本中提取信息的Amazon Comprehend Medical,從而為客户轉型提供全面的技術支持。
在製造業和工業領域,亞馬遜雲科技獲評2024年Gartner®全球工業物聯網平台魔力象限領導者。亞馬遜雲科技的工業物聯網服務套件包括Amazon IoT SiteWise和Amazon Lookout for Equipment,能夠助力製造企業徹底革新其運維流程。Coca-Cola İçecek(CCI)以Coca-Cola品牌生產、分銷、銷售起泡飲料和不充氣飲料,該公司通過使用Amazon IoT SiteWise,顯著提升了其“原位清洗(Clean in Place, CIP)”流程的可持續性,實現了每年能源消耗降低20%、水資源節約9%,以及流程時間縮短34天的顯著成效。
亞馬遜雲科技全球客户技術支持與服務副總裁Uwem Ukpong表示:“在幫助客户構建生成式AI解決方案的過程中,我們發現企業選擇的生成式AI應用場景也在逐漸迭代升級,從原先簡單的生成式AI嘗試例如對話式聊天機器人,過渡到內容、圖像、視頻等多媒體內容生成,以及數據洞察與決策等。亞馬遜雲科技將從客户需求出發,滿足客户不同應用場景的痛點與訴求,助力客户構建數字化解決方案。”
在生成式AI的淺水區,重點是找到新技術應用於業務的廣度覆蓋;在生成式AI的深水區,重點是彌合新技術和業務的認知鴻溝,也就格外需要雲平台企業,做中間一層的行業化,彌補大模型落地的版圖。
從底層的芯片、雲服務,到中間層的模型,再到最上層的應用,整個大模型產業鏈的各個環節之間,如同互相嵌合連接的精密傳動儀器,任何一個環節的進步與迭代,都會掀起整個市場的漣漪不斷傳導擴散。
其中,雲服務等基礎設施範式的存在,如同整個板塊的地基。上層的算法應用越想改變世界,最底層的地基就要越穩固。
儘管基礎大模型的能力提升已將AI應用開發從“最後1公里”推進到“最後100米”,但開發AI應用仍然面臨諸多挑戰,這正是雲計算平台從技術走向服務的重要意義所在。雲計算的進步,也是整個大模型產業鏈不斷向前飛奔過程中,被極大低估的一環。在未來生成式AI持續發展的進程中,雲計算將進一步與之深度融合,助力其釋放出更大潛能,為千行百業開啓更具想象力的數字化篇章。
【關於科技雲報到】
企業級IT領域Top10新媒體。聚焦雲計算、人工智能、大模型、網絡安全、大數據、區塊鏈等企業級科技領域。原創文章和視頻獲工信部權威認可,是世界人工智能大會、數博會、國家網安周、可信雲大會與全球雲計算等大型活動的官方指定傳播媒體之一。