跨越“演示”到“生產”鴻溝,亞馬遜雲科技開啓AI Agents新紀元_風聞
Alter-51分钟前

進入2025年後,Agentic AI可以説是討論度最高的科技詞彙。
從自主預定機票的“數字同事”,到主動編寫並調試代碼的編程助手,AI已經從簡單的問答工具,向能夠執行復雜任務的系統演進。
只是大多數企業還處於初步測試和概念驗證階段,尚未跨越橫亙在“演示”與“現實”之間的鴻溝:
比如怎麼管理AI Agents的長期記憶?如何確保AI Agents在訪問敏感數據時的身份與權限可控?當成千上萬個AI Agents協作運行時,能否觀測、調試並保證其穩定性?
這些棘手的工程問題,已然成為AI落地必須邁過的一道坎,也是留給廠商們的必答題。
7月16日晚上舉辦的亞馬遜雲科技紐約峯會上,針對Agentic AI的核心議題,亞馬遜雲科技率先交出了答卷——發佈了一系列全新的能力與工具,幫助客户大規模、安全部署和運行高性能AI Agents。
01 架構創新,重塑Agent開發的新範式
Agentic AI示範的的應用圖景不可謂不誘人。
不同於被動響應的對話機器人、只能解決特定任務的AI Agent,Agentic AI可以看做是多個AI Agents組成的協作系統,能夠在沒有人為干預的情況下,獨立地進行決策、規劃、分配角色,並執行復雜行動。
但在落地部署的過程中,開發者們不得不投入大量的時間和精力在基礎設施上,包括會話管理、身份權限控制、記憶系統、可觀測性機制等等,需要保障運行的穩定性、滿足企業級安全與合規要求,以至於Gartner在報告指出30%的AI項目在PoC階段後即宣告失敗。
在“紐約峯會”現場,亞馬遜雲科技給出了不同的解法——通過Amazon Bedrock AgentCore,幫助開發者打通AI Agents從概念驗證到生產部署的關鍵環節,跨越從原型驗證到生產落地的鴻溝。
不同於在虛擬機或容器中運行的部署方式,Amazon Bedrock AgentCore提供了一種新的開發架構,將Agent所需的一系列工程能力,抽象成了一套模塊化的雲服務:

AgentCore Runtime(運行時環境):Agents需要一個既安全又具彈性、能夠應對多變任務負載的運行環境。AgentCore Runtime提供具有會話隔離的低延遲無服務器環境,支持任何代理框架,包括流行的開源框架、工具和模型,並且可承載長達8小時工作負載的運行時環境。
AgentCore Memory(記憶系統):正如人類需要依賴短期與長期記憶,Agents同樣依賴複雜的記憶結構實現高效運行。AgentCore Memory支持統一管理會話記憶與長期記憶,為模型提供關聯上下文,同時支持Agent基於歷史交互的持續學習。
AgentCore Observability(可觀測性):在生產環境中,全面跟蹤和追蹤Agent的每個動作對於性能表現至關重要。AgentCore Observability可提供Agent執行過程可視化追溯,支持元數據標記、自定義評分、軌跡檢查及故障診斷/調試過濾器。
AgentCore Identity(身份管理):Agents在執行用户請求時,需基於正確的授權方式安全訪問各類工具與資源。AgentCore Identity支持AI Agents安全訪問亞馬遜雲科技服務及GitHub、Salesforce、Slack等第三方工具,既可代表用户操作,也可在獲得預先授權後自主執行。
AgentCore Gateway(網關服務):AI Agents需要訪問多種工具以執行現實任務。AgentCore Gateway為Agent提供安全路徑以發現與調用各類工具,輕鬆將API、Lambda函數等轉換為Agent可兼容工具。
AgentCore Browser Tool(瀏覽器功能):一款不依賴具體模型的、快速且安全的雲端瀏覽器工具,讓AI Agents大規模的與網站進行交互,可用於填寫表單、網頁導航等任務。
AgentCore Code Interpreter(代碼解釋器):AI Agents在執行復雜計算、驗證推理、處理數據或生成可視化內容時,需要在安全的沙箱環境中編寫並執行代碼。AgentCore Code Interpreter允許開發者根據安全要求,自定義執行環境的實例類型與會話參數。
不誇張的説,亞馬遜雲科技正在定義一種新的開發範式:企業可以使用任意框架、任意模型構建Agent,按需靈活組合相應的功能模塊,無須在安全、可靠等環節耗費精力。
AI Agents的開發不再是手工作坊式的探索,進入到了標準化的“流水線時代”,極大地降低了企業的應用門檻。
02 夯實地基,驅動Agent從“可用”走向“好用”
創新開發範式僅僅是AI走向生產的第一步。
大模型作為Agentic Al系統的“大腦”,承載着將非結構化的自然語言轉化為系統可理解的意圖和目標、推理與決策、理解上下文並進行連貫的多輪對話等職責,很大程度上左右着AI Agents的能力上限。
對應的挑戰也很直接。
比如大模型的準確性,目前主流的大模型均可通過提示詞工程和檢索增強技術,實現80%以上的準確性。但對一些關鍵應用來説,80%的準確性並不能滿足要求,必須要提升到90%乃至更高。
再比如多模型混合使用,單個模型的性能總有瓶頸,在實際的業務場景中,常常需要部署不同的大模型,根據具體的任務調用每個大模型最擅長的能力,並在多個模型間靈活切換、高效協同。
亞馬遜雲科技在“紐約峯會”上進行了對症下藥。
首先是Amazon Nova大模型的升級,提供了監督微調、對齊、持續預訓練、知識蒸餾等自定義技術,客户可以在整個模型訓練生命週期中自定義Nova Micro、Nova Lite和Nova Pro等模型,不斷提升準確性。
其中麻省理工學院利用Nova模型的定製能力,將超材料研究的屬性預測錯誤率降低了95%。

為了滿足AI Agents的應用形態,亞馬遜雲科技還上線了用於構建在瀏覽器上執行操作的Agent的大模型Amazon Nova Act、構建具有類似人類對話能力的語音Agent的Nova Sonic、最先進的多模態模型Nova Premiere等等。其中Nova Act使用了數百萬個用户界面交互進行專門訓練,在早期的企業用例中實現了超過90%的端到端任務完成率。
其次是對第三方大模型的適配,目前Amazon Bedrock上的大模型提供商已經從一年前的7家增長到了12家,包括Meta、DeepSeek、Anthropic、Cohere等等,只需10天時間就能將最新的開源大模型集成到平台上。
亞馬遜雲科技深知“沒有一個模型能適用於所有用例”,不能依賴某一個“萬能模型”來解決所有問題,將選擇權還給了客户,根據自身業務需求、成本和性能考量,靈活地選擇最合適的大模型,並通過Amazon Bedrock的統一接口便捷訪問,避免被某一種技術路線“鎖死”。
這種開放、靈活、可組合的模型服務能力,使大模型真正融入到了企業業務之中,不再是孤立的“AI孤島”。

另一個不應該被忽略的服務是Amazon Marketplace,新增了AI Agents工具類別,可以理解為提供AI Agents和工具的一站式商店。
企業可在“商店”中發現、採購、部署並管理來自領先提供商的AI Agents與相關工具,藉助即插即用的解決方案,以及Agent構建、運維與擴展經驗的專業服務,更高效地構建AI系統。
做一個總結的話,亞馬遜雲科技正從底層的推理能力、模型定製,到上層的Agent編排、跨模型協作,再到生態層的標準協議與開放,構建了一條開發、部署到運營的“Agent生產線”,驅動AI系統從“可用”走向“好用”。
03 務實落地,搭建連接新舊系統的“橋樑”
企業怎麼將Agentic AI落地部署到業務系統中呢?
看似是一個技術集成的問題,實則是對組織認知、數據基礎、架構能力乃至管理方式的全面挑戰。畢竟不同行業的業務流程千差萬別,企業的數字化程度、組織結構、人才能力、數據基礎、成本預算等“稟賦”各不相同,很難像“套模板”一樣複製AI Agents。
亞馬遜雲科技讓外界看到了深刻的務實主義,圍繞千行萬業的高頻需求,提供了多元化的工具和服務。
針對開發人員對效率和智能化的要求,亞馬遜雲科技將Agent能力融入到了軟件開發的全生命週期。

面向開發人員的IDE智能體Kiro,引入了規範驅動的開發,幫助開發者通過自然語言規範和架構圖清晰地表達他們對複雜功能的意圖;內置的智能代理鈎子,可以自動處理生成文檔、編寫測試、優化性能等任務;同時提供了一個專門設計的界面,能夠適應開發者的工作方式,輕鬆掌控開發過程。
如果開發者比較喜歡現有的開發環境,可以將Amazon Q Developer集成到當前的IDE中,實現功能編寫、代碼補全、安全掃描等功能。
針對.NET框架、VMware等系統的遷移痛點,AWS Transform提供了自動化代碼重構和遷移的選項。
以VMware Transform智能體為例,實現了簡化並自動化本地應用發現、遷移波次規劃、端到端遷移過程的編排,並且解決了VMware網絡配置、防火牆規則轉換等難點,遷移速度最高可提升80倍。
其中擁有160年曆史的湯森路透,面臨着改造數十年.NET遺留代碼的挑戰。通過Amazon Transform,湯森路透.NET應用的現代化改造速度提升了4倍,每月處理150萬行代碼,讓開發者從維護“技術債”的泥潭中解放了出來,將更多的精力專注於創新。
針對向量數據存儲的成本壓力,亞馬遜雲科技推出的Amazon S3 Vectors,最高可節省90%的成本。

由於AI Agents需要海量的知識和記憶,而這些數據通常以向量形式存儲,動輒數十億的向量數據帶來的成本壓力不言而喻。
Amazon S3 Vectors堪稱一次“移花接木”式的創新,對於批處理和非即時的智能體任務,可以將長期向量數據集存儲在S3 Vectors中,適用亞秒級的OpenSearch服務,處理需要高查詢吞吐量和低延遲的工作負載,進而從根本上解決AI Agents長期記憶和知識庫的成本瓶頸,讓大規模、長週期的Agent應用成為可能。
可以找到的創新還有很多,譬如輕鬆實現AI Agent間協同工作的Strands 1.0、同步處理視頻中的圖像、音頻與文本元素的TwelveLabs AI模型……隱藏在新工具和新服務背後的,恰恰是亞馬遜雲科技幫助客户解決“歷史包袱”和“成本高牆”的決心。
每一個創新都是不是“炫技”,瞄準了企業落地過程中的真實痛點,解決“怎麼落地”、“怎麼遷移”、“怎麼控本”的核心問題,為企業搭建起一座從傳統系統邁向未來架構的“橋樑”,讓AI Agents不再停留在願景。
04 寫在最後
當AI從工具演變為基礎設施,一場時代洪流正席捲而來。
著名諮詢公司Gartner在報告中預測:到2028年,33%的企業軟件應用程序將包含Agentic AI,相比2024年不到1%的佔比顯著提升。
另一家諮詢機構MarketsandMarkets也給出了樂觀判斷:AI智能體市場規模將從2024年的52.5億美元,增長到2030年的526.2億美元。
至少亞馬遜雲科技已經開始轉動飛輪:不斷完善Amazon Bedrock AgentCore等基礎設施,吸引越來越多的開發者和服務商入駐Amazon Marketplace;豐富的工具和智能體解決方案,賦能更多的企業向智能體時代轉型;而客户需求和反饋,將反過來驅動亞馬遜雲科技進行更深入的研發和投入。
一旦正向循環轉動起來,AI Agents將是一種新常態。