阿里巴巴開源AI模型表現亮眼,基於千問的智能體框架登頂全球排行榜 | 南華早報
Ann Cao
阿里巴巴集團的開源千問人工智能(AI)模型助力智能體框架DeepSWE在這一新興領域超越競爭對手,該軟件平台的開發者表示。由開源組織Agentica與舊金山初創公司Together AI聯合開發的DeepSWE,基於千問3-32B大語言模型(LLM)訓練而成——該模型屬於阿里雲第三代AI模型家族。在最新SWEBench-Verified測試中,它以59%的準確率登頂排行榜,超越了深度求索V3-0324等其他所謂開源權重模型,開發者週三在博客中宣佈。智能體框架是提供構建、部署和管理AI代理所需結構、工具與功能的軟件平台。它們使AI代理能夠協作、決策並自動化複雜任務。
諸如中國初創公司蝴蝶效應的Manus等AI代理,是能代表用户或其他系統自主執行任務的軟件程序。本質上,這些代理會利用可用資源創建具體任務與子任務的執行計劃以實現目標。DeepSWE成為杭州阿里巴巴在全球開源社區日益增長的領導地位。阿里巴巴擁有《南華早報》。開源方式向公眾開放程序的源代碼,允許第三方軟件開發人員修改或共享其設計、修復損壞的鏈接或擴展其功能。
根據LiveBench的數據,阿里巴巴集團的Qwen3系列在5月超越DeepSeek的R1,成為全球排名最高的開源AI模型。照片:Shutterstock