僅用3小時,這個中國團隊就復刻出開源版Manus
张睿佳

(文/張睿佳 編輯/張廣凱)
就在Manus的邀請碼一碼難求之際,3月6日晚,GitHub開源了一個無需邀請碼的OpenManus項目,據稱可以實現與Manus類似的效果,並且人人都可以本地部署。截至目前,該項目Star數已經突破八千。

更重要的是,該團隊完成這一項目僅僅花費了3小時,似乎印證了外界對於Manus門檻不高的質疑。
那麼OpenManus是什麼?又是怎麼工作的呢?
據悉,該項目的作者均為此前MetaGPT的核心貢獻者,而相較於Manus背後的Monica,其實MetaGPT此前的知名度還要更高一點。MetaGPT是國內AI Agent創業公司DeepWisdom(深度賦智)於2023年發佈的一款多智能體協作框架,當時一經開源,就火爆全網,如今在GitHub上已經收穫了49.7k stars。
OpenManus的原理也是通過多智能體協作,並增加調用工具的能力,來實現類似Manus AI的效果。在實際的任務處理中,OpenManus會將任務分解;在明確任務細節後,將打開有關的網站,收集信息、展開詳細分析;整個思考過程,每一步都清晰可見,直至最終生成任務結果。
具體的説,OpenManus的底層由各類大語言模型構成,中間層通過多智能體協作拆解任務,執行層調用各類API接口完成具體操作。
在大語言模型構成方面,OpenManus可以無縫集成包括Claude 3.5、Qwen VL Plus在內的多個頂級大模型,使得開發者能充分利用各個模型的優勢。而在GitHub上,有不少開發者也在嘗試進一步接入DeepSeek等其它大模型。
在多智能體協作方面,藉助MetaGPT的經驗,在處理複雜任務時,將不同的角色分配給GPT模型,模仿現實世界公司的運作。
進一步講,OpenManus的背後有三大關鍵:模塊化Agent系統,即時反饋機制,一整套強大的工具鏈。
其中,在即時反饋機制下,LLM思維鏈的過程,會被可視化地呈現出來。無論是任務執行進度的即時更新、思考過程日誌、文件的即時通知等,都隨時可見。
與此同時,另一個來自CAMEL AI團隊的通用智能體,也被開源了。這個名為OWL的項目,在GAIA基準測試中,取得了58.18的平均分,並在開源框架中排名第一。
可以説,在當下大模型企業普遍專注於模型能力提升,而並未花大力氣打磨產品的背景下,以Manus為代表的小企業通過整合各家大模型並接入實用工具做出的Agent產品,的確在應用層面令人眼前一亮。但是如果大模型本身沒有門檻,這類產品的開發難度就會大大降低,未來能否抵擋住大廠的入局並不樂觀。
本文系觀察者網獨家稿件,未經授權,不得轉載。