解釋下Manus怎麼幹活的,有想象力,但白領不用害怕_風聞
陈经-亚洲视觉科技研发总监-2小时前
1. 它不是用你的電腦幹活,有的點評人誤會了。你對話框讓它幹活,它就在服務器上開一個“虛擬機”。就是給AI員工分配一個“虛擬電腦”,裏面有很多“工具鏈”軟件。
2. 例如,解壓軟件,你給它發壓縮文件,它會調用工具軟件解壓。需要識別圖片單據上的文字,就調用OCR軟件。最大的一個“AI生產力工具”是編程軟件,這就複雜了。現在看來python會得到AI支持,因為語句簡單,本來就是伴隨着機器學習發展做大的。還有生成網頁的工具,總之很多工具,組成了“工具鏈”。這些就是AI員工的吃飯家伙。
3. 然後,很重要的是“搜索”,也就是調用瀏覽器工具,去收集信息。如問上市公司財報,股價。有時一般搜索搞不定,如我問kimi、deepseek某天的股價股指,它們只會搜索新聞報導。而Manus會和人一樣找專業的網站API查,這就需要深度開發。
4. 在這之前,先生成一個辦事步奏。也就是做菜先把菜譜準備好。搜索,調用工具鏈,一步步準備原料,加工。最後,就能把做好的菜端出來。從白領的角度看,就很驚人了。居然一句話能辦那麼多步的事。
5. 這裏有個關鍵,就是AI需要理解人的意圖,組合信息,生成信息。這就需要“基座大模型”,Manus應該是用的Claude sonnet 3.5,最新3.7了。但可以用多個,如也用了Qwen。可以看出,這會被説是“套殼”,但是框架不一樣,是有技術含量的套殼。
6. 這個框架的問題,我認為是兩個。它能辦的事,嚴重受限於工具鏈,而且調用工具鏈的手段有限。例如編程,對了好辦,要是錯了就很麻煩,人可以去調試程序,AI員工也會調程序,但是就不如人。例如生成PPT,套路有限。展現出來的不錯效果,是預先調好的套路。偏離套路,就沒那麼好,或者崩潰死機。當然潛力是有的,套路也有用了,一些白領活就是簡單套路。
7. 再一個,我認為會是理解人的意圖,交互方面。人們如果意圖非常明確,文件和需求組織得好好的,讓它按套路幹,是可以的。但是人們往往需求沒那麼清楚,而是模糊地要幹什麼,然後不斷優化調整,滿足甲方爸爸的第10次改動要求。那AI員工就懵逼了,人也太難伺候了,太善變了,還是得人類員工來。所以,不要抱怨領導和甲方難伺候,要是任務明確,AI員工就幹了。越是PUA的要求,人類員工越有優勢。
8. 對美國AI的影響不會那麼大那麼快,在中國一夜爆火是科技自媒體矩陣發威了,中國特色。美國那邊早就有這樣的產品,不會覺得多新鮮。但應該會把價格打下來,奧特曼説OpenAI要賣2萬美元一個月的“博士水平AI員工”,便宜的也2000美元一個月。中國這邊會給出1%的價格,性能差點也有吸引力,奧特曼估計又要罵娘。
