解釋下Manus怎麼幹活的，有想象力，但白領不用害怕_風聞

陈经-亚洲视觉科技研发总监-2小时前

2025-03-07

1. 它不是用你的電腦幹活，有的點評人誤會了。你對話框讓它幹活，它就在服務器上開一個“虛擬機”。就是給AI員工分配一個“虛擬電腦”，裏面有很多“工具鏈”軟件。

2. 例如，解壓軟件，你給它發壓縮文件，它會調用工具軟件解壓。需要識別圖片單據上的文字，就調用OCR軟件。最大的一個“AI生產力工具”是編程軟件，這就複雜了。現在看來python會得到AI支持，因為語句簡單，本來就是伴隨着機器學習發展做大的。還有生成網頁的工具，總之很多工具，組成了“工具鏈”。這些就是AI員工的吃飯家伙。

3. 然後，很重要的是“搜索”，也就是調用瀏覽器工具，去收集信息。如問上市公司財報，股價。有時一般搜索搞不定，如我問kimi、deepseek某天的股價股指，它們只會搜索新聞報導。而Manus會和人一樣找專業的網站API查，這就需要深度開發。

4. 在這之前，先生成一個辦事步奏。也就是做菜先把菜譜準備好。搜索，調用工具鏈，一步步準備原料，加工。最後，就能把做好的菜端出來。從白領的角度看，就很驚人了。居然一句話能辦那麼多步的事。

5. 這裏有個關鍵，就是AI需要理解人的意圖，組合信息，生成信息。這就需要“基座大模型”，Manus應該是用的Claude sonnet 3.5，最新3.7了。但可以用多個，如也用了Qwen。可以看出，這會被説是“套殼”，但是框架不一樣，是有技術含量的套殼。

6. 這個框架的問題，我認為是兩個。它能辦的事，嚴重受限於工具鏈，而且調用工具鏈的手段有限。例如編程，對了好辦，要是錯了就很麻煩，人可以去調試程序，AI員工也會調程序，但是就不如人。例如生成PPT，套路有限。展現出來的不錯效果，是預先調好的套路。偏離套路，就沒那麼好，或者崩潰死機。當然潛力是有的，套路也有用了，一些白領活就是簡單套路。

7. 再一個，我認為會是理解人的意圖，交互方面。人們如果意圖非常明確，文件和需求組織得好好的，讓它按套路幹，是可以的。但是人們往往需求沒那麼清楚，而是模糊地要幹什麼，然後不斷優化調整，滿足甲方爸爸的第10次改動要求。那AI員工就懵逼了，人也太難伺候了，太善變了，還是得人類員工來。所以，不要抱怨領導和甲方難伺候，要是任務明確，AI員工就幹了。越是PUA的要求，人類員工越有優勢。

8. 對美國AI的影響不會那麼大那麼快，在中國一夜爆火是科技自媒體矩陣發威了，中國特色。美國那邊早就有這樣的產品，不會覺得多新鮮。但應該會把價格打下來，奧特曼説OpenAI要賣2萬美元一個月的“博士水平AI員工”，便宜的也2000美元一個月。中國這邊會給出1%的價格，性能差點也有吸引力，奧特曼估計又要罵娘。