靠這個工具,我一句話搓出了個奶龍_風聞
差评XPIN-差评官方账号-用知识和观点Debug the world!3小时前
最近 Manus 爆火,很多人都苦於沒有邀請碼,只能看着有碼的人體驗 “ 別人給自己幹活 ” 的快感。
為啥這東西這麼吸引人呢?還是因為現在的大語言模型,只能和你進行 “ 言語交流 ” 。你跟它説 “ 這個東西我不會 ” ,它會給你羅列出詳細的步驟,但絕對不會幫你完成。完成工作,是隻有碳基生物能幹的事,硅基生物它做不來。

而 Manus 一出,就展現了超越傳統大模型的自主執行能力,不僅能理解複雜指令,還能拆解任務、調用工具等。網友一看,好傢伙,這不就是個幫我打工的私人助理嗎?
但這玩意也沒那麼全能,只能算個 “ 套殼產品 ” ,雖然是集成了很多工具包,但如果是它****工具庫裏沒有的,那就完蛋了。
比如,你能讓 Manus 幫你 PS 個圖,用 PR 剪個視頻,再把工程文件發給你嗎?對不起,做不到。也就是説,它離我們真正的 “ 生產力工具 ” 還很遠。
但最近世超在 GitHub 上發現了個比較火的項目,可以讓大語言模型幫你建模。這可不得了,可以説是讓AI成為真正生產力工具的重要一步**,**現在這個項目已經收穫了 6.8k 的 Stars ,還在快速增長。
世超看完演示視頻,發現作者僅僅通過與 Claude 對話,就使用 3D 建模軟件 Blender 建立出了一幅精美的模型。整個建模過程無需敲代碼,更無需學習軟件操作,只需要通過語言描述需求即可完成。
視頻裏,作者直接在對話框裏輸入: “ 請用 Blender 幫我建立一個場景,有一條龍站在一罐金子旁邊 ” 。

隨即, Claude 就開始調用 Blender 開始建模了,很快啊。

最終成品圖如下:

看着效果確實不錯啊,那必須體驗一下了,畢竟作為懶狗,看着別人把活全乾了確實有種不能拒絕的快感呢。
於是,我找到項目文檔,照着上面的步驟,用不了一小時就把項目部署完成了,確實簡單。整個過程也不需要寫代碼,完全的鼠標操作。
體驗了一個上午,先説結論:趣味性十足,實用性一般。
首先我試驗了一下,能不能達到視頻中的效果。我直接把視頻中的提示詞複製過去,他還真列出步驟一步一步開始做了:

就是這效果。。不能説是一模一樣,只能説是有點關係:

金幣和地板是有了,就是這龍也太龍了。
不過視頻顯示啊,作者在該提示詞的基礎上進行了多次微調,世超由於對建模一竅不通,不懂怎麼調整建模細節,所以造成了實物與原圖不符。感興趣的差友們可以嘗試復刻一下視頻中的效果。
哎,不然來個簡單點的,就給我畫條龍吧?我們來看看對這種簡單直接的要求,它的完成度怎麼樣。
於是,我直接跟它説:給我畫條真龍。

看它輸出的步驟,真是有模有樣的,先畫龍身,再畫龍頭,然後是龍爪和細節修飾。。
結果呢?

你還別説,跟樓上那條龍真有異曲同工之妙。看來大模型對龍的理解就是這樣了,又龍又豬的。沒關係,反正都是十二生肖嘛。
**額,真龍畫不出來,奶龍總行吧?**我把奶龍的細節特徵全給你描述清楚,你給我畫,就不會出錯了唄。
必須動手。我給的提示詞是:“ 畫一條黃色怪獸,圓圓的頭,肥胖的身軀,短胳膊短腿,還有恐龍尾巴和綠色眼睛。 ”

它立馬就開始動手了,很快啊。

最終結果令我拍手叫好:

説實話,這是給它的幾個任務裏,完成度最高的一個了,起碼能看出來是條奶龍了。
不過呢,這些其實都是些神秘的東方元素,對西方大模型來説,畫不出也可以理解。
有沒有什麼世界各地都常見的東西?我想了想,讓它給我畫棟房子吧。提示詞很簡單:畫棟房子。
在經過一番全自動操作後,它給出了最終成品:

嗯,確實還不錯,有門、窗、樹甚至煙囱之類的東西。就是旁邊飛了兩根橫樑不知道是做什麼的。。
這幾輪體驗下來,感覺只能説勉強可以,畢竟是零基礎建模師,建出能看出形狀的模型已經算是勝利了。
世超也把它的作品給專業 3D 建模的同事看了,同事表示:其實它現在只會簡單的幾何體堆砌,就像小孩搭積木一樣,沒有建立複雜模型的能力。
有很多網友嘗試過它之後,也給出了類似評價:


總結一下就是:能用,但也僅限能用。想給專業人士幫上忙,其實還遠着呢。。
但對現在 AI 的發展來説,還是個不小的進步, AI 從 “ 摸不到工具 ” 到 “ 能摸到工具了 ” ,那給人類打工這件事還會遠嗎?
那麼話又説回來,不是説讓 AI 實現工具使用挺有難度嗎?這個是咋實現的呢?
其實,怎麼能讓 AI 使用我們的生產工具幹活,一直是 AI 從業者研究的難題。因為現在的 AI 和生產力工具們,還沒辦法直接 “ 交流 ” 。
舉個例子,《 聖經 》中説,最初所有人類都使用的是同一種語言,為了防止人類合夥建造通天塔,上帝一聲令下,把大夥的語言都分隔開了。
而現在的各大 AI 和人類的工具、數據庫之間呢,也有這種 “ 語言不通 ” 的矛盾。
為了解決這個問題,在去年 11 月,一位叫 MCP ( Model Context Protocol ,模型上下文協議 )的重量級嘉賓就閃亮登場了。

它是由 Anthropic 提出的一種開放標準協議,你可以把它理解成一個 AI 世界的 “ 翻譯官 ” 。不管你是什麼東西,只要支持 MCP 協議,它都能使大模型的 “ 語言 ” 讓其他使用 MCP 協議的工具 “ 聽懂 ” ,這樣一來,壁壘就被打破了,通天塔不是就指日可待了嘛?
如果未來越來越多的應用使用 MCP 協議,我們的 AI 就能輕鬆調用它們進行工作,人類就能正式進入 “ 解放雙手 ” 的時代了。
上面介紹的建模項目呢,就是使用了 MCP 協議,把大模型和建模軟件連接了起來,所以咱們每提一個要求,大模型就能根據要求調用建模軟件進行執行。
隨着時間推移,已經有越來越多的工具加入 MCP 的隊伍中了。
比如, VSCode 上的一個叫 Cline 的插件,本身是使用 AI 輔助編程的,最近也宣佈支持 MCP 了,這意味着這款插件可以使用 MCP 生態下的全部功能。
比如一款爬蟲工具 Firecrawl ,能把各大網站的信息爬下來,然後轉化成對大模型友好的 Markdown 格式。

程序員用這款插件時,想在網站上爬點有用的信息並餵給 AI 總結, so easy 好吧。
不過據傳 Manus 沒有使用 MCP 協議,世超覺得如果未來 MCP 成為主流, Manus 也就隨即失去意義了。。畢竟大傢伙都能 “ 萬物互聯 ” 了,還需要你個集成工具包乾什麼呢?當然這也都是展望階段,未來到底怎麼樣,還不好説。
不過最近的幾波新聞,都代表着 AI 離 “ 替人類幹活 ” 越來越近了。你説大家不擔心搶工作,那是不可能的,畢竟你永遠不知道下一個被替代的職業是什麼。。
所以,你的職業離被 AI 拿下,還有多遠呢?
圖片、資料來源:
X 、 Youtube 、 Anthropic
