一鍵生成十分鐘長視頻？我發現了一個超強的起號套路_風聞

一鍵生成十分鐘長視頻？我發現了一個超強的起號套路。。。_風聞

一鍵生成十分鐘長視頻？我發現了一個超強的起號套路_風聞

差评XPIN-差评官方账号-用知识和观点Debug the world！49分钟前

2025-08-06

開源的風，終於是從大模型吹到了Agent。

不要説線是歪的，因為通往AGI之路註定會有波折

前幾天，字節跳動旗下的Coze（釦子）平台開源了，給本就熱火朝天的 Agent 賽道又加了波猛料。

大家別光顧着吃瓜看熱鬧，其實這背後在説一件事：時代變了。

以前大家比的是誰家模型更聰明，所以拼了命把訓練參數做大、把基礎模型做強。

但現在真正的戰場，已經轉移到了怎麼把大模型用好、用到實處。

説白了，大家都已經不滿足做個簡單的Agent，而是要看Agent 平台怎麼讓AI既能穩定地調用各種工具，又能高效地跟外部世界打交道。

要聊明白這事兒，咱們得先看看AI Agent這幾年是怎麼進化的。

其實業界效仿隔壁自動駕駛的分級，也給Agent強度排了個L1、L2、L3……

最簡單的L1級別的AI Agent，其實就是3年前火起來的以ChatGPt為代表的，一堆大模型對話助手，在這個程度，你也就只能把它當個聊天機器人、信息搜索庫，談不上什麼生產力。

後來，它學聰明瞭點，學會了用些小工具，進化成了 L2 工作流助手。

L2 級別的工作流 Agent 就像個聽話的學徒，你讓它上網查個資料、算個數，它能照着你設定好的步驟一步步完成。

但説到底，還是得你這個當師傅的先把流程圖畫好，所以也沒啥特別的。

真正讓人興奮的，是進化到L3級別的推理型Agent。

突出的代表就是年初爆火的Manus，這也是讓 Agent 有了自主思考和規劃的能力。

這傢伙已經開始像個獨當一面的員工了，規劃個旅遊攻略、寫個PPT、做點論文草稿，分分鐘把活兒安排得明明白白。

但問題來了，就好比人類的職場一樣，專家員工再牛，也幹不了一個團隊的活兒，所以還是得靠人給一堆員工派活。

但這個過程的難度，壓根不比你自己幹來得輕鬆，可能活還沒派完，你的CPU先被幹燒了。

於是大家就想，能不能組個Agent團隊，讓AI來分配專業的AI幹專業的事兒？

結果業界經過了各種各樣嘗試發現，這幫看起來牛逼得不行的Agent湊一塊兒，根本沒法合作！

因為你別看，現在單個Agent執行任務的成功率挺高，但只要組隊，成功率就斷崖式下滑。

一個流程裏，每一步都有95%的成功率，聽起來已經挺好的了吧，但只要跑上20步，整個任務的成功率就直接掉到30%了，是不是有你買足彩1串6、1串7那味兒了。

就在大家為這幫散裝英雄一籌莫展的時候，前兩天，360集團正式發佈的納米AI，好像給出了一種新思路。

納米AI，有些差友可能還不大熟悉，人家是紅衣大叔周鴻禕 360 旗下的AI產品，最近升級成了“多智能體蜂羣”，還號稱是全球唯一真正進化到L4級別智能體。

昨天，紅衣大叔還特地開了場專場發佈會，給大家好好聊了聊納米AI如今的變化。

差評君也去聽完了全程，然後還試用了一波，真覺得有點牛了。

我先不説其他的，就給你看一個納米AI生成的視頻。

差友們可以猜猜這個視頻咱花了多少精力，寫了多少提示詞，後期調整了多少。

我來公佈最終的答案，花的精力就是上傳了一張火鍋的照片，提示詞不到100個字，後期完全沒做任何處理，甚至在納米AI生成視頻的過程中，咱們還去找小發打了一把王者，遊戲結束回來就看到了上面這個視頻。

看視頻效果的時候，背後站了一堆編輯部同事，全在怪叫“牛逼牛逼”，發羣裏也像是誤入藕花深處，驚起一灘“666”。。。

當然了，我們也找了隔壁Manus做了個類似的視頻。

儘管Manus調用了目前最頂級的Veo3視頻生成大模型，但什麼情節、故事都不存在的，純靠着大模型的基礎能力硬撐畫面。

而且，就像昨天直播裏周鴻禕反覆提及的“短視頻起號”，納米AI主打就是“一句話生成大片”。

你還能用更簡單的方法生成視頻。

比如咱們常在影視劇刷到的介紹某個歷史人物生平的視頻，在納米AI裏，直接就有一個專門的Agent叫古人傳記導演，你只需要説一句“于謙的一生”，然後就什麼都不用管了。

結果生成的質量也還是相當高。

説真的，這擱以前，在一些短視頻賬號起號階段，製作類似質量的視頻，一般是一個編導配2-3個剪輯花半天時間才能做出來，現在靠着納米AI，點幾下鼠標十幾分鍾就有了。。。

而且，咱們這個是最基礎的測試（其實是因為打王者，忘記調整細節了），兩個視頻完完全全都是納米AI一手導演的。

而且實際執行過程中，你完全可以在視頻風格、語音音色、最終腳本等等模塊，進行調整修改，來幫助AI生成更好、更符合你需求的視頻。

是不是已經覺得納米AI有點東西了？

昨天直播裏，他們還表示，納米AI的多智能體蜂羣能在一起連續工作2個小時，執行超過1000個步驟，處理9000萬個Token（相當於幾千萬個漢字）的信息量，中間不出錯、不掉鏈子。

這個水平大夥可能有點暈，我就這麼説吧，以 M 記為代表的L3級別的智能體，處理的token數一般只能在百萬級，換算成生成視頻，一般不超過90秒。

所以昨晚老周在直播間也放出話來：“咱們就是目前唯一一個能做10分鐘視頻的Agent。”

為什麼納米AI能實現L3到L4的突破呢？

其實是因為他們找了條多智能體並行的新路子。

簡單來説，納米AI有個超大智能體工廠，裏面有5萬個L3級別（也就是和M記同一級別）的Agent來滿足你的各種需求。

如果你覺得這5萬個都不行，也能自己再做新的L3級別Agent進去。

這麼一來，你手底下就有幾萬個，未來還能越來越多的Agent幫你幹活。

在360智能體工廠的基礎，再加上納米獨創的L4技術，才有了史上最長的10分鐘AI視頻。

這套L4技術説白了，就是在納米多智能體蜂羣的平台裏，給這幫平日裏單打獨鬥的Agent們，加裝了一套超級通訊系統和共享的作戰指揮室。

除了有部門經理和項目經理互相調度，各個賽博牛馬之間也不再有溝通障礙，所有智能體都在同一個頻道里聊天，一個眼神就知道對方想幹啥，再也不怕傳話傳歪了。

我們拿前面于謙的視頻舉例，我提示詞只輸入了“于謙的一生”。

納米AI能夠自己思考我要的是啥，比如要的是歷史人物于謙，不是德雲社的大爺于謙。

然後根據這個思路一點點研究于謙的生平，編寫文案標題和相應的分鏡腳本，接下來，又會根據這些分鏡生成相應的圖片，再把圖片生成視頻片段，最後再像一個後期一樣，把這些片段素材全部整合到一起剪輯成成片。

而且，在這個執行過程中，納米AI能夠最多支持100個工具同時調用。

你可別小看這個數字，之前Manus爆火的時候，網上對它的詬病最多的就是速度實在太慢，因為它作為L3級別的Agent，只能一項命令一項命令的執行，調用上一個工具，完成需求，才能繼續思考下一步怎麼做，想清楚之後再調用下一個工具。

但納米AI的多智能體蜂羣完全能夠做到邊想邊幹，我這邊還在調用工具進行配音，那邊已經在想着調用大模型生成視頻畫面了，這也大大提升了Agent的執行速度。

不僅如此，更絕的是，納米AI為了搞定步驟一多，Agent容易出錯雪崩的情況，還做了點安全冗餘。

周鴻禕在直播時透露自家產品用了一套比較暴力的解決方式，那就是用token換正確率。

比如生成某段視頻的分鏡圖片時，單智能體不是容易出錯嗎？

但納米AI可以多智能體並行操作，那我每個畫面都同時找三四個畫手一起畫，加一個把關的步驟，把生成失敗、出錯的剔除出去，保留正確的畫面，這樣就能大大提升成功率了。

當然了，儘管有了這些安全冗餘，但AI還是會出錯。

咱們在測試時，也出現了一次任務報錯，但納米AI人還怪好的，因為有些Agent任務出錯了消耗的token可不退你，而納米AI是全額返還的。

至於一些生成視頻文字上的瑕疵、前後一致性還不是完美之類的問題，偶爾也還是會出現。

但那句話怎麼説的，只要方向對了，走得再慢也是在一步步接近目的地。而類似大模型基礎能力上不足，其實也是目前業內大夥們提升的方向。

而且，該説不説，咱挺認同納米AI現在的這個思路的。

周鴻禕昨晚也説了，現在製作短視頻其實是人人的剛需，你做什麼賬號能不做短視頻，甚至發朋友圈也要vlog吧。

買書買課不如學會用AI

那讓AI最快成為人人都愛用的、能改變大家生活的方式，不就是在解決大家的實際需求嗎？

強如大模型也得做一個ChatGPT的載體，才能在全球爆火，而Agent界的ChatGPT遲遲沒出現，這也是為啥業界和用户之間有種割裂感。

啥公司都在説我們有Agent，多牛多牛，但我一個普通老百姓，感覺根本用不到啊。

而且，納米AI的一句話生成視頻，只是他們選擇的主攻點，實際上，你可以在L4級別多智能體蜂羣裏，根據自己的需求從0搭建專屬自己的AI團隊。

喜歡吃瓜的，可以做一個每天娛樂大新聞總結Agent；喜歡體育的，可以做一個專屬自己的體育報道AI天團。。。

昨天周鴻禕一直在強調，目前的大模型能力已經相當強悍，但出於各種原因，它真正的能力並沒有完全展現。

在他看來，Agent就是目前能夠最大限度挖掘大模型能力的橋樑，而通過多智能體共同參與，就能很好地處理現階段的一些人類需求，真正讓人覺得AI牛逼。

説到底，AI的未來，可能不取決於技術參數有多高、模型有多大，而在於它能不能像納米AI這樣，少談點玄乎的概念，多做個好視頻、寫個好方案，可能更有用。

當AI不再是一個遙不可及的神，而是我們隨時可以拉來組隊幹活、不知疲倦的賽博牛馬時，AI的下半場，才算真正開場了。

圖片、資料來源：

納米AI

即夢