親測智譜“清影”大模型:好用,但不如Sora_風聞
AI蓝媒汇-AI蓝媒汇官方账号-欢迎关注公众号:jizhezhan31分钟前

作者|陶然
編輯|魏曉
視頻大模型賽道,徹底捲起來了。
週末晚間,藍媒君的手機彈出一條消息:智譜AI,發佈了名為「清影」的AI生視頻大模型。
寒冷的北極,探險隊穿越冰雪,使用雪地摩托追逐極光
手機App和網頁版,同步上線。

還非常高調地,對先前在智譜清言有過註冊的用户做了批量推廣。

甚至,超前上架了製作加速和配樂等氪金入口,大有迅速邁向商業化階段的架勢。

在被定調為業界標杆的OpenAI Sora 模型遲遲未能公測的時間段裏,國產大模型賽道可謂驚喜不斷:愛詩科技PixVerse、快手可靈、商湯 Vimi 相繼落地。
貴為新AI四小龍之一的智譜,先前則是在投融資和AI項目投標等領域,捷報頻傳。
此番開放AI生視頻模型,也是相當突然。
下一個問題,效果如何?
又是一位高分玩家
既然智譜AI有自己的通用大模型ChatGLM,不妨讓大模型出題,測評一下新發布的這款視頻模型。
第一輪對話,遺憾翻車,AI並沒能直接理解視頻所需提示詞的含義。

好在,經過提示修改,ChatGLM還是給出了五段由簡單到複雜的prompt,並簡單解釋了每一段的設計理由。

接下來,直接將ChatGLM生成的提示詞餵給「清影」。首先是簡單場景:
一個孩子在公園裏放風箏,陽光明媚,綠草如茵。
整體氛圍感還可以,光影效果比較自然,但AI在處理人物動作時缺乏物理邏輯的通病,細看畫面,「清影」也未能完全克服。
進一步,引入需要刻畫面部表情細節的場景:
一位老人在雨中等待失散多年的兒子,表情充滿期待與憂慮。
忽略手部動作極其細微的不自然(手指和腳趾動作,事實上目前大部分AI目前都無法理解),畫面中人物的質感和環境中雨滴的效果,幾乎以假亂真。
繼續設置更為複雜的情節,加入多角色互動:
兩位宇航員在太空站外進行緊急維修,背景是宇宙的浩瀚星空,對話中透露出緊張氣氛。

在經歷了一次效果不佳的生成和一次服務器忙碌宕機後,「清影」輸出的第二版視頻內容總算是有了清晰的“太空站”,但背景上的星空效果卻不如第一版。宇航員的外觀輪廓,似乎還有些異樣。
如果「清影」後續能支持通過提示詞微調視頻,而非只能再次生成、推倒重來的話,可玩空間應該會更大一些。
下一項,讓AI設計些意識流產物,抽象概念與視覺效果:
時間流逝的視覺表現,通過四季變換和物體衰敗的快速剪輯來展現。
在需要大量新奇創意,以及處理那些不用特別寫實的需求時,AI往往是比較願意發揮的。但可能因為提示詞中,四季變換和物體衰敗包含了過多的場景變化,嘗試了幾次生成之後,「清影」依然每次都選擇將畫面切割成四個甚至八個分鏡,搭配飽和度偏高的油畫風格。
最後,是ChatGLM認為的最高難度,創意與技術的結合:
一個未來城市的全景,展示飛行汽車、高樓大廈和懸浮屏幕,融合高科技與日常生活。
這種強調科幻感的提示詞,一般都需要AI脱離現實去創造。不確定是不是在訓練中,城市夜景、光影反射和未來科技這類素材喂的比較多,包括此前AI藍媒匯測試過的可靈大模型在內,在處理科幻感方面,效果都意外的優秀。
除文生視頻外,「清影」還提供了另一項主流AIGC功能,圖生視頻。
將巴黎奧運會開幕式授旗環節的神秘人照片上傳,要求「清影」製作其走上台階的動態效果。

最後的成像效果,人物動作部分基本是對的,但背後這個披風多少丟了些優雅。
不過,瑕不掩瑜,在手邊所有能用的視頻大模型中,「清影」也值得給一個高分。
國內玩家,領先Sora?
“讓大家體驗一下目前視頻生成這樣的事情,在每人可用的前提下能做到什麼程度,而不是關在實驗室裏,或者在很小的概率上生成出什麼東西。”
這是智譜AI CEO 張鵬,對於「清影」,以及視頻生成模型賽道的態度。
話裏話外,似乎指向的都是OpenAI遲遲沒有開放體驗的Sora。
事實上,“追趕OpenAI”一直是智譜AI被外界所熟知的標籤之一,張鵬就曾多次在公開場合提及,對標Open AI“是公司成立以來的目標”。
這一次,至少在發佈速度和實用性上,智譜AI確實領先了。
公開資料顯示,「清影」依託於智譜 AI 大模型團隊自研打造的新一代視頻生成大模型 CogVideoX。其前代模型CogVideo發佈於去年十一月並在之後被開源。
CogVideo 擁有 94 億參數,可根據文本描述生成 3D 環境,直接利用預訓練模型,避免了昂貴的訓練,並且完全支持中文 Prompt 輸入。
技術優化後,新發布的CogVideoX 的推理速度和前代相比提升了 6 倍之多。目前生成 6s 視頻,模型花費的理論時間是30秒。

在「清影」發佈後的媒體採訪中,張鵬不出意外也談到了Sora和AI商業化等熱點議題。
對於Sora,張鵬直言現階段的「清影」“和OpenAI、和世界頂級水平之間仍有差距”,暫時還無法做到在質量和視頻長度上與Sora對標。智譜AI的角色,仍是追趕者。
對於商業化,張鵬認為現階段不論是to C還是to B,談論大規模商業化都為時尚早。「清影」之所以選擇面向C端基本功能免費,但to B開放平台API付費,一方面考慮到“親民”,也就是降低門檻迅速攬客、鋪開;另一方面,視頻生成模型的成本還是“非常高”,智譜AI也確實需要多少收回一點現金。
實際上,目前手握美團、螞蟻、阿里、騰訊、小米、紅杉、高瓴等多家大廠和知名機構,以及中東石油巨頭沙特阿美旗下風投基金投融資的智譜AI,顯然不太可能是“缺錢的玩家”。
但在手握階段性成果之後,公司卻表現得相對剋制,非常現實。
唯一明顯走高的,大概就是市場對智譜AI、對國產視頻模型賽道的期待值了吧。
Lanmeih/今日話題
你體驗智譜AI的視頻大模型了嗎?評價如何?