對標Sora，快手發佈視頻生成大模型

贺喜格[email protected] 来撩

2024-06-07

在OpenAI文生視頻大模型Sora發佈後，國內企業爭相入局，國產文生視頻大模型邁入加速階段。日前，快手“可靈”視頻生成大模型官網正式上線，官網放出數段展示視頻，並稱已開放邀測體驗。

以下是可靈官網展示的一段“一隻手將牛奶從鋼製打奶壺倒入桌上一杯咖啡中，背景為模糊的廚房”的視頻片段。

動圖截取有壓縮，畫質遜於展示視頻，效果以官網為準，下同

官網展示的一段小男孩吃漢堡的生成視頻，可以看到視頻細節較全面，包括漢堡咬下去的齒印、小男孩面部肌肉的運動、粘在嘴邊的殘渣等。

提示詞：一個戴眼鏡的中國男孩在快餐店內閉眼享受美味的芝士漢堡

除了吃漢堡，還有吃麪的。

提示詞：一箇中國男人坐在桌前，用筷子吃麪條

一段非專業人士難以區分是生成還是實拍的延時攝影。

官網展示了真實世界物理交互的視頻外，也展示了一些“想象力場景”，如一隻戴着眼鏡，喝咖啡看報紙的兔子。

據介紹，可靈大模型為快手AI團隊自研，採用類Sora的技術路線並結合多項自研創新技術。具備的能力包括：

能夠生成大幅度的合理運動；

能夠模擬物理世界特性；

具備強大的概念組合能力和想象力；

生成的視頻分辨率高達1080p，時長高達2分鐘（幀率30fps），且支持自由的寬高比。

目前官網顯示，快影App的AI創作功能中已正式開放文生視頻功能的邀測，支持創作者申請並體驗可靈大模型最新的文生視頻功能。圖生視頻功能也將於近期開放。

隨着AI大模型時代來臨，快手也動作頻頻。快手已先後發佈通用大語言模型“快意”、文生圖大模型產品“可圖”，還推出了Direct-a-Video、Video-LaVIT、I2V-Adapter、UNIAA等視頻關鍵技術。據悉，伴隨此次可靈大模型的發佈，快手將持續加速大模型的研發與應用。

本文系觀察者網獨家稿件，未經授權，不得轉載。