對標Sora,快手發佈視頻生成大模型
贺喜格[email protected] 来撩

在OpenAI文生視頻大模型Sora發佈後,國內企業爭相入局,國產文生視頻大模型邁入加速階段。日前,快手“可靈”視頻生成大模型官網正式上線,官網放出數段展示視頻,並稱已開放邀測體驗。
以下是可靈官網展示的一段“一隻手將牛奶從鋼製打奶壺倒入桌上一杯咖啡中,背景為模糊的廚房”的視頻片段。

動圖截取有壓縮,畫質遜於展示視頻,效果以官網為準,下同
官網展示的一段小男孩吃漢堡的生成視頻,可以看到視頻細節較全面,包括漢堡咬下去的齒印、小男孩面部肌肉的運動、粘在嘴邊的殘渣等。

提示詞:一個戴眼鏡的中國男孩在快餐店內閉眼享受美味的芝士漢堡
除了吃漢堡,還有吃麪的。

提示詞:一箇中國男人坐在桌前,用筷子吃麪條
一段非專業人士難以區分是生成還是實拍的延時攝影。

官網展示了真實世界物理交互的視頻外,也展示了一些“想象力場景”,如一隻戴着眼鏡,喝咖啡看報紙的兔子。

據介紹,可靈大模型為快手AI團隊自研,採用類Sora的技術路線並結合多項自研創新技術。具備的能力包括:
能夠生成大幅度的合理運動;
能夠模擬物理世界特性;
具備強大的概念組合能力和想象力;
生成的視頻分辨率高達1080p,時長高達2分鐘(幀率30fps),且支持自由的寬高比。
目前官網顯示,快影App的AI創作功能中已正式開放文生視頻功能的邀測,支持創作者申請並體驗可靈大模型最新的文生視頻功能。圖生視頻功能也將於近期開放。
隨着AI大模型時代來臨,快手也動作頻頻。快手已先後發佈通用大語言模型“快意”、文生圖大模型產品“可圖”,還推出了Direct-a-Video、Video-LaVIT、I2V-Adapter、UNIAA等視頻關鍵技術。據悉,伴隨此次可靈大模型的發佈,快手將持續加速大模型的研發與應用。
本文系觀察者網獨家稿件,未經授權,不得轉載。