可靈AI發佈升級版系列模型 開啓視頻生成2.0時代
【環球網科技綜合報道】4月15日,可靈AI在北京舉行“靈感成真”2.0模型發佈會,宣佈基座模型再次升級。此次升級涵蓋視頻生成領域的可靈2.0模型和圖像生成領域的可圖2.0模型。
數據顯示,自2024年6月首次發佈以來,可靈AI已完成20餘次技術迭代,目前全球註冊用户超過2200萬。來自150多個國家和地區的1.5萬餘家開發者與企業,將可靈的API應用於不同的行業場景中。
可靈AI全系模型升級,重新定義人與AI的交互方式
據悉,本次升級主要圍繞模型基礎性能提升展開。可靈2.0模型在動態表現、語義理解、視覺美感等關鍵技術指標達到行業領先水平;可圖2.0模型則優化了指令執行精度與藝術風格呈現效果。據團隊內部評估,在文字相關性、畫面清晰度等核心維度較前代產品有顯著改進。
自去年6月發佈以來,可靈AI已累計完成超20次迭代。3月27日,全球知名AI基準測試機構Artificial Analysis發佈了最新的全球視頻生成大模型榜單,快手可靈1.6pro(高品質模式)以1000分的Arena ELO基準測試評分登陸圖生視頻(Image to Video)賽道榜首。
截至目前,可靈AI全球用户規模已突破2200萬,累計生成1.68億個視頻及3.44億張圖片素材。自去年6月上線至今的10個月時間裏,可靈AI的月活用户數量增長25倍。

快手高級副總裁蓋坤認為,AI在輔助創意表達上擁有巨大潛力,但當前的行業發展現狀還遠遠無法滿足用户需求,在AI生成內容的穩定性、以及用户複雜創意的精確傳達上仍有“很多挑戰”。也因此,要真正實現“用AI講好每一個故事”的願景,必須對基模型能力進行全方位提升,定義人和AI交互的“全新語言”。
一直以來,可靈AI致力於提升模型基礎質量和模型效果,並引入更多創新功能,以滿足用户的多樣化需求。在本次2.0模型的迭代中,可靈AI正式發佈AI視頻生成的全新交互理念Multi-modal Visual Language(MVL),該模式通過整合文本指令與多模態參考素材(含圖像、視頻片段),幫助用户更精準地傳達創作意圖。快手高級副總裁蓋坤錶示:“單純的文字描述難以完整呈現影像信息,我們需要建立更高效的人機交互語言。”
基於此理念開發的編輯工具支持用户通過圖文混合輸入,實現對視頻內容的增刪改操作。現場演示顯示,系統可快速解析用户提供的參考圖,完成場景替換、角色調整等複雜編輯任務。

可靈2.0大師版發佈,上線多模態視頻編輯功能
基於MVL這一全新交互方式,發佈會現場,快手副總裁、可靈AI負責人張迪發佈了全新的可靈2.0大師版,在語義響應、動態質量、畫面美學等方面顯著提升生成效果。
“可靈2.0大師版不僅僅是一次簡單的技術升級,更是一次全方位的體驗躍升。”張迪介紹,可靈2.0大師版實現了技術、體驗、美學的三重突破。

值得一提的是,可靈2.0大師版全面升級視頻及圖像創作可控生成與編輯能力,上線全新的多模態視頻編輯功能,能靈活理解用户意圖。支持在一段視頻的基礎之上,通過輸入圖片或文字,對生成的視頻內容實現元素的增加、刪減、替換,幫助創作者們實現更加靈活的二次編輯和處理。

張迪披露,當前,圖生視頻約佔到可靈AI視頻創作量的85%,圖片質量也對視頻的生成效果產生重要作用。
張迪介紹,可圖2.0文生圖能力迎來全面升級。包括大幅提升指令遵循能力、顯著增強電影美學表現力以及更多元的藝術風格。在風格化響應上,可圖2.0可支持60多種風格化的效果轉繪,模型出圖創意和想象力實現大幅躍升。
同時,可圖2.0也上線了實用的圖像可控編輯功能——局部重繪和擴圖,支持圖片的增加、修改和修復。在圖像的多模態可控生成中,可圖2.0還上線了全新的風格轉繪功能,只需要上傳一張圖片加上風格描述,就能一鍵切換圖片的藝術風格,同時精準保留原圖的語義內容。
AIGC**技術賦能,為全行業發展注入新活力
除了C端訂閲用户,可靈AI也面向B端商家提供API接入等服務。目前,可靈AI已與包括小米、亞馬遜雲科技、阿里雲、Freepik、藍色光標等在內的數千家國內外企業客户建立了合作關係,為廣告營銷、專業創作、影視製作、娛樂創意等領域提供技術支持。
蓋坤披露,來自世界各地的超1.5萬開發者,已將可靈的API應用於不同的行業場景中,累計生成的圖像數量約1200萬個,生成的視頻素材超過4000萬個。
據二次元創作平台狸譜負責人一休介紹,接入可靈AI後,平台動態效果處理能力顯著提升,近期推出的"新春萌偶搖"活動獲得60萬次傳播。
可靈AI超級創作者、《新世界加載中》總導演、異類Outliers創始人陳翔宇分享了影視製作中的應用經驗:“相比傳統拍攝,AIGC技術極大擴展了創作可能性。我們已完成首部全程依託AI生成的劇集級作品,驗證了其在工業化生產中的可行性。”

為了進一步激發AI愛好者們的創作熱情,快手副總裁、可靈AI負責人張迪發起“可靈AI NextGen 新影像創投計劃”。該計劃將加大對於AIGC創作者的扶持力度,通過千萬資金投入、全球宣發、IP打造和保障,以全資出品、聯合出品和技術支持等靈活多樣的合作方式,讓AI好故事走向世界。同時,可靈AI面向全球創作者發出徵集邀約,邀請用户共同打造全球首支用户共創AI創意短片,讓創作者的靈感和創意登陸上海、香港、東京、巴黎、多倫多等世界多地廣告大屏。
面向未來,蓋坤錶示,可靈AI將持續大力推動技術創新,用人與AI交互的全新語言,幫助用户實現複雜創意的精確表達,“我們的初心,是讓每個人都能用AI講出好的故事,我們也真切地希望這一天更快到來”。(心月)