可靈開始“獨闖”，全面擁抱AI的快手能否嚐到“甜頭”？_風聞

港股研究社-旨在帮助中国投资者理解世界，专注报道港股。1小时前

2024-11-12

現任谷歌CEO桑達爾·皮查伊曾説到，“人工智能是我們人類正在從事的最為深刻的研究方向之一，甚至要比火與電還更加深刻。”

正如，Sora誕生時，在官方表述中被稱為“世界模擬器”，它理解真實的規則，並在此基礎上生成“世界”，AI視頻生成，乃至生成式AI本身都是意義非凡的。而在國內堪稱“封神之作”的快手可靈AI一直在努力接近並超越這一目標。

近日，快手正式在App Store上線了“可靈AI”獨立APP。天眼查數據顯示，就在同一日，快手關聯公司北京達佳互聯信息技術有限公司申請的“圖生視頻模型生成方法、視頻生成方法及裝置”專利也正式對外公佈。

此前，在產品側，快手“可靈AI”已形成了網頁版、APP、小程序、海外版等多端跨平台的產品矩陣。如今，獨立App的正式亮相又預示着什麼呢？

強化AI基因，用內容託舉基本盤

自6月正式發佈以來，從1.0版本到1.5版本，可靈AI已經完成超9次的升級迭代，新增多項實用功能，比如運動筆刷、對口型功能、1080P高清畫質等。而且，1.5版本的可靈AI，其生成的視頻在清晰度、運動流暢度和畫面美感上都擁有了質的飛躍。

圖源來自可靈AI

升級後的可靈AI，不僅清晰度提高了，還可以一次性生成多條視頻，圖生視頻時長擴展到10秒。最重要的是生成價格保持不變，“加量不加價”的背景下，視頻工作生成效率顯著提高。

而這一次正式落地的“可靈AI”獨立APP，從官方描述中，我們會發現其定位為新一代創意生產力平台，基於快手自研的可靈大模型和可圖大模型，提供視頻、圖片生成與編輯能力。

以快手首部AI短劇《山海奇鏡》為例，其由可靈AI提供深度技術支持，畫面展示從逐幀卡頓，到擺脱動態PPT既視感，畫面一致性、動作流暢度、視覺效果等各方面都大受好評，該短劇上線短短數日，播放量就突破了5000萬。

內容製作效率提高，內容製作方式更多樣化，此時最先歡呼的就是內容創作者們。據快手副總裁、大模型團隊負責人張迪透露，可靈AI上線4個月多以來，已擁有超過360萬用户，累計生成3700萬個視頻和超過一億張圖片，並在上線次月衝上了全球AI產品增長排行榜首。

顯而易見的是，可靈AI從孵化到成型，一直在強化自身的AI基因，這一些系列動作託舉的正是內容輸出能力。

最重要的一點是，在視頻內容創作上提質提效後，全鏈條的最終落點還是回到了短視頻平台。一方面，快手加速佈局短劇賽道，可靈AI的快速成長無疑是快手短劇提質鋪量的關鍵工具。另一方面，原本就出身短視頻賽道的快手，其平台用户們也因此被激活。

2024年上半年，近2萬名商家在快手藉助AI矩陣優化經營。另外，第二季度來自營銷客户的AIGC營銷素材消耗單日峯值達2000萬元。而在電商領域，在大模型加持下搜索GMV同比提升超80%。

此外，在短視頻平台激烈的競爭之下，快手的用户活躍也並沒未受到影響。QuestMobile最新發布的數據顯示，截至2024年9月，該行業的月活躍用户規模已經突破10億大關，達到了前所未有的10.26億人次。

如此一來，快手藉助AI賦能內容創作，不僅使用户基本盤穩中有進，也盤活了自身業務保持長期增長的潛力。

巨頭緊跟可靈步伐，快手持續領跑

快手上線“可靈AI”獨立APP的同一天，字節跳動旗下大模型AI助手豆包也正式推出了視頻生成內測。據豆包官網介紹，豆包視頻生成支持圖片文字一鍵成片，能將信息轉化為生動逼真的視頻內容。

此外，今年2月，阿里也上線了一款AI圖片-音頻-視頻模型技術EMO，用户只需要提供一張照片和一段任意音頻文件，EMO即可生成會説話唱歌的AI視頻，以及實現無縫對接的動態小視頻，最長時間可達1分30秒左右。

由於視頻是移動互聯網最大的內容消費形式，AI視頻生成領域也瞬間成了各大互聯網巨頭眼中的香餑餑，大家紛紛不約而同的“冒頭”。

目前，DiT和語言模型是目前AI視頻生成領域最受關注的兩條技術路徑。其中，語言模型在國內更占主導地位，主要是通過文字、圖片、視頻作為提示詞來進行憑空生產。

受算力、數據、算法的限制，儘管創意空間無限，所有的元素都是全新的，但現階段最大的阻礙仍然是成本。因此，在這一條件下，產品側的各位均處於統一起跑線，漫漫長路在前方，難分孰強孰弱。

但隨着推理成本持續下降，生成速度相應提高，應用層和商業化的發展進一步明朗。視頻生成內容逐漸滲透到各內容種類式，比如本土TVC視頻、動畫動漫、流水線短劇、本土動畫電影等。

由此可見，AI視頻生成賦能傳統視頻工作時，其主要價值就在於素材生成環節。而電影等長視頻題材受累於高昂的製作成本，並不是現階段AI視頻生成的優勢賽段，由此短劇的“獨特性”再次被凸顯。

快手可靈AI有《山海奇鏡》，抖音的即夢AI有《三星堆：未來啓示錄》。此外，井英科技也針對性的自研了短劇視頻生成模型Reel Diffusion，其推出的AI短片《M.A.D》已經可以媲美傳統動畫短片。

相較之下，快手雖有明顯的先發優勢，但也不得不提防後來者的窮追不捨。技術硬實力是一方面，落地的製作效果也是觸達用户的關鍵一環，兩者皆不可失。雖然快手無需如臨大敵，但也需時刻謹慎。

從AI視頻生成到生成式AI，它的想象空間不止如此

儘管，現階段的AI視頻生成賽道開始日漸擁堵，但回看AI視頻生成應用，其本質是生成式AI，最大的特點就是從無到有的去創造。

從ChatGPT的顛覆到Sora的驚豔，再到國產Sora——可靈AI的面世，這一切歸功於生成式AI的可塑性。正如Sora官方所説，它是“世界模擬器”，它理解真實的規則，並由此生成“世界”。

因此，無論是文生圖，還是文生視頻，生成式AI的潛力都不可估量。這好比汽車行業正在發生的變革。以前的自動駕駛，需要靠人力來堆砌算法，窮盡儘可能多的駕駛場景，而到今天，採用“端到端”的大模型技術訓練後，AI模型先自學在運用，已經強於不少真人駕駛，也跳出了最早的印象。

當探討當今生成式AI所帶來的變革性機遇時，“互聯網”這一詞彙頻繁被提及，它既是參照物，也是AI實現顛覆性創新的基礎。

圖源來自Pixabay

就像在過去的三十年裏，互聯網浪潮的核心在於“連接”，它緊密地將人、信息、商業及工廠相互聯結，同時涵蓋海量信息，並通過增進全球協作效率，催生了難以估量的價值，由此深刻重塑了人類的生活方式。

儘管過去AI的發展重心更多聚焦於模擬人類的感知能力，諸如對海量信息進行自然語言理解、語音識別以及視覺識別等。但隨着大模型技術的逐漸成熟，生成式AI已不再侷限於感知層面的，更是首次展現出在思考推理與創造性方面的強大潛力。

基於此，生成式AI從創造相對已知，到創造絕對未知，或許不無可能。此時，生成式AI創造的內容價值將更勝從前，甚至於與真實的物理世界產生關聯，幫助人們完成實際的業務、工作與學習。

這也正是變革的關鍵。

一年以前，大部分企業或許對於生成式AI如何賦能市場尚存疑問，各類細分賽道尚未分化，專供各個行業的垂直應用也並不成熟，但在一年後的今天，隨着算力、推理等成本的逐漸下降，以及大量實踐和試錯，端到端模型、行業大模型、文生圖應用、文生視頻應用接踵而來。

長遠來看，生成式AI的當下是清晰的，未來更是明朗的。而對手握佳作“可靈AI”的快手來説，儘管去闖，儘管去放飛想象，未來始終會有你的一席之地。

作者：土耳其熱氣球

來源：港股研究社