可靈開始“獨闖”,全面擁抱AI的快手能否嚐到“甜頭”?_風聞
港股研究社-旨在帮助中国投资者理解世界,专注报道港股。1小时前
現任谷歌CEO桑達爾·皮查伊曾説到,“人工智能是我們人類正在從事的最為深刻的研究方向之一,甚至要比火與電還更加深刻。”
正如,Sora誕生時,在官方表述中被稱為“世界模擬器”,它理解真實的規則,並在此基礎上生成“世界”,AI視頻生成,乃至生成式AI本身都是意義非凡的。而在國內堪稱“封神之作”的快手可靈AI一直在努力接近並超越這一目標。
近日,快手正式在App Store上線了“可靈AI”獨立APP。天眼查數據顯示,就在同一日,快手關聯公司北京達佳互聯信息技術有限公司申請的“圖生視頻模型生成方法、視頻生成方法及裝置”專利也正式對外公佈。
此前,在產品側,快手“可靈AI”已形成了網頁版、APP、小程序、海外版等多端跨平台的產品矩陣。如今,獨立App的正式亮相又預示着什麼呢?
強化AI基因,用內容託舉基本盤
自6月正式發佈以來,從1.0版本到1.5版本,可靈AI已經完成超9次的升級迭代,新增多項實用功能,比如運動筆刷、對口型功能、1080P高清畫質等。而且,1.5版本的可靈AI,其生成的視頻在清晰度、運動流暢度和畫面美感上都擁有了質的飛躍。
圖源來自可靈AI
升級後的可靈AI,不僅清晰度提高了,還可以一次性生成多條視頻,圖生視頻時長擴展到10秒。最重要的是生成價格保持不變,“加量不加價”的背景下,視頻工作生成效率顯著提高。
而這一次正式落地的“可靈AI”獨立APP,從官方描述中,我們會發現其定位為新一代創意生產力平台,基於快手自研的可靈大模型和可圖大模型,提供視頻、圖片生成與編輯能力。
以快手首部AI短劇《山海奇鏡》為例,其由可靈AI提供深度技術支持,畫面展示從逐幀卡頓,到擺脱動態PPT既視感,畫面一致性、動作流暢度、視覺效果等各方面都大受好評,該短劇上線短短數日,播放量就突破了5000萬。
內容製作效率提高,內容製作方式更多樣化,此時最先歡呼的就是內容創作者們。據快手副總裁、大模型團隊負責人張迪透露,可靈AI上線4個月多以來,已擁有超過360萬用户,累計生成3700萬個視頻和超過一億張圖片,並在上線次月衝上了全球AI產品增長排行榜首。
顯而易見的是,可靈AI從孵化到成型,一直在強化自身的AI基因,這一些系列動作託舉的正是內容輸出能力。
最重要的一點是,在視頻內容創作上提質提效後,全鏈條的最終落點還是回到了短視頻平台。一方面,快手加速佈局短劇賽道,可靈AI的快速成長無疑是快手短劇提質鋪量的關鍵工具。另一方面,原本就出身短視頻賽道的快手,其平台用户們也因此被激活。
2024年上半年,近2萬名商家在快手藉助AI矩陣優化經營。另外,第二季度來自營銷客户的AIGC營銷素材消耗單日峯值達2000萬元。而在電商領域,在大模型加持下搜索GMV同比提升超80%。
此外,在短視頻平台激烈的競爭之下,快手的用户活躍也並沒未受到影響。QuestMobile最新發布的數據顯示,截至2024年9月,該行業的月活躍用户規模已經突破10億大關,達到了前所未有的10.26億人次。
如此一來,快手藉助AI賦能內容創作,不僅使用户基本盤穩中有進,也盤活了自身業務保持長期增長的潛力。
巨頭緊跟可靈步伐,快手持續領跑
快手上線“可靈AI”獨立APP的同一天,字節跳動旗下大模型AI助手豆包也正式推出了視頻生成內測。據豆包官網介紹,豆包視頻生成支持圖片文字一鍵成片,能將信息轉化為生動逼真的視頻內容。
此外,今年2月,阿里也上線了一款AI圖片-音頻-視頻模型技術EMO,用户只需要提供一張照片和一段任意音頻文件,EMO即可生成會説話唱歌的AI視頻,以及實現無縫對接的動態小視頻,最長時間可達1分30秒左右。
由於視頻是移動互聯網最大的內容消費形式,AI視頻生成領域也瞬間成了各大互聯網巨頭眼中的香餑餑,大家紛紛不約而同的“冒頭”。
目前,DiT和語言模型是目前AI視頻生成領域最受關注的兩條技術路徑。其中,語言模型在國內更占主導地位,主要是通過文字、圖片、視頻作為提示詞來進行憑空生產。
受算力、數據、算法的限制,儘管創意空間無限,所有的元素都是全新的,但現階段最大的阻礙仍然是成本。因此,在這一條件下,產品側的各位均處於統一起跑線,漫漫長路在前方,難分孰強孰弱。
但隨着推理成本持續下降,生成速度相應提高,應用層和商業化的發展進一步明朗。視頻生成內容逐漸滲透到各內容種類式,比如本土TVC視頻、動畫動漫、流水線短劇、本土動畫電影等。
由此可見,AI視頻生成賦能傳統視頻工作時,其主要價值就在於素材生成環節。而電影等長視頻題材受累於高昂的製作成本,並不是現階段AI視頻生成的優勢賽段,由此短劇的“獨特性”再次被凸顯。
快手可靈AI有《山海奇鏡》,抖音的即夢AI有《三星堆:未來啓示錄》。此外,井英科技也針對性的自研了短劇視頻生成模型Reel Diffusion,其推出的AI短片《M.A.D》已經可以媲美傳統動畫短片。
相較之下,快手雖有明顯的先發優勢,但也不得不提防後來者的窮追不捨。技術硬實力是一方面,落地的製作效果也是觸達用户的關鍵一環,兩者皆不可失。雖然快手無需如臨大敵,但也需時刻謹慎。
從AI視頻生成到生成式AI,它的想象空間不止如此
儘管,現階段的AI視頻生成賽道開始日漸擁堵,但回看AI視頻生成應用,其本質是生成式AI,最大的特點就是從無到有的去創造。
從ChatGPT的顛覆到Sora的驚豔,再到國產Sora——可靈AI的面世,這一切歸功於生成式AI的可塑性。正如Sora官方所説,它是“世界模擬器”,它理解真實的規則,並由此生成“世界”。
因此,無論是文生圖,還是文生視頻,生成式AI的潛力都不可估量。這好比汽車行業正在發生的變革。以前的自動駕駛,需要靠人力來堆砌算法,窮盡儘可能多的駕駛場景,而到今天,採用“端到端”的大模型技術訓練後,AI模型先自學在運用,已經強於不少真人駕駛,也跳出了最早的印象。
當探討當今生成式AI所帶來的變革性機遇時,“互聯網”這一詞彙頻繁被提及,它既是參照物,也是AI實現顛覆性創新的基礎。
圖源來自Pixabay
就像在過去的三十年裏,互聯網浪潮的核心在於“連接”,它緊密地將人、信息、商業及工廠相互聯結,同時涵蓋海量信息,並通過增進全球協作效率,催生了難以估量的價值,由此深刻重塑了人類的生活方式。
儘管過去AI的發展重心更多聚焦於模擬人類的感知能力,諸如對海量信息進行自然語言理解、語音識別以及視覺識別等。但隨着大模型技術的逐漸成熟,生成式AI已不再侷限於感知層面的,更是首次展現出在思考推理與創造性方面的強大潛力。
基於此,生成式AI從創造相對已知,到創造絕對未知,或許不無可能。此時,生成式AI創造的內容價值將更勝從前,甚至於與真實的物理世界產生關聯,幫助人們完成實際的業務、工作與學習。
這也正是變革的關鍵。
一年以前,大部分企業或許對於生成式AI如何賦能市場尚存疑問,各類細分賽道尚未分化,專供各個行業的垂直應用也並不成熟,但在一年後的今天,隨着算力、推理等成本的逐漸下降,以及大量實踐和試錯,端到端模型、行業大模型、文生圖應用、文生視頻應用接踵而來。
長遠來看,生成式AI的當下是清晰的,未來更是明朗的。而對手握佳作“可靈AI”的快手來説,儘管去闖,儘管去放飛想象,未來始終會有你的一席之地。
作者:土耳其熱氣球
來源:港股研究社