Open AI的Sora視頻工具試圖跟上Runway - 彭博社
Rachel Metz
插圖:Nick Little for Bloomberg Businessweek在線流傳的一段視頻展示了三隻巨大長牙野獸在晶瑩的白雪中蹦跳,彷彿是國家地理紀錄片中的一幕——只是毛象在視頻攝像機發明之前已經滅絕了數千年。
OpenAI 在二月發佈了這段10秒的視頻片段,介紹了Sora,它的新人工智能軟件,可以將書面提示轉化為看起來驚人逼真的長達一分鐘左右的視頻。這一新功能以及圍繞它產生的瞬間熱潮,讓人回想起2022年底OpenAI推出ChatGPT時的情形,那一舉動瞬間顛覆了科技領域,並將人工智能推向公眾視野。
不過,這一次,OpenAI並不是在開創新局面,而是在努力趕上其他已經提供類似工具的初創公司。這次演示並沒有伴隨產品發佈或明確指示何時可能會發布。公司告訴彭博新聞,儘管一位高管最近表示該服務將在今年晚些時候發佈,但目前尚未設定Sora的時間表。
一年半前,Meta平台公司和谷歌展示了文本到視頻的研究項目,展示了簡單、幾秒鐘長、低分辨率的片段,其中包括一個融化的冰淇淋筒,一隻飛行的超級英雄狗和其他主題。Runway AI公司,迄今為止已經籌集了2.37億美元,去年三月發佈了Gen-2,引發了圍繞AI視頻生成器的狂熱。該服務可以根據提示生成略顯斷斷續續的三秒鐘視頻片段,比如“沙漠景觀的無人機鏡頭”。現在,聯合創始人兼首席執行官Cristóbal Valenzuela表示,它可以製作大約20秒的質量顯著提高的視頻。
Runway創始人(從左至右)Alejandro Matamala-Ortiz、Cristóbal Valenzuela和Anastasis Germanidis在曼哈頓的辦公室。攝影師:Justin J Wee/紐約時報/Redux其他AI初創公司,包括Haiper、Pika和Stability AI,也正在開發可以生成更復雜短視頻片段的工具,包括移動圖像和音效(想象一下培根在平底鍋中煎炸時發出的聲音)。這些初創公司推出了任何人都可以廉價或免費使用的視頻生成軟件。這些工具的進步速度甚至超過了一些一直在研究這項技術的人的預期,足以引起那些擔心視頻創作經濟學或複雜虛假信息傳播的人的擔憂。
即使Sora演示並非產品發佈,但Pika的聯合創始人兼首席執行官Demi Guo表示,這展示了技術的潛力。Pika去年底推出了其人工智能視頻製作軟件,已籌集了5500萬美元。“它展示了我們目前距離高質量視頻有多接近,以及我們距離更積極地商業化有多接近,” Guo説,並補充説,圍繞Sora的炒作已經幫助她的公司吸引更多潛在員工。
Valenzuela表示,Gen-2已經被數百萬人使用,包括製作和動畫工作室的專業人士,他們依靠它進行預觀和故事板設計。他説,電影編輯正在使用Runway創建視頻,並將其與其他鏡頭合併以製作B卷或視覺效果,他補充説,麥當娜在演唱會上使用它展示了一些視覺效果。Valenzuela表示,隨着Sora的推出,儘管AI視頻生成器仍處於萌芽階段,但現在已經“跨越了鴻溝”,進入了主流意識。
Paul Trillo,一位導演,他的作品包括福特F-150商業廣告、音樂視頻和實驗電影,表示他已經將AI圖像和視頻生成器整合到他的創作過程中一段時間了。作為Runway軟件的早期用户,他發現它讓他能夠探索更多概念和特效。他説他不認為AI會取代電影製作者,因為它無法複製人類創作的微妙或自發性。不過,“AI提供了一些更加迷人的東西,某種程度上比僅僅拿起相機更有趣,”他説。“你在這個混沌的海洋中探索,發現底部的這些奇異的寶石。”
Giada Pistilli,AI初創公司Hugging Face的首席倫理學家,表示這項技術有可能使為電影添加特效變得更加容易和便宜,這可能特別有助於低預算的電影製作者。但在她看來,負面影響,比如使傳播AI生成的虛假信息和色情內容變得更容易,超過了積極影響。“有人可能會説,‘Photoshop也是如此,任何已經存在的工具也是如此,’”她説。“我不同意。我會説,AI的第一個特點是它很容易擴展。”
Pistilli攝影師:Maelia Germain目前,這項技術存在明顯的侷限性。《彭博商業週刊》對Pika和Haiper的文本到視頻軟件,以及Runway的Gen-2和Stability AI的Stable Video進行的測試顯示,這些系統經常無法生成遵循簡單輸入提示的視頻。Sora尚未公開提供測試,但即使是一些OpenAI精心挑選的片段也顯示,讓物體忠實地遵循物理定律對視頻生成軟件仍然是一個棘手的問題。
使用AI生成視頻比運行聊天機器人或靜態圖像生成器更加計算密集,因此更昂貴且速度較慢。這些技術挑戰可能會影響視頻生成的商業模式,導致價格轉嫁給客户。Runway用户需要購買積分來使用其軟件,Valenzuela表示,用户大約需要花費1美元來生成20秒的視頻。價格可能會下降;通常隨着硬件和軟件的改進,技術會變得更加便宜。Valenzuela表示,專業動畫和視覺效果工作室可能會收取8000至25000美元或更多的費用,用於製作一分鐘的動畫或創作電影。他預測,到年底會有人制作一部至少60分鐘長的電影,其中每個場景都使用AI視頻生成器。
Guo表示,Pika可能在一年內擁有可以創建大約一分鐘長的高質量視頻片段的軟件,而在兩年內,它可以用來製作一部長片。但在那之前甚至可能會產生巨大影響:許多人在電影、廣告或社交媒體上觀看的視頻片段都不到10秒鐘。閲讀下一篇: 金牌程序員構建了一個可以替代他們工作的人工智能