OpenAI的Sora視頻生成器令人印象深刻,但尚未準備好投入實際運用 - 彭博社
Shirin Ghaffary, Rachel Metz
本週,我們獨家獲得了OpenAI新的文本到視頻軟件Sora的獨家預覽,迅速吸引了人工智能和媒體界的注意。但首先…
三件事情要知道:
• 由於人工智能推動銷售,英偉達股價上漲了大約九個月來的最多• 谷歌正在深入開源,推出其Gemma AI模型• 印度的科技領袖們正在爭奪3000億美元人工智能市場的一部分
猴子們的嬉戲
想象一下:一隻色彩斑斕的鸚鵡飛過一片鬱鬱葱葱的哥斯達黎加叢林,落在一棵樹枝上和一羣猴子一起吃水果。這是黃金時刻;陽光照射在樹葉和猴子的白色皮毛上。
基本上,這就是我們要求OpenAI的研究人員使用Sora為我們創建的場景,這是這家初創公司的新文本到視頻生成器。 上週揭幕,Sora可以對簡單的書面提示做出高清晰度長達一分鐘的視頻回應。OpenAI分享了令人印象深刻的電影片段,比如可愛的金毛幼犬在雪地裏嬉戲,一對夫婦在東京街頭漫步,以及戲劇性地掃視相機穿過一個博物館畫廊。Sora展示了人工智能生成視頻的快速發展,這距離Meta和谷歌預告類似研究項目展示短小、低分辨率視頻僅一年半的時間。幾乎立即,OpenAI的Sora公告引發了人們對其改變電影製作方式潛力的恐懼和興奮,但這些反應還為時過早。Sora仍然是一個研究項目,很少有人可以使用它,在我們與OpenAI的私人演示期間,該工具存在明顯的限制。我們給了OpenAI四個提示,其中兩個是由Sora團隊為我們生成的。(該公司表示由於研究人員的時間限制,沒有運行另外兩個。)在最令人印象深刻的例子中,一個10秒的片段展示了一隻鸚鵡飛過叢林,第一次觀看時沒有明顯的問題。但當我們再次觀看時,我們發現了一些問題 — 當它飛過猴子時,鸚鵡的翅膀被扭曲了,雖然我們只要求了一隻鸚鵡,但有幾隻鸚鵡,而且其中一隻猴子在最後似乎有一隻鸚鵡的尾巴。
“在那段視頻中,你會發現一些奇怪的動作,”OpenAI研究科學家比爾·皮布爾斯告訴我們。“但Sora能夠模擬具有這種複雜程度的場景表明視頻生成能力已經出現了明顯的飛躍。”
OpenAI並沒有設定Sora發佈的時間表,因為該公司希望確保能充分減輕與選舉相關的安全風險,OpenAI發言人娜塔莉·薩默斯表示。隨着2024年世界上許多地區的選民有資格投票,許多政治人物、虛假信息研究人員和技術專家對使用超逼真的AI換臉技術來欺騙選民的風險提出了擔憂,這使得現在釋放一款強大的新視頻生成工具成為一個值得商榷的時機。
但儘管存在安全顧慮,OpenAI表示Sora在準備投入主流市場之前還有很長的路要走。首先,還有許多技術挑戰需要解決,包括前述的肢體偏離問題和對物理學的混合理解 —— 這些問題OpenAI在一份Sora的技術報告中指出。這些問題對於其他致力於生成視頻的人,比如Runway,也是具有挑戰性的。
Sora顯然還需要更多的時間 —— 以及計算能力 —— 來生成每個視頻,而不是像OpenAI的Dall-E 3那樣生成單個圖像所需的時間。OpenAI不會準確地説Sora每個請求需要多長時間,但皮布爾斯表示這“絕對不是瞬間完成的。”
“你可以在等待這些事情運行的時候去拿點零食,”他説。
**對AI有疑問嗎?**給我發電子郵件,Shirin Ghaffary,我會盡量在未來的新聞簡報中回答你的問題。
機器人失誤
谷歌週四表示,由於批評AI模型處理種族描繪的方式,將暫時阻止 Gemini 生成人物圖像。一些社交媒體用户 — 包括許多右翼賬號,他們利用這一事件批評他們認為是“喚醒文化”的行為 — 發佈了嘗試讓 Gemini 生成白人圖像的失敗截圖。用户表示,他們要求 Gemini 製作教皇或維京人的圖像,卻只收到有色人種的圖像。其他人表示,他們要求 Gemini 生成開國元勳的圖像,卻得到了幾幅有色人種的描繪。
Gemini 的結果似乎是對一個非常真實的問題的過度糾正。大型語言AI模型和圖像生成器存在對白人的偏見。這主要是因為這些服務是建立在反映歷史偏見的龐大數據集之上的 — 或者甚至可能比現實世界更有偏見。正如彭博社之前所報道的,一個領先的圖像生成器很少將女性描繪為醫生,更有可能展示有深色皮膚的男性犯罪。雖然AI公司已經承認了這個問題,但要消除他們工具所建立的數據的偏見並不容易。公司可以嘗試微調他們的AI模型以使結果多樣化,但這可能會很具有挑戰性。一位谷歌 Gemini 產品高級總監在 X 上發帖稱公司“設計其圖像生成能力”以反映“全球用户羣”。但這位高級總監承認歷史圖像“更加微妙”,團隊將“進一步調整以適應”,稱這些修復是“對齊過程的一部分”。
Gemini不是本週唯一出現故障的AI工具。週二晚上,OpenAI的ChatGPT出現了故障。對於簡單的問題,這個聊天機器人開始在瘋狂的循環中重複隨機短語,用西班牙式英語回答問題,並且提供了一些混合的隱喻,幾乎可以當作現代詩歌。OpenAI 後來歸咎於 語言處理模型的“bug”。大型語言模型會為單詞分配數字,並根據概率部分地給出回應。然而,在這種情況下,OpenAI表示“模型選擇了稍微錯誤的數字”。效果就像“迷失在翻譯中”一樣。ChatGPT在深夜崩潰,雖然很有趣,但也提醒了我們即使是最尖端的生成式AI系統也可能出現故障。谷歌、OpenAI和其他科技公司正在競相將AI工具整合到我們工作、創造和相互交流的基本結構中。但這些服務距離足夠可靠,可以依賴它們代表我們行事而不需要真正的人進行理智檢查,還有很長的路要走。
本週人物語錄
“加速計算和生成式AI已經達到了臨界點。”****Jensen HuangNvidia CEO
Nvidia 股價在週四大漲,因為公司的業績和預測超出了華爾街的預期,這要歸功於對其AI芯片的不可滿足的需求。在 言論中週三,黃先生表示:“一個全新的行業正在形成,這推動了我們的增長。”### 值得關注
Thrive Global首席執行官Arianna Huffington表示,超個性化人工智能可以幫助人類養成更健康的日常習慣。Bloomberg### 深度學習
- 孫正義希望將SoftBank打造成一個人工智能強國
- OpenAI的Sam Altman正在尋求美國政府的批准,以籌集數十億美元用於人工智能芯片
- 每個市場現在都在追捧人工智能熱潮,正如這些圖表所顯示的
- Reddit已經與Google達成內容許可協議
- 瞭解一下ElevenLabs,這家人工智能初創公司的技術已經被用來模仿政治候選人並推廣欺詐性產品
更多來自彭博社
獲取科技日報以及更多彭博科技週刊,請訂閲:
- 網絡安全簡報,報道黑客和網絡間諜的陰影世界
- 遊戲時代,報道視頻遊戲業務
- 電源啓動,提供蘋果獨家新聞、消費者科技新聞等
- 銀幕時光,報道好萊塢和硅谷的碰撞
- 聲音碎片,報道播客、音樂行業和音頻趨勢
Nvidia Corp.在芯片製造商發佈了另一個令人瞠目結舌的銷售預測後,股價上漲了大約九個月來的最多,為已經使其成為全球市值最高的芯片製造商的股票漲勢增添了新的動力。
公司在本期的收入將達到約240億美元,週三在一份聲明中表示。分析師平均預測為219億美元。第四季度的業績也大大超過了華爾街的預期。
黃仁勳攝影師:Lionel Ng/Bloomberg這一展望延續了Nvidia超越預期的連續表現,得益於對其人工智能加速器的無盡需求——這些備受推崇的芯片為人工智能模型處理數據。這項技術已經幫助推動了聊天機器人和其他生成式人工智能服務的大量發展,這些服務可以根據簡單的提示創建文本和圖形。
“加速計算和生成式人工智能已經達到了臨界點,”首席執行官黃仁勳在聲明中表示。“全球範圍內的公司、行業和國家的需求激增。”
週四紐約收盤時,股價飆升了16%,至785.38美元,創下歷史新高,也是自五月以來的最大單日漲幅。

收聽 • 17分鐘6秒
Bloomberg Daybreak: Nvidia Surges & Corporate Shakeups (Podcast)
Nvidia的市值今年已增加了6500億美元以上,使其估值達到1.89萬億美元,投資者押注該公司將繼續成為人工智能計算繁榮的主要受益者。
這使得週三的報告成為華爾街和科技界都極為期待的事件。而隨着黃先生的樂觀態度和數字的公佈,人們對支出將保持強勁的信心得到了恢復。
另外,預計將從人工智能增長中受益的另外三家芯片製造商——先進微設備公司、博通公司和馬維爾科技公司的股價也在週四上漲。
“整個市場都在關注這份報告,預期已經提高,”Wolfe Research分析師克里斯·卡索在一份報告中表示。指導意見足夠強勁,可以“證明持續的勢頭,同時也為下半年的持續上行留下了空間。”
新週期
在分析師電話會議上,黃先生表示,對Nvidia最新產品的需求將在今年餘下時間繼續超過供應。儘管供應正在增長,但需求並沒有顯示出任何放緩的跡象。
“生成式人工智能已經開啓了一個全新的投資週期,”黃先生説道。這將導致未來五年全球數據中心的安裝基數翻倍,“代表了數千億美元的年度市場機會,”他説。
Nvidia於1993年由黃先生共同創立,最初是為電腦遊戲玩家提供圖形卡的供應商。在過去兩年裏,該公司的技術被證明能夠處理繁重的人工智能工作負載,其H100加速器在科技界已經成為傳奇,客户爭相獲取儘可能多的產品。
像亞馬遜公司這樣的公司亞馬遜公司,Meta平台公司,微軟公司和Alphabet公司的谷歌是英偉達最大的客户,佔其收入的近40%,它們正急於投資於人工智能計算的硬件。
觀看:彭博智庫的Kunjan Sobhani討論了英偉達的收益和銷售預測。
在截至1月28日的財政第四季度,英偉達的收入增至221億美元,超過了三倍。不包括某些項目的利潤為每股5.16美元。分析師預測銷售額約為204億美元,每股收益為4.60美元。突顯其最近增長勢頭的重要性:就在2021年,英偉達的整年收入還沒有達到這個水平。
英偉達的數據中心部門,現在是其最大的銷售來源,收入達到184億美元,比去年同期增長了409%。遊戲芯片提供了28.7億美元的銷售額。
英偉達現在正在努力將其人工智能技術推廣到大數據中心以外的領域。61歲的黃先生已經周遊全球,主張政府和公司需要擁有自己的人工智能系統,既能保護他們的數據,又能獲得競爭優勢。
英偉達的數據中心部門取得了爆炸性增長
對人工智能相關基礎設施的支出推動了收入增長
來源:公司數據
英偉達本月早些時候宣佈與思科系統公司達成了一項協議,為其提供了一個新的分銷渠道。作為該協議的一部分,全球最大的網絡設備提供商思科將幫助向公司銷售完整的人工智能系統。
閲讀更多: 英偉達、思科將幫助公司構建內部人工智能計算
但英偉達面臨風險,包括日益激烈的競爭以及一些客户推動開發自己的人工智能芯片。
AMD最近開始銷售名為MI300的加速器產品線。預計今年該產品將實現35億美元的收入,高於之前的20億美元的預期。不過,英偉達並未停滯不前。分析師們預計該公司將很快推出更強大的加速器。
英偉達還不得不應對前往中國的芯片的新出口規定,中國是半導體的最大市場。為了繼續向該地區銷售產品,該公司已經降低了產品的功能。過去,中國市場佔據了英偉達四分之一的收入。三個月前,首席財務官科萊特·克雷斯告訴分析師,如果不是中國的規定,公司的預期收入將更高。
就數據中心收入而言,中國在第四季度佔據了中等單個數字的百分比。“我們預計在第一季度它將保持在類似的範圍內,”克雷斯週三表示。
該公司已經開始向中國客户發送符合限制的新芯片樣品,黃仁勳表示。這將有助於業務再次復甦。
“我們將盡最大努力在這個市場競爭並取得成功,”黃仁勳説。