人工智能的3440億美元“語言模型”賭注看起來脆弱 - 彭博社
Parmy Olson
攝影師:利昂內爾·博納文圖爾/法新社每個投資者都知道不要把所有的雞蛋放在一個籃子裏。那麼,為什麼硅谷只押注於一種構建人工智能的方式呢?
今年,全球四大科技公司 將花費3440億美元用於人工智能,主要用於訓練和運行所謂的大型語言模型(LLMs)的數據中心,這些模型可以處理文本、音頻和視覺內容。這項技術在很大程度上是基於預測序列中下一個出現的標記的相同技術。
當然,他們的支出並非全無意義。個人使用的聊天機器人 已經在快速增長,一些人工智能初創公司開始實現盈虧平衡,企業仍在利用生成性人工智能的早期階段進行自我提升。大型語言模型代表了第一種在巨大規模上實現主流採用的人工智能技術:例如,每週有超過7億人使用ChatGPT。
彭博社觀點* 風能和太陽能會提高能源價格嗎?這要看情況
- 共和黨的福音派基礎需要警惕
- 因愛潑斯坦而流放安德魯不足以修復王室
- 艾瑪·湯普森的NSFW咆哮正是人工智能熱潮所需要的 但歷史上充滿了那些對單一“獲勝”技術方法過於執着的人,他們在環境突然變化時卻落後了。想想黑莓對物理鍵盤的執着,直到蘋果公司用觸摸屏將其擊垮,或者雅虎在門户網站上的重大賭注,而谷歌卻悄然主導了搜索。
一種新穎的人工智能方法是否會突然顛覆所有投入聊天機器人技術的資本?也許會。中國的DeepSeek在一月份發佈了一種更小、更高效的模型,並在網上發佈了其藍圖,提供瞭如何以非常規方法 讓市場感到驚訝 的一瞥。
DeepSeek的模型是一個大型語言模型,但其方法表明,今天投入人工智能研究的所有資源推動了一股潮流,可以提升其他領域。通過其歷史,人工智能一直通過將過去的見解與新想法相結合而向前發展,而對超智能機器的追求可能也不例外。
現在,許多探索發生在像Covariant這樣的地方,這是一家位於灣區的初創公司,正在開發軟件以幫助機器感知其周圍空間,而不是在數據中篩選模式。專注於機器人技術和無人機、藥物發現或氣候建模的公司,往往自然地遠離語言模型的痴迷,因為他們的技術需要即時響應物理世界的條件。
Atman Labs是一家英國初創公司,正在挖掘深度學習出現之前的想法,這些想法“也很重要,但已被遺忘,”聯合創始人Sumon Sadhu表示。他們的路徑與谷歌DeepMind多年努力通過不同途徑構建超智能人工智能的努力相呼應——從像AlphaGo這樣的遊戲AI系統到一種稱為強化學習的基於模擬的技術——直到ChatGPT的發佈將公司的全部焦點轉向大型語言模型。
現在,大型語言模型理論出現了一些裂痕,從令人矚目的成本到收益遞減的前景。OpenAI或谷歌的最新模型僅比舊模型稍微好一些,即使在其開發中投入了更多資金。幻覺現象並沒有消失,使得醫療或法律分析領域的公司在採用這些模型時面臨困難。
最近在 《自然》上的一項研究也表明,語言模型的社交推理能力——能夠理解人們在對話中真正的意思——依賴於極少量的模型特徵,而微小的調整可能會破壞它們。這引發了關於可靠性的根本性問題。與此相關的是,OpenAI上個月承認,ChatGPT對弱勢羣體的保護措施在長時間對話中可能會失效。這一披露是在該機器人向一名青少年提供自殘指示後做出的。
李飛飛(@drfeifei)談論大型語言模型的侷限性。“自然界中沒有語言。你不會在自然界中看到天空中寫着的字.. 這是一個遵循物理法則的三維世界。”語言純粹是生成的信號。pic.twitter.com/FOomRpGTad
— 羅漢·保羅 (@rohanpaul_ai) 2025年9月9日
一些科技界更直言不諱的人士指出了其中的缺陷。“硅谷在過度炒作大型語言模型方面完全搞砸了,”Palantir Technologies Inc. 首席執行官亞歷克斯·卡普 在其人工智能會議上説。Meta Platforms Inc. 的首席人工智能科學家揚·勒昆長期以來一直認為,大型語言模型是更智能機器的“死衚衕”,因為它們無法理解其物理環境或進行前瞻性規劃。它們只是“令牌生成器,” 他警告説。
大型語言模型不會消失,但市場歷史表明,迷戀單一解決方案的危險。投資者和企業應該保持警惕,關注技術突破,並準備好應對變化。在技術領域,這種變化可以——而且往往會——在任何人預料之前發生。
來自彭博社觀點的更多內容:
- 人工智能 盈利之路 正在被消費者推動:帕米·奧爾森
- 谷歌正在 嘗試一切 向懷疑者推銷人工智能:戴夫·李
- 網球 人工智能造假 正在困擾美國公開賽:霍華德·蔡-歐安
想要更多彭博社觀點? OPIN <GO>****。或者您可以訂閲 我們的每日通訊**。**