人工智能“推理”模型將如何改變企業及經濟格局——彭博社
Azeem Azhar
插圖:Irene Suosalo為彭博社創作
人工智能將顛覆企業組織方式的傳統認知(音頻)
15:56
在歷史長河中,僱傭十幾位博士往往意味着鉅額預算和數月的籌備期。如今,在聊天機器人中輸入幾個按鍵,就能在瞬間獲得這樣的智力資源。
隨着智力資源變得愈發廉價和迅捷,支撐我們社會機構的基本假設——人類智慧稀缺且昂貴——已不再成立。當你可以隨時高效諮詢數十位專家時,這將改變企業的組織方式、我們的創新模式,以及每個人學習和決策的方式。個人和組織共同面臨的問題是:當智力本身突然變得無處不在且幾乎免費時,你將如何應對?
降低智力成本的歷史沿革
這並非我們第一次見證知識與傳播成本的革命性下降。15世紀中葉印刷術出現時,它大幅降低了文字材料的傳播成本。在印刷術之前,文本需要由訓練有素的修道士抄寫員手工精心複製。
一旦這個瓶頸消失,歐洲經歷了全面變革:宗教改革重塑了宗教信仰,識字率飆升(為基礎教育鋪平了道路),科學探索通過印刷論文蓬勃發展。這些變革的最大受益者是具有商業頭腦的荷蘭和英格蘭,它們迎來了黃金時代——就英格蘭而言,更贏得了數百年的全球領導地位。
隨着時間的推移,大眾識字率與公共教育相結合,使智力資源更加豐富,推動了工業化進程。工廠工作日益專業化,形成了複雜的勞動分工,促進了經濟增長。18世紀末男性識字率較高的國家率先實現了工業化;到19世紀末,技術最先進的經濟體也擁有識字率最高的人口。隨着工人掌握新的技術技能,勞動力市場支持更專業化的職業,形成了持續至今的良性增長循環。
互聯網通過大幅降低獲取可靠信息的成本延續了這一趨勢。在我小時候,研究一個新課題意味着帶着主題清單步行去當地圖書館,這可能會耗費半天時間。那時,知識既不廉價也不容易獲取。
如今,人工智能正在為這個延續千年的降低智力成本進程邁出下一步。這將成為我們經濟和智力發展的下一篇章。
插圖:Irene Suosalo為彭博社繪製### 我的ChatGPT頓悟時刻
2022年12月首次使用ChatGPT時,感覺像是一個里程碑。最初我的實驗只是些數字小把戲——比如讓人工智能"用埃米納姆的風格重寫《獨立宣言》"(“喲,我們在此大聲宣告,這羣人絕不彎腰求饒”)。
回想起來,那就像讓一位藍帶廚師去做烤奶酪三明治。直到2023年1月的一個下午,當我與12歲的女兒坐在一起時,我才開始意識到這些新工具的真正力量。在幾個小時內,我們與ChatGPT合作設計了一款全新的棋盤遊戲。
為了達到這個目的,我向我的AI助手介紹了我們喜歡和不喜歡的遊戲,並要求它識別每種遊戲的特點。它注意到我們喜歡具有某些特性的遊戲——路徑建設、資源管理、收集、戰略規劃——以及使最終勝利者不明確的動態。它還識別了我們不喜歡的那些在諸如《風險》和《大富翁》等遊戲中常見的元素。
我讓ChatGPT基於這些不太明顯的特定元素提出遊戲概念,並建議我想要一些歷史題材的內容。於是《元素髮現》這款遊戲應運而生。玩家扮演18和19世紀的研究化學家,競相發現新元素,收集和交易資源進行實驗並得分。當然,玩家們也有能力互相破壞。
然後我要求AI更詳細地描述資源、遊戲玩法、遊戲動態以及能讓遊戲更加生動的特定玩家角色。它提出了鍊金術士、破壞者、商人和科學家等角色。它還確定了應該扮演這些角色的特定歷史人物,如安託萬·拉瓦錫、約瑟夫-路易·蓋-呂薩克、瑪麗·居里、卡爾·威廉·舍勒等。
僅僅兩三個小時——使用一個非常基礎的ChatGPT版本——我們就做出了一個粗糙但出奇可玩的遊戲。我不得不停下來,部分原因是時間不夠,部分原因是精疲力盡。這讓我親身體驗到AI協作者如何將數週的研發壓縮到幾小時內。想象一下這對產品開發、市場分析甚至企業戰略的影響。
我所經歷的是一套似乎能進行高級推理的系統。ChatGPT不只是複述台詞或 regurgitating 事實;它展示了類比和概念性思維,將想法與現實世界的參考聯繫起來,並按要求展示出真正的創造性問題解決能力。
從聰明鸚鵡到深度思考者
一萬億的任何東西都很多。難怪科學家最初被支撐ChatGPT的大語言模型弄得暈頭轉向。它們是極其複雜的軟件機器,擁有100億、5000億甚至一萬億個參數。
而我們並不真正知道它們如何或為何工作。隨着這些模型在過去七年中開始取得突破,一些理論家認為它們不能做任何新穎的事情——2021年學術研究人員創造的貶義詞“隨機鸚鵡”。學術研究人員 大語言模型通常通過基於訓練數據中的統計模式預測文本塊來生成響應,就像一隻隨機行為的鸚鵡(一種花哨的説法是概率性的)。
但對於我們這些不斷被這些工具震撼的人來説,很難相信它們只是在複述它們所看到的東西。而在過去的六個月裏,這似乎完全不可信。
早期的大型語言模型如同即興射擊,缺乏自我反思能力——或者説,對於沒有自我意識的軟件而言根本不存在這種概念。人類行為也類似:我們大多依賴快速直覺反應,即已故諾貝爾獎得主丹尼爾·卡尼曼所稱的"第一系統思維"。但真正有價值的工作來自"第二系統思維",即有條理、審慎且有意識的過程——因而更不易出錯。初代ChatGPT及其競品都停留在第一系統層面。
直到去年九月,OpenAI推出革命性的o1推理模型。這種模型通過將複雜多步驟邏輯問題拆解為結構化步驟來解決問題。傳統大語言模型在需要真正邏輯推理的任務中往往依賴記憶或表面模式匹配,而新型推理模型能分解問題、驗證中間結論(必要時回溯)、並執行正確步驟得出最終答案。某些測試表明,推理模型展現出的智能水平堪比甚至超越特定領域的博士專家。
o1發佈後的六個月裏,技術取得巨大突破。當前最前沿的AI趨勢(讀者看到本文時仍將適用)是將這些推理模型轉化為自主研究助手。這些系統的表現令人驚歎。
為輔助某項分析,我最近要求研究機器人對"F1賽事、科切拉音樂節、迪士尼樂園、拉斯維加斯賭場、醫院、大型動物園等大規模活動及運營"進行環境影響評估。AI耗時73分鐘調研29個獨立信源,最終生成包含1,916字詳細表格及註釋的報告。質量雖非完美——約等於研究生數日工作的水準——但確實節省了我數日工作量。
就在18個月前,我的AI系統還在協助處理30分鐘的任務。今非昔比。
認知生產線
我們見證了知識運用與腦力勞動方式的持續演進。從神廟秘典到早期文獻,知識始終被守門人掌控。印刷術的出現使權力從僧侶學者的幽閉領域解放,走向民主化。互聯網進一步推動這一進程——你可以假定每個聯網者都擁有同等信息,挑戰轉而成為如何解讀這些信息。如今,那些曾被視作罕見覆雜的任務已變得觸手可及——且成本低得驚人。
然而我與大企業高管交談時,發現他們多在瑣碎領域使用AI,與我交給AI處理的棘手問題相去甚遠。起點往往是自動化客服以削減成本。Salesforce首席執行官去年12月表示,其每週3.6萬次客户諮詢中86%由AI客服處理。瑞典金融科技巨頭Klarna通過AI處理三分之二客服對話,由此獲得4000萬美元利潤。但僅靠削減10%客服成本難以改變企業格局,偉大公司從來不是靠節流建立的。
大多數企業在人工智能應用上起步較微,僅將每小時50美元成本的客服聊天等任務自動化——這固然實用,卻遠未觸及變革核心。然而同樣的AI平台本可攻克每小時價值5000美元的挑戰:研發、戰略規劃或專業諮詢。為何鮮有企業將其用於這些領域?
從某種層面看,人們難以想象那些委派給資深精英的高階工作竟能被機器部分替代。“高價值任務"之所以珍貴,恰恰在於其執行者鳳毛麟角。因此企業架構往往基於一個前提:真正卓越的智力資源始終稀缺。
以押注重磅藥物的製藥公司為例。其最大瓶頸在於能有多少新藥通過耗時耗資的審批流程——單款藥物上市需10-15年研發週期和超10億美元投入,數千種候選化合物中往往僅有一種能最終面市。值得注意的是,大型藥企的市場人員數量可能是頂尖科研人員的千倍之多,這正揭示了頂級專業人才的稀缺現狀。
當前企業管理者對AI仍停留在"嘗試採納"而非"深信不疑"階段。商界慣性地將某些難題視為解決成本過高而選擇容忍,就像人們忍受隱隱作痛的背傷。當核心問題從"能否構想解決方案"轉變為"多快能落地驗證這些構想"時,這種權衡邏輯必將重塑。
其影響深遠。當每個問題都能借助相當於數十位博士級專家的力量來解決時,創新速度將大幅提升。正如亨利·福特的裝配線實現了汽車製造流程的快速迭代改進,人工智能使得創意和解決方案能持續優化升級。企業可以更快試錯、加速學習並更高效地調整方向。
但若無法將這種卓越思考轉化為實際行動,一切便失去意義。因此,成功的企業會找到方法落實其新型數字智囊團提出的建議。
我與AI共處的日子
過去18個月裏,日益增多的AI系統支撐着我的工作。例如在2024年6月異常忙碌的一天,我調用了不同AI工具38次,往返處理了79,000字以輔助研究。
到2025年1月,我已放棄統計對話字數。但所有會議都有一個AI在做筆記(除非與會者反對)。多個研究工具定期提供協助。撰寫本文當週,我向各類大語言模型提交了144餘次查詢,不包括26次轉錄記錄或編程助手的使用。如今我對新興AI應用的查詢量已遠超谷歌。
這項技術帶來的意外收穫是:我以更快的速度完成了更多工作——更令人欣喜的是,面對屏幕的時間反而比往年更少。
隨着智能變得幾乎免費,我們真正的限制不再是獲取腦力,而是知道如何利用它。成功的組織和個人將懂得如何提出正確的問題,評估答案並明智地採取行動。他們還必須弄清楚如何利用新獲得的空閒時間。
Azeem Azhar 撰寫了《指數視野》通訊並投資於初創企業。