AI能源危機推動了對更高效芯片的需求 - 彭博社
Jane Lanhee Lee
首席執行官兼創始人Sid Sheth拿着d-Matrix的Jayhawk和Nighthawk芯片。
來源:d-Matrix提供要理解人工智能需要如此多能量的一個關鍵原因,想象一下一個計算機芯片充當當地圖書館的一個分支,而人工智能算法則像是一個具有借書特權的研究員。每當算法需要數據時,它會去圖書館,也就是內存芯片,借閲數據然後將其帶到另一個芯片,也就是處理器,來執行一個功能。
人工智能需要大量的數據,這意味着相當於數十億本書在這兩個芯片之間來回運輸,這個過程消耗了大量的電力。至少在過去十年裏,研究人員一直試圖通過構建可以在數據存儲的地方處理數據的芯片來節省能量。“與其把書從圖書館帶回家,你去圖書館做你的工作,”斯坦福大學教授、內存芯片領域的頂尖專家、也是台灣積體電路製造公司的顧問Philip Wong説道。
這個過程通常被稱為內存計算,面臨着技術挑戰,現在才開始走出研究階段。隨着人工智能的用電量引發對其經濟可行性和環境影響的嚴重質疑,能夠使人工智能更節能的技術可能會帶來巨大回報。這使得內存計算成為引起更多興奮的話題,甚至意味着它已經開始捲入更廣泛的半導體地緣政治糾紛中。
像台積電、英特爾和三星這樣的主要芯片製造商都在研究內存計算。英特爾公司的高級首席工程師拉姆·克里希納穆爾蒂表示,該公司的研究部門Intel Labs已經生產了一些芯片用於研究,儘管他拒絕透露內存計算如何適用於英特爾的產品陣容。像OpenAI首席執行官山姆·阿爾特曼、微軟等公司,以及來自中國、沙特阿拉伯等地的政府機構都投資於從事這項技術的初創公司。
去年11月,一家審查具有國家安全影響的外國投資的美國政府小組強迫沙特能源公司阿美公司的風險投資基金退出了總部位於舊金山的專注於內存計算的初創公司Rain AI。據知情人士透露,阿美公司的風險投資部門現在正在尋找美國以外從事內存計算的其他公司,在中國積極進行搜索。
中國特別對這項技術表現出越來越濃厚的興趣。根據跟蹤投資數據的PitchBook,一些中國初創公司如PIM Chip、Houmo.AI和WITmem正從知名投資者那裏籌集資金。普林斯頓大學教授、也是從事內存計算的初創公司EnCharge AI的聯合創始人納文·維爾馬錶示,他經常受邀在中國公司和大學就這個主題發表演講。“他們正在積極嘗試理解如何構建系統——內存計算系統和一般先進系統,”他説。維爾馬錶示,他已經好幾年沒有去中國了,只是在亞洲就他的學術工作發表演講,而不是關於EnCharge技術。
EnCharge AI CEO and founder Naveen Verma在普林斯頓大學的研究實驗室展示了一款原型開關電容模擬內存計算芯片。來源:Scott Lyon目前還不能確定這種芯片技術是否會成為人工智能計算未來的重要組成部分。傳統上,內存計算芯片對環境因素敏感,如温度變化,這可能導致計算錯誤。初創公司正在努力採取各種方法來改進這一點,但這些技術都是新的。更換新型芯片成本高昂,客户通常不願意這樣做,除非他們確信會有顯著的改進,因此初創公司將不得不説服客户,讓客户相信風險是值得的。
目前,內存計算初創公司並未致力於人工智能計算中最困難的部分:訓練新模型。在這個過程中,算法會檢查千兆字節的數據,以獲取用於構建系統的模式。這一過程主要由英偉達等公司設計的頂級芯片來處理。該公司一直在致力於改進功耗效率的策略,包括減小晶體管的尺寸和改進芯片之間的通信方式。
與其直接與英偉達競爭,製造內存計算芯片的初創公司的目標是在推理方面建立業務,即利用現有模型來接收提示並輸出內容。推理並不像訓練那樣複雜,但它是大規模進行的,這意味着專門設計用於提高效率的芯片可能會有一個良好的市場。
英偉達的主要產品,一種被稱為圖形處理單元的芯片的高度耗電使其相對低效,不適合用於推理,d-Matrix的創始人兼首席執行官Sid Sheth説,d-Matrix是一家總部位於硅谷的芯片初創公司,已從微軟公司和新加坡國有投資者淡馬錫控股私人有限公司等投資者那裏籌集了1.6億美元。他説,在AI繁榮開始之前,向投資者推銷是具有挑戰性的。“23年上半年,每個人都因為ChatGPT而得到了,”他説。該公司計劃今年銷售其首批芯片,並計劃在2025年實現大規模生產。
內存計算公司仍在探索其產品的最佳用途。總部位於荷蘭的內存計算初創公司Axelera正在瞄準汽車和數據中心中的計算機視覺應用;總部位於德克薩斯州奧斯汀的Mythic的支持者認為內存計算在短期內非常適合應用於諸如AI動力安全攝像頭之類的應用,但最終希望它們可以用於訓練AI模型。
卓越的AI能源消耗規模使每個致力於使技術更加高效的人都感到緊迫,半導體研究公司的首席科學家Victor Zhirnov説,“AI迫切需要高效的能源解決方案,”他説。“否則它將很快毀滅自己。”