“AI的iPhone時刻”很近,又很遠_風聞
IT时报-《IT时报》官方账号-04-03 14:13

“黃仁勳定律”尚需跨過政策、數據、安全幾道門檻
作者/ IT時報****記者 範昕茹
編輯/ 王昕 孫妍
3月23日,在英偉達的GTC大會上,英偉達CEO黃仁勳藉由ChatGPT的成功向世界展示了一個無限寬廣的AI未來圖景。在這個宏大場景之下,AI不再是虛幻不可見的東西。它在芯片生產、醫療、文化創作等各個領域發揮着巨大的作用,給世界帶來天翻地覆的變化。
AI終於從幻影中走出,迎來了清晰的商業化之路,黃仁勳將之稱為“AI的iPhone時刻”。
2022年,在新一代顯卡的發佈會上,黃仁勳直言“摩爾定律已死”,往後的芯片性能不會再遵循這個定律。而藉由“AI的iPhone時刻來臨”的口號,黃仁勳向世界宣告了“黃仁勳定律”的到來。

“黃仁勳定律”誕生
CuLitho計算光刻技術軟件庫是英偉達與全球最大晶圓代工廠台積電、全球最大光刻機巨頭阿斯麥、全球最大EDA巨頭新思科技合作,秘密研發近四年的“核彈”。
根據黃仁勳的表述,CuLitho在GPU上運行時,可以將計算光刻加速40倍以上,為2nm及更先進的工藝奠定基礎。他舉例,NVIDIA H100生產需要89塊掩膜板,在CPU上運行時,處理單個掩膜板需要4萬個CPU系統才能完成工作,如果在GPU上運行CuLitho,這個過程只需要8小時。與此同時,CuLitho還能助力降低耗電以及對環境的影響,將功率從35MW降至5MW。

在短期內,使用CuLitho的晶圓廠每天的光掩模產量可增加3~5倍,而耗電量可以比當前配置降低9倍。原本需要兩週時間才能完成的光掩模現在可以在一夜之間完成。
隨着光刻技術臨近物理極限,這項技術通過加速計算光刻流程,將有助於晶圓廠縮短原型週期時間、提高產量、減少碳排放,為2nm及更先進的工藝奠定基礎,並使得曲線掩模、high NA EUV、亞原子級光刻膠模型等新技術節點所需的新型解決方案和創新技術成為可能。
對英偉達而言,CuLitho展示了英偉達進入芯片製造生產銷售全鏈路的野心。黃仁勳定律的核心在於利用GPU芯片算力大幅度提升芯片製造效率,以此來加速摩爾定律削減帶來的生產瓶頸。
對英偉達而言,當它同時介入芯片的生產和銷售環節,成為其中的一部分,CuLitho將給芯片產業帶來巨大的變化:AI芯片的生產環節本身也成為AI芯片消費的一部分。GPU芯片將成為芯片行業主要的流通貨幣。
當然,這一切發生的前提是“AI的iPhone時刻”真的已經到來。

算力卡了大模型脖子
在GTC大會上,黃仁勳對軟硬件市場空間做過一個回應。在他看來,人工智能軟件是一個比硬件大得多的市場,而硬件的銷售機會主要來自基礎設施服務市場。也就是説,GPU芯片的市場多大,取決於AI軟件的商用程度。
如今,AI大模型公司不得不面臨的一個主要困境——算力。每一個AI大模型背後,都需要巨量算力的支撐。為了支撐OpenAI訓練出ChatGPT,微軟專門為OpenAI打造了一台由數萬個A100 GPU組成的AI超級計算機。TrendForce研究推測,以A100的算力為基礎,GPT-3.5大模型需要高達2萬枚GPU,未來商業化後可能需要超過3萬枚。
集之互動CEO陸文斌告訴《IT時報》記者,**1年半前,其所在公司採購了50多塊A100芯片,用於高精度數字人的研發。**在數字孿生的應用場景中,一位醫生可以只需錄製20分鐘左右的視頻,便可以“孿生”為一個數字人。之後,只要輸入相應的數據,便可以由“孿生人”自己演講、互動或者授課,期間,無論是文字轉換為語音,還是互動式的NLP(自然語言處理),亦或是數字人逼真的面部擬人化,每個環節都需要消耗巨量的算力,“精度越高,需要投入的算力越多,需要的資金也越多”。

圖源:pixabay
陸文斌以最簡單的“數字人説話”場景舉例,通常而言,人類的唇部大約有近千個神經元,這些神經元相互連接作用,當人開口講話時,每個字形成的唇形都不相同。他們公司製作的數字人,在其唇部部署了300個神經元,這在國內已經是相當高水平的精度,但要想做得更逼真,唯有投入更多的算力渲染。
這還只是在研發端的算力消耗,商用化的道路上,終端成了落地的絆腳石。在強大算力的支撐下,高精度數字人可以進行流暢的表情演示,但目前市面上高性能的筆記本電腦卻難以支撐超高模數字人的流暢演示,更不用説手機。
更讓陸文斌擔心的是,此前購置第一批英偉達A100芯片時,限售令還沒頒佈。第二批入手在限令之後,價錢已上漲了50%。從公司的業務發展速度來看,加上芯片損耗,他擔心,可能2~3年後便買不起芯片了,也無更多算力可用。
但ChatGPT的成功,正吸引一批企業投身AI大模型市場。百度的“文心一言”已經上線;騰訊總裁劉熾平表示會持續優化混元AI大模型;字節跳動則傳出了前達摩院大模型M6帶頭人入職,並參與語言生成大模型研發的消息。創新工場CEO李開復、前搜狗CEO王小川、原美團聯合創始人王慧文、前京東AI掌門人周伯文、出門問問創始人李志飛、阿里技術副總裁賈揚清,這些聲名赫赫的業界大佬,都紛紛入局大模型市場。
當大廠入局,企業對算力的爭奪將更加激烈。而目前在AI芯片領域,英偉達舉着望遠鏡也看不到敵人。對國內企業來説,如果一直無法找到合適的替代方案,未來算力從何而來?
最近,陸文斌的數字人公司正在與國內GPGPU芯片廠商合作調試,以便當更大的“黑天鵝”來臨時,可以提前防範部分風險,“我們也在提前做一些研發佈局,包括是否可以在低配置的硬件設備上,利用軟件跑出更好的效果。也很希望能和更多國內芯片、智能硬件廠商合作,儘量降低算力‘卡脖子’對國產人工智能產業的影響”。

算力跨境,數據落地
針對中小企業算力缺失的問題,英偉達也給出了自己的答案——DGX Cloud算力平台。DGX Cloud背後是DGX(AI超級計算機)的算力能力。通過這個平台,企業無須購買硬件,可以通過網頁瀏覽的方式獲取高性能算力,享受到和Open AI同樣的算力引擎,擴展多節點AI訓練。**企業可以通過月租的方式獲取算力,每月租金36999美元。**可以説,DGX Cloud雲平台降低了用户使用算力的門檻。

然而,跨過了使用門檻,即便雲能力可以跨境,但數據不行。隨着各個國家對數據管控的加強,跨境數據傳輸也成為雲平台跨境運營的壁壘。美國《國家安全戰略報告》將數據安全作為維護國家安全的核心戰略要素,強調要保持美國在網絡空間和數據資源上的優勢。歐盟的《數字化單一市場戰略》中也指出,歐盟將採取“內鬆外緊”的數據跨境流動管理思路。2022年9月1日,我國《數據出境安全評估辦法》正式施行,對涉及個人信息的跨境數據傳輸進行管控。
**互聯網企業跨境運營面臨的數據安全壓力也日漸凸顯。**在數據安全的壓力下,蘋果將數據中心交由“雲上貴州”託管,將國內數據存放在我國本土。字節跳動旗下的TikTok則不斷面臨着來自美國的政策壓力。3月23日,字節跳動海外短視頻平台TikTok CEO周受資參加主題為“TikTok:國會如何保護美國數據隱私,保護兒童免受網絡傷害”的美國眾議院能源與商務委員會聽證會。
**這意味着,DGX Cloud想要商用,勢必要將數據中心本土化。**目前,英偉達對此採取的策略是與雲廠商合作,採用託管的形式進行。黃仁勳表示,未來中國也可以採用這項服務,中國創業公司可以期待阿里、百度、騰訊提供的底層算力服務,但在算力需求急速增長的現在,服務得以開展的時間和定價都還很難判斷。
作為軟件端的ChatGPT其實也面臨着同樣的數據風險。即便如今ChatGPT被接入微軟Office全家桶,其能力也讓C端用户大為震驚,但對企業用户而言,由於其生產力的獲取需要通過數據的投餵進行,騰訊、阿里等企業已經明令禁止員工向其投餵數據,ChatGPT的商業化之路仍模糊難辨。

人工智能面臨政策拷問
除開數據帶來的安全隱患,“AI的iPhone時刻”還將因相關政策監管而推遲到來。
自人工智能誕生以來,治理問題就一直是全球監管機構關注的熱點。歐盟正着手準備創建一個新的監管部門來負責AI的治理,以應對ChatGPT這類人工智能可能帶來的挑戰。
英國正在計劃如何分配監管機構管理人工智能的職責。英國政府3月29日發佈了一項計劃,將不會專門成立一個負責人工智能技術監管的部門,並將避免可能扼殺創新的嚴厲立法,而是會根據安全、透明、公平和問責制等廣泛原則採取適應性強的監管方法。而國內針對ChatGPT這類人工智能治理相關的討論也在業內不斷增加。
不僅如此,人工智能大模型帶來的風險已經引發了多位科技領袖的深切擔憂。近日,OpenAI的共同發起人伊隆·馬斯克和一羣人工智能專家及行業高管在一封最新發布的公開信中呼籲,在未來六個月暫停對GPT模型的訓練,以免該模型變得更加強大,從而對社會和人類造成潛在風險。這封公開信如今已經獲得1000多人署名,呼籲在GPT進一步強大之前,需要首先就此類大模型達成由獨立專家開發、實施並審核的共享安全協議。
當英偉達用“黃仁勳定律”迎接一個屬於GPU的時代來臨時,“AI的iPhone時刻”或許將首先面臨政策、數據、安全的拷問,而唯有邁過這些門檻,“AI的iPhone時刻”或才終將來臨。
排版/ 季嘉穎
圖片/ 英偉達 pixabay
來源/《IT時報》公眾號vittimes