@所有城市:想建AI智算中心的看這裏!國家認可的那種_風聞
量子位-量子位官方账号-2021-09-17 18:23
金磊 夢晨 發自 凹非寺
量子位 報道 | 公眾號 QbitAI
比算力、拼速度,今年火得藏不住。
就這兩年,全球明星公司都紛紛開造,自建智算中心。
大洋彼岸特斯拉,馬斯克今年重要的成就就是自研AI超算DOJO,為其自動駕駛破局開路。
國內超級獨角獸商湯,面向未來的護城河不是別的——就是正着手打造人工智能計算中心 (AIDC)。
不止於明星公司,國內外頭部城市,也紛紛打造着自己的人工智能智算中心。
北上廣深先不論,武漢南京合肥……也都紛紛你追我趕。

為什麼大傢伙在速度這件事上,都要這麼“死磕”?
一言蔽之,算力正在成為當今社會發展的核心資源。
用一個較為形象的比喻便是——相當於給一個企業、城市,裝上了動力強勁的馬達。
權威諮詢機構IDC發佈的數據:
算力指數平均每提高1個點,數字經濟和GDP將分別增長3.3‰和1.8‰。
這個“馬達”一旦開動起來,除了推動城市現有經濟發展,對整個產業鏈上的企業、人才更是有着聚集效應。
換句話説,未來哪座城市跑得更快更前,「算力」肯定是核心要素之一。

有這樣的效果,難怪全國各地的城市紛紛在智算中心上發力。
但別急,在更多城市開動這個“馬達”之前,有兩個問題亟待解決。
智算中心建設遇到什麼問題?
時下,國內智算中心的建設處於早期擴張階段,由於缺乏規範引導,一些問題逐漸凸顯出來。
國家工業信息安全發展研究中心發佈的一份報告中指出以下兩點:
價格標準混亂
以兩座城市情況舉例,明明是定位相同、功能相近的智算中心,建設成本相差可以達到6.2倍。
建設方向不清
市場對算力的概念混淆,導致建設方向和建設需求錯位,支持的應用場景太少。
上面2個問題合起來,最終結果就是——
花大價錢建了,卻用不上。
其實類似的情況在幾年前建設大數據中心的風潮中就上演過一次。
在本月一次採訪中,國家工信安全中心副總工程師黃鵬表示:
我們不希望智算中心建設走上數據中心的老路,低水平重複,建了很多的基建,但是跑的應用不是很多,和它當地的發展需求不是很匹配,這不是我們想看到的。
智算中心的建設如何避免重蹈覆轍?
這個問題的答案不僅要在建設的執行階段尋找,更是要在建設的規劃階段尋找。
也就是先明確究竟該建什麼樣的智算中心。
一個解決思路是——通過調研給出智算中心的合理價格標準和建設標準,讓智算中心符合兩個關鍵特徵:
普惠和開放。
智算中心為什麼要普惠?
站在全社會層面看,智算中心本應是公共服務基礎設施,就像電信網絡、電力設備一樣。
就像工業時代的工廠離不開高效集中供電,智能時代的AI企業也離不開高效的算力供應。
根據OpenAI統計,從2012年的AlexNet到2018年的AlphaGo Zero,先進AI模型對算力的需求增長了30萬倍,平均每3.4個月就要翻一番。

最近幾年,以GPT-3為代表的AI大模型突破式發展讓這個速度持續加快,最新數據顯示算力需求翻倍的時間已縮短到2個月。
如此算力需求增長速度,各地企業靠單打獨鬥顯然力不從心。
建設時芯片、服務器設備上的投入,基礎設施、廠房建設上的投入,再加上建成後持續運營、電費的投入,一般的中小企業哪裏負擔得起?
回看二次工業革命的電力時代,各家分散發電的成本高、效率低,最終是具有規模效應的集中供電點亮了一個個城市。
到了智能時代,集中優勢資源把算力聚合到智算中心,再以服務的形式把算力高效率的分配給有需要的企業就成了一個好選擇。
國家工信安全中心副總工程師黃鵬在採訪中還提到:人工智能有一個特點是“越用越智能”。
繼續拿GPT-3來舉例,正是大量數據和訓練時間的投入造就了這類大規模預訓練模型的成功。
所以讓更多城市把智算中心建起來,更多企業把算力用起來,產生的規模效應要比電力時代更大。
這也是“普惠”二字更大的價值所在。
那麼具體來講,普惠都能惠及誰?它們又將如何受惠?
最直接的是AI企業和研究機構,尤其是資源有限的獨角獸創業公司和更多中小型企業。
智算中心建起來,AI企業把算力用起來,轉化成一個個產品和服務。
所以普惠進一步惠及的是智算中心客户,其中小部分是個人消費者,更大頭還是企業客户。
AI想要落地,就得在真實業務場景中真正展現效果,產生效益。
這就引出了智算中心需要符合的第二個關鍵特徵:開放。
開放包容的智算中心,才能助推AI產業落地到更多行業中去。
智算中心如何做到開放?
第一是算力構成層面,智算中心的算力本身不能“偏科”。
如智慧城市中的天氣預測、智慧製造中的材料設計,智慧醫療中的藥物發現等任務上都需要AI與高精度科學計算相結合。
也就是不能只注重AI訓練和推理時所需的低精度算力,要把科學計算、工程計算與人工智能計算結合起來。
第二是AI技術層面,智算中心要去兼容適配的更多技術體系。
在開放兼容的生態下,也能讓遷移成本降到最低。
一個形象的比喻就是,兩台Windows電腦之間可以把軟件輕鬆地遷移過去,而Windows和蘋果則並不會那麼順利。
第三是產業應用層面,除了新興的AI產業,智算中心還有一大任務是推動傳統產業的智能化轉型。
為了支撐智慧物流、智能製造等領域,AI還需要與5G、物聯網、區塊鏈等技術相融合。
做到以上三點,才算是讓智算中心真正為各行各業提供普適的AI服務,真正做到開放。
一份AI基建説明書
單有普惠、開放還不夠,作為未來全社會的基礎設施,智算中心建設中還會面臨諸多問題,需要明確。
上週,國家權威機構發佈了**《新一代人工智能算力基礎設施發展研究》** (後文簡稱《報告》),正是站在更高層面發出倡議,謀求共識。
比如模式選擇方面。
報告指出,縱觀國內外新起的AI基礎算力設施,不難看出一個明顯的特點:
政企合作建設。
因資金來源不同、建設目的不同、合作模式不同又各有特色。例如一些城市計算中心,不僅能為基礎科學研究提供算力,更為這座城市的新能源汽車、生物醫藥、氣象預報等產業服務。
一個可行的辦法就是:圍繞“一類算力基礎設施+N個產業創新平台”的架構來打造。
再比如規範價格方面。
中科院人工智能產學研創新聯盟在綜合存儲、能耗、開發、定製、數據調度等一系列因子,並代入明確的算法標準後得出:
在同時具備5P雙精度算力(64位)、25P單精度算力(32位)和100P半精度算力(16位)的情況下,智能計算中心的基礎設施價格約為1億-1.5億。
此外,還有對未來的前瞻判斷:
報告認為,未來智算中心發展特徵不僅圍繞普惠靈活、開放包容,更包括融合創新、安全可信等現實問題。
更多總結和觀點,不再一一贅述,鏈接附在文末,有興趣的讀者可點擊瞭解。
如何評價這份倡議?
正如文章開頭所述,智算中心建起來就像給所在城市裝上一個動力強勁的“馬達”。
不過智算中心的建設不僅關乎一城一地,更是關乎全社會和整體經濟發展。
將視角拉遠,越過單個智算中心的建設,綜合經濟整體規劃乃至國際形勢,才能看出當前這份《報告》在更高層面的意義。
上面已經提及開放與普惠。
從社會長遠效益看,更重要的是環保。
AI大模型效果驚豔的背後是巨大的能源消耗,像GPT-3僅訓練一次就需約19萬度電。
做到能耗控制、避免重複建設,才更有利於行業本身和各地產業將向綠色化、低能耗、可持續方向轉變。
其中一些企業這方面依照**《新一代人工智能算力基礎設置發展研究》** 指導已做出了成果。
再從更高維度視角看,全國範圍內的算力要有一體化的統籌調度機制,避免重複建設和資源浪費——
例如,將時延要求不高的應用放到能源富集的中西部地區建設,時延要求高的應用放到用户需求集中的東部地區,響應“東數西算”的國家整體戰略規劃。
國際競爭層面,長遠和通盤倡議也更能顯露智算中心發展的價值。
算力已成為世界各國競爭角逐的焦點。就在今年,美國又下黑手把天津、濟南、鄭州等7地的超算中心列入實體清單,企圖在關鍵技術上執行“卡脖子”戰術。
且AI計算還牽扯到大量數據,像無人駕駛用到的地圖數據、電商消費中的公民隱私數據都要靠自主可控的技術保障安全可信。
為了避免還在發展階段的智算中心受制於人,在儘可能早的時間段提出未來智算中心從芯片、基礎設施到操作系統、應用軟件都應採用自主技術架構,本身對產業升級、社會發展就是一種保駕護航的呼籲。
就這樣,“普惠”、“開放”的標準,全局、長遠的考量,給智算中心的建設和發展指明瞭方向。

今後國家工信安全研究中心還將持續跟蹤觀察算力行業動態,希望打造一批可複製、可推廣的實踐案例,推動標準共識的形成。
有一種説法正被越來越多業內人認可:現如今,智算中心正在成為一座城市有沒有數字經濟潛力、值不值得看好的風向標。
甚至還有了“智算城”之類的説法,除了過去以GDP來衡量的城市梯隊和排名,另一個贏在數字經濟時代的一線城市,重點被關注的指標就是有沒有智算中心、有多大規模的智算中心。
照目前衡量標準之下,數字經濟的一線城市競爭,最積極的還是:
廣州、南京、合肥、天津、成都、西安…
這其中你最看好誰?或者還有什麼隱藏的高手玩家?
報告全文:
http://www.cics-cert.org.cn/web_root/webpage/articlecontent_101001_1437271865428021249.html