熊節:“主權AI”對大多數南方國家遙不可及,DeepSeek改變了這一切
guancha
【文/觀察者網專欄作者 熊節】
DeepSeek-R1模型的開源發佈,引發了全世界對大語言模型(LLM)人工智能的又一輪關注熱潮。DeepSeek以遠低於OpenAI的成本,訓練出了效果接近甚至部分優於OpenAI-o1的模型,並且用“蒸餾”(distillation)技術提供了一系列參數規模相對很小、效果劣化程度不太嚴重、有一定實用價值的衍生模型,例如國家超算互聯網平台SCNet部署並免費向公眾開放的Qwen-7B和Qwen-32B等。
根據筆者的實驗和估算,部署運行DeepSeek-R1 671B模型(即大家經常口頭説的“滿血模型”)用於內部研究實驗,大致需要每小時300元以上或每月十幾萬元的成本;如果採用有監督微調(SFT)方法對其進行訓練,成本還要再增加好幾倍。這個成本仍然超出大部分個人和小微企業的承受能力,但對於大型企業和國家來説已經完全可以接受。

華為超算中心 網絡
這就意味着大語言模型被DeepSeek高度“民主化”了:任何國家都能訓練並部署一個很大程度上自主可控、基本體現本國價值觀、能結合本國實際情況的,接近或達到世界最先進水平的大模型AI——僅僅幾個月之前,這件事基本上只有美國和中國能做到。
一些國家的政府已經意識到了這一轉變的重要性。印度政府將投入“計算基礎設施、數據和資本支持,以在農業和氣候變化等領域構建與人工智能(AI)相關的應用”,據説印度的大模型將在DeepSeek-R1的基礎上構建。韓國宣佈加快國家級人工智能(AI)計算基礎設施的建設,目標是成為“全球第三大AI強國”。韓國政府於2023年提出的這一目標定義,明顯是意識到各國都有可能在短期內建成自己的“主權AI”,而DeepSeek的開源大大加速了這一進程。
巴西UFABC大學教授、前巴西總統府國家信息技術研究所(ITI)所長Sergio Amadeu指出,DeepSeek的開源“使那些在技術上依賴美國發展的國家能夠制定有利於自身發展的戰略……使[大模型]這項技術實現了民主化,為全球南方國家在這一領域開闢了新的可能性”,但同時“開源並不能解決建設對地方和國家發展至關重要的主權基礎設施的問題”。Amadeu的這一洞察指出數字主權領域的一個重大問題:數字主權是系統工程,僅靠一兩項立法或“殺手應用”的突破僅靠一兩項立法或‘殺手應用’的突破,無法實現數字主權水平的全面提升。
受歐盟GDPR的影響,目前各國在討論數字主權問題時經常聚焦於數據所有權問題,即國家有權使用和管理本國生成的數據、並防止本國生成的數據被別國濫用。與之對應的方案是以立法形式對數據的本地存儲和跨境傳輸加以約束,例如在本國產生的數據應當存儲在本國、數據跨境傳輸需要受本國法律管轄等。
另一些研究者則從傳播學角度關注美國互聯網大公司對信息的壟斷以及進而對政治和國家安全的影響。與之對應的方案是倡導獨立於美國大公司的替代性互聯網平台,開源、去中心化等概念也經常在這類方案中被提及。
但事實證明,數據所有權只是數字主權的一個部分,而且它很大程度上只是國家掌握數字主權進程中相對靠後的部分、是數字主權的成果而非原因。歐盟在實施GDPR幾年後發現,儘管GDPR對數據所有權做了相當嚴格的規定,但畢竟芯片、服務器、操作系統、雲平台等數字基礎設施都掌握在美國大公司手裏。
於是歐盟只能一次次地調查、處罰美國大公司的壟斷行為,卻改變不了數據源源不斷地單向流入美國、並被CIA和NSA全面監控的現實。正是因為意識到這一點,歐盟已經開始發展與AWS競爭的雲計算平台Gaia-X。當然這個項目是否能達成預期,又是另一回事。
筆者提出的數字主權指數(Digital Sovereignty Index,DSI)框架認為,數據所有權的獨立自主是國家整體數字主權的集中體現。如果國家沒有對數字基礎設施(即支撐數字空間運行的硬件和軟件)的獨立自主,那麼對數據所有權的限制實際上無法落地(歐盟和巴西的例子都體現了這一現象);如果國家沒有數字治理的獨立自主,那麼數字空間的規則必然被美國科技巨頭企業主導。
數字基礎設施和數字治理的獨立自主,都依賴於從事數字化產業的科研機構、企業和人才的能力。數據所有權的獨立自主、數字基礎設施的獨立自主、數字治理的獨立自主、數字化能力的獨立自主,這四個維度共同構成了數字主權的整個體系。

正因為數字主權是如此龐大的一個體系,想單純通過立法約束數據所有權,或者建設一兩個“殺手應用”就從美國的數字霸權手中奪回數字主權,是鏡花水月的幻想。同時,這一現實也對數字主權研究領域相當流行的“多利益相關方”理論提出了重大挑戰——這一理論認為,除了國家以外,企業、社羣乃至個人都是數字主權的“利益相關方”,他們各方的利益與國家的利益未必一致,在數字主權的討論中都需要受到同等重視。
看看數字主權指數的四個維度就不難明白:數字基礎設施、數字治理和數字化能力的建設,超出了任何個人或社羣的能力範圍,只有主權國家或超級大企業有可能進行這些基礎工作。在幾家與美國政府緊密合作的美國大企業壟斷(除中國之外的)絕大部分數字空間的現實情況下,在全球南方強調主權國家之外的“多利益相關方”實際上的效果就是削弱甚至批評對國家數字主權的關注,從而間接地維護了美國數字霸權現狀。
具體到大語言模型AI這個領域,DeepSeek的開源已經讓眾多全球南方國家開始想象此前他們無法想象的數字主權問題:主權AI。隨着大眾越來越多地依賴大語言模型來獲取和生成信息,對大語言模型的掌控相當程度上就意味着對意識形態、對價值觀的掌控。
如果全球南方國家不自主訓練並運營自己的主權AI,就意味着其國民自動地依賴OpenAI或其他美國大公司提供的AI產品,也就意味着這個國家需要不斷地向美國大公司付費、數據不斷流向美國大公司,並且對美國大公司的AI產品中內嵌的意識形態偏見毫無辦法。
但正如Amadeu所指出的,一旦全球南方國家(包括其中經濟和科技能力較為領先的國家,例如巴西)開始嘗試建設自己的主權AI,數字主權其他方面的挑戰將接踵而至。舉例來説,現在絕大多數全球南方國家如果想基於DeepSeek的開源模型訓練和部署自己的主權AI,他們大概率只能選擇AWS或Azure的雲服務。一旦美國決定禁止美國企業提供DeepSeek相關服務,這些全球南方國家的主權AI計劃就將受阻。這就是數字基礎設施不能自主帶來的約束。

對於大部分全球南方國家而言,在目前的科研、產業和教育基礎上構建相對獨立自主的數字基礎設施和數字化能力體系已經相當困難。即便是其中的大國巴西,其數字基礎設施仍然高度依賴美國。自20世紀90年代以來的政策轉向破壞了數字化產業持續發展的根基,這是該國目前數字主權水平較低的主要肇因。其他大部分全球南方國家的情況比巴西更糟糕。
全球南方國家如何才能擺脱美國數字霸權的掌控、獲得相對獨立的數字主權?與中國的合作是否可能助力這一進程?這些都是擺在各國面前的現實挑戰。
今年(2025年)巴西擔任金磚國家主席國,其提出的六項“優先工作議題”中就包括了“鼓勵包容性和負責任的人工智能治理促進發展”一項。在巴西提出這項優先工作議題時,DeepSeek-R1尚未發佈,“主權AI”對於絕大多數全球南方國家而言似乎還是遙不可及。
而現在,DeepSeek-R1的開源發佈、及其周邊開源項目的活躍,巴西等金磚國家看待人工智能治理的視角可能需要一個根本性的轉變:從過去必須依賴美國企業提供的AI來討論治理問題,轉向主權AI和多邊主義AI治理的可能性。今年7月的金磚國家峯會將在巴西舉行,金磚各國將如何看待DeepSeek給世界帶來的改變,主權AI、乃至更廣泛意義上的數字主權是否會成為金磚國家的明確訴求,將是今年金磚峯會值得關注的一個看點。
鑑於DeepSeek帶來的大語言模型人工智能民主化趨勢,筆者建議巴西等全球南方國家立即開始採取行動,逐步形成自己的主權AI、乃至數字主權戰略:
1.組織力量對DeepSeek開展研究,尤其是瞭解如何通過後訓練增強或修正大模型在特定領域、特定議題上的表現,以及如何圍繞大模型定製周邊的輔助軟件(例如聊天機器人、智能代理等),並制定切實可行的計劃,實施部署自主可控的主權AI。
2.以主權AI的迭代演進作為牽引,識別本國數字空間產生的所有數據的重要性,對其中最重要的數據落實所有權,例如通過立法和執法保障這些重要數據保存在本國、對重要數據的跨境傳輸加強管制。
3.在掌控數據所有權的過程中,加強與華為等中國ICT企業的交流協作,逐漸降低本國數字基礎設施對美國科技巨頭的依賴程度,逐步加強對本國數字基礎設施的掌控能力。
4.在金磚國家平台上與中國共同倡導多邊主義的AI治理國際秩序:在尊重各國主權獨立自主的前提下,鼓勵技術和經驗開放交流,促進各國在AI領域平等互助、互利共贏的多邊協商與合作。

本文系觀察者網獨家稿件,文章內容純屬作者個人觀點,不代表平台觀點,未經授權,不得轉載,否則將追究法律責任。關注觀察者網微信guanchacn,每日閲讀趣味文章。