上海社科院研究員劉煒:真正的文化實力不在於誰的算力更強
guancha
10月14日世界中國學大會第四分論壇上,上海社會科學院研究員劉煒在發言時介紹了中國數字人文自主知識體系建設與國家主權AI的關係,並分析應該如何建設適配這一知識體系的主權AI。
他表示,首先應明確兩個概念。其一是主權AI。這一概念的核心是國家對AI的數據、算法、語義擁有自主掌控力,它不只是技術主權,更是文化主權。和通用AI不同,主權AI必須理解本國語言邏輯、文化常識與價值,對齊本土意識形態,要能懂 “為什麼這麼説、為什麼這麼想”,而非僅追求生成流暢性。
第二個概念是中國數字人文自主知識體系,當前學界已有不少探討,簡單説就是用數字化、智能化手段重建知識結構與闡釋體系,實現知識主權再造,讓中國歷史思想、美學在數字世界裏以自主方式被理解、傳播。但這是一個比較抽象的解釋。
劉煒認為,在算法與語義共塑的新時代,數字人文是連接傳統文化與AI的橋樑,但橋樑的技術基礎,決定了能否用自己的方式講好中國故事。
現在很多人沒意識到,中國數字人文自主知識體系離不開主權AI的支撐,二者本應相互促進。若沒有主權AI,自主知識體系會陷入依附。
例如,當前多數通用大模型以西方語料為主,中文佔比僅2%~3%,缺乏中國文化、歷史常識,解決不了特有的偏見與誤導問題,還容易產生“AI幻覺”。即便如今AI對中國文化的呈現有所進步,但對中文的理解仍顯機械,尤其在東亞文化相關的圖像、多模態資源解讀上,因缺乏語境易出問題。沒有獨立的算法語義底層、自主知識體系,中國數字人文自主知識體系就是空談。
具體來説,劉煒列舉了主權AI對數字人文的四大意義。
第一是讓AI真正懂中國人的世界,中文典籍語法靈活、典故繁多,通用大模型難領會語感與歷史語境,而基於本土語料訓練的主權AI,能更精準理解文本,讓AI“讀得懂”典籍。
第二是讓文化遺產重新“發聲”,中國文化不只有文字,青銅器銘文、碑刻、建築等非文字遺產都藏着深刻思想,主權AI可支持文字、圖像、音頻多模態融合分析,比如解讀工藝圖示,讓非文字文獻被科學讀取。
第三是重建知識間的有機聯繫,數字人文的核心不是信息堆積,而是關係重構,藉助知識圖譜能把人物、思想脈絡織成知識地圖。上海圖書館正把海量文化遺存數字化後建知識圖譜,只是目前大模型利用知識圖譜的效果還需提升。
第四是在算法層面嵌入中國價值,數字人文與大模型並非價值中立,語料會自帶判斷傾向,在多元世界裏如何實現文化包容兼容,是重要課題,而主權AI能推動這一問題的解決。
接下來,劉煒分析了具體的實踐路徑,認為要建設適配中國數字人文的主權AI,應聚焦四項關鍵任務。
一是構建本土化高質量數據底座,不能只停留在傳統語料庫概念,要對古籍、碑帖等文化遺存做統一標準、集中管理,建設帶目標性標註的海量專屬語料庫,這是基礎中的基礎。
二是研發面向場景的專用模型,現在業內已形成共識,通用大模型無法“通吃”所有領域,文化領域需要專屬小模型或多智能體系統,針對性解決數字人文的應用需求。
三是建設國家級數字人文智能平台,目前大量素材分散在不同數據庫,工具也無法統一使用,只有搭建共建共享的平台,才能打破資源壁壘。
四是形成跨學科人才生態,當前既懂AI又懂人文的人才仍很短缺,即便有改觀也相對滯後,必須加快這類人才的培養。
劉煒最後強調:對數字人文來説,主權AI****不是防禦性概念,而是創造性工具。不應關起門做AI,而是用中國文化邏輯重建AI。這不止是守護數據,更是塑造未來形態**。智能時代,真正的文化實力不在於誰的算力更強,而在於能否讓AI“理解”自己的文明與文化**。
他呼籲:“希望我們攜手,以主權AI為核心,為中國數字人文自主知識體系建設發力,讓中華文明在新的語義空間裏持續生長、發聲、傳播,以智能之光照亮文化之根。”
本文系觀察者網獨家稿件,未經授權,不得轉載。