鍾新龍:大模型也有“不可能三角”,中國想保持優勢還需解決幾個難題
guancha
編者按:隨着ChatGPT的爆火以及具身智能的大規模出現,利用AI大模型的通用人工智能帶領人類進入第四次工業革命的設想,在歐美世界尤其是金融圈成為最熱門的話題。受此影響,國內不少相關人士也在強調美國領導的西方體系會利用其“算法+數據+算力”的三重優勢對我國形成技術代差,從而導致我國在潛在的“第四次工業革命”中落於人後。
但是隨着人工智能大模型的演進和實踐,更多人意識到,這套敍事存在邏輯瑕疵。而在這場再認識的過程中,更多人對於人工智能的潛力和侷限有了更明晰的認知。於是就在今年4月,工業和信息化部直屬單位中國電子信息產業發展研究院(賽迪研究院)正式發佈了《人工智能賦能新型工業化:範式變革與發展路徑》報告。
在人民大學和賽迪集團聯合舉辦的“人工智能賦能製造業:國際治理經驗與產業安全”會議上,賽迪研究院未來產業研究中心人工智能研究室主任鍾新龍先生就人工智能在賦能新型工業化的過程中所遇到的阻礙和未來發展前景進行了系統闡述。觀察者網獲人民大學國際關係學院副院長、區域國別研究院翟東昇院長授權,整理、刊載鍾新龍先生演講全文。
【演講/鍾新龍,整理/觀察者網 唐曉甫】
很多人説“人工智能的歷史既長又短”。
其“長”,在於人工智能概念可以追溯至1950年,當時計算機奠基人圖靈提出了著名的“圖靈測試”。他認為,若第三方無法區分計算系統與人類的回答來源,則可認為該系統具有智能。由此,人工智能的概念自1950年起便有了理論基礎。
其“短”,則在於大眾層面對人工智能的廣泛接觸,應當以2022年11月發佈的ChatGPT為分水嶺,截至今日僅有兩年多的發展歷程。

圖靈&ChatGPT
我們認為,大模型時代的到來標誌着人工智能進入了一個新的發展階段。在我們看來,通用人工智能是人工智能進入高階階段的標誌。
在這個階段,傳統的機器學習、深度學習等技術與之並非彼此排斥,實際上可以協同為製造業賦能。
迄今為止,我們已經在智能製造領域建設了一批智能工廠,其中包括不少剛剛評定為卓越級智能工廠在內的智能工廠。通過“人工智能賦能新型工業化”工作的推進及研究過程中案例徵集情況來看,我們發現,我國人工智能在工業領域的應用正由單點突破向系統集成發展。此前,人工智能在質檢、判別及工業流程等單一環節有較多應用,整體較為集中。而我們當前的目標是實現其與更多工業系統的深度融合。
總體而言,人工智能可在工業領域提升生產力和效率、創造價值、優化資源配置。基於上述三方面的賦能,人工智能能夠加速培育新質生產力,成為推動經濟發展的重要引擎。
以此為基準,我們期望人工智能能夠賦能千行百業,實現“人工智能+”與“+人工智能”的雙重迭代和賦能。誠然,我們對通用人工智能賦能工業化寄予厚望;但現實情況是,當前工業領域仍大量依賴前些年開發的小模型。當今中國,大小模型並存的局面已成為工業實踐中的常態。
在工業領域,當前小模型主要負責結構化數據處理與精確預測;而以GPT、DeepSeek為代表的生成式大模型則擅長處理複雜的非結構化新數據。就製造業流程而言,通常可分為離散型製造業與流程型製造業兩大類。
目前看來,人工智能在智能製造基礎紮實的重點領域表現最佳且成熟度較高,例如汽車製造業。現在我們看到人形機器人優先選擇進入汽車廠的原因在於,汽車行業作為離散型製造業,其屬於智能製造領域,是數據採集環境和處理能力最好的那一檔。這也是我們常説,人工智能優先賦能合適領域的邏輯。
若將工業製造流程劃分為研發設計、生產製造、經營管理和產品服務四個環節,在綜合數百個典型案例後,我們發現大模型和小模型在不同領域的應用滲透率呈現“正U型”與“倒U型”疊加趨勢。總體而言,小模型更多用於單一場景的判別,呈現“倒U型”分佈,這與其適用於單一場景的特性相吻合。

生成式AI(大模型)和判別式AI(小模型)在工業主要領域分佈情況
相較而言,以生成式人工智能為主的大模型在工業賦能領域仍處於初級階段。當前,大模型主流應用集中於智能客服、業務管理或邊緣性建議中。而大多數人所期望的,是讓大模型直接介入生產製造流程,乃至實現自主決策的高階自動化應用方面,大模型尚在迭代探索之中。
總體來看,人工智能在製造業領域主要有五大賦能目標:一是效率提升,如排產調度優化等;二是質檢改進,通過視覺神經網絡等技術提高檢測效率;三是成本降低,這是工業賦能的核心命題;四是創新驅動,希望生成式大模型在產品設計、工藝優化等方面提供新思路;五是決策優化,旨在為企業管理層提供更科學、及時的決策支持。
我們現在常説,“AI for Science”。未來,我們期望其進一步發展為“AI for Industry”,並最終實現“AI for Society”的社會價值。目前,人工智能在工業領域的賦能仍以人機協同、共同進步的創新研究為主。
從實地調研來看,AI大模型在工業領域的賦能尚未達到預期的成熟應用階段,而仍處於初級階段。這背後有多重原因,其中首要問題是應用場景推廣與落地難題。
首先,工業場景細分程度極高。我們固然期盼通用解決方案,包括大家一直期待的所謂智能體打通大模型落地的“最後一公里”,但在實際工業場景中,經常出現一條指令往往會影響數億元的決策,目前的智能體尚無法對相關風險進行充分控制,因而難以實現落地。
其次,工業領域涵蓋眾多細分行業與應用場景,每個場景均具有獨特特點與需求,難以研發出通用的人工智能解決方案。過去二三十年工業化進程中積累的數據分散於不同系統,人工智能應用呈碎片化特徵,往往只能適用於特定場景,難以在更廣泛範圍中推廣,這增加了技術落地的難度。
第三,由於工業生產過程中的數據分散於不同系統中,且在數據格式與標準上缺乏統一性,獲取與整合這些數據需要耗費大量時間和資源。人工智能解決方案通常需要高度定製化,這進一步增加了開發成本與實施難度。碎片化的系統與數據架構必然導致智能體定製門檻和響應時間呈指數級增長,可能與企業快速響應市場需求的目標相沖突。
最後,從企業開發角度出發,大家普遍期望擁有一個可以通行千行百業、快速複製的大模型,以降低邊際成本。然而,由於各行業之間存在巨大差異,不同場景下開發的人工智能模型難以直接應用於其他場景,這降低了導致模型複用率下降,增加了總體開發成本。
這使得定製化人工智能解決方案的成本難以攤薄,投入產出比低,難以形成可持續的商業閉環。高成本、低迴報的局面嚴重阻礙了企業採用人工智能技術的積極性。
人工智能的三大核心是算力、算法、數據,但在實際落地過程中,數據治理也是人工智能落地的障礙之一。這些挑戰既涉及數據的獲取與整合,也涵蓋了數據的處理與安全應用,以及數據權屬與價值評估的劃定。由於這些問題的存在,人工智能技術在工業領域的應用效果大打折扣,需要從多方面加以突破。
具體而言,分為三點:
第一,在工業生產環節,要想獲得和整合關鍵數據並非易事。生產過程中產生的核心數據往往藴含商業或技術機密,企業通常不願共享這些數據。與此同時,傳統工業設備並不具備完善的數據採集能力,增加了數據獲取的難度,同時整合也面臨着巨大挑戰。工業企業通常使用多個獨立信息系統,系統間的數據格式和標準上的顯著差異,導致數據的統一整合面臨重重困難。
即便數據能夠被採集,如何清洗噪聲、剔除異常值或補全缺失數據,也是一項巨大工程——尤其是在此類數據與現在用於大模型預訓練的標準數據存在顯著差異的情況下,很容易影響模型的訓練效果與預測準確性。而要在充分利用數據價值的同時確保其安全,存在複雜的技術和管理挑戰,需要企業在數據加密、訪問控制和隱私保護等方面投入大量技術與管理資源。
第二,在數據權屬界定和價值評估方面,工業數據的複雜性使得其難以歸入傳統法律關係客體,導致產權界定模糊。工業數據涉及利益主體多元,其訴求多樣且存在衝突,使得達成共識變得困難。現有工業數據產權界定方法存在不足,缺乏靈活性和適應性,難以應對數據的動態變化。而且傳統法律體系以及現行信息管理的規章制度,對此類數據的規範也存在一定的問題。
第三,現在大模型算法本身也和工業邏輯存在一定衝突,工業追求決策過程可解釋性,要確保可控性和可追溯性達到最高水平標準,不能在準確性方面出現差錯。
然而,目前無論是ChatGPT,還是DeepSeek這些生成式大模型,上述三點都難以完全滿足。這是今天人工智能賦能新型工業化領域仍處於起步階段的原因之一。
實際上,人工智能自身就存在“算法黑箱”問題,因此工業生產一線的負責人和企業在推進大模型應用方面受到諸多限制;同時,由於過程機理的不可解釋性和先天的“算法黑箱”特性,往往正好與這一需求背道而馳。實際上,當一線負責人需要對生產異常進行定位或溯源時,大模型的不可解釋性就成為了最大障礙。
同時,工業生產對精度的要求極高,典型意義上往往需要達到“四個九”(99.99%)乃至“五個九”(99.999%)的可靠性水平;而現階段的生成式大模型卻更常表現為“十次回答中有九次正確、一次出錯”,顯然無法滿足工業級工具的標準。這也在很大程度上解釋了為什麼人工智能賦能新型工業化尚處於起步階段。

大模型由於幻覺等問題,尚不能滿足不少工業需求
所以我們在推動產業-技術雙向對接的過程中,更多是從工業企業與人工智能企業雙向對接的角度入手,但也由此又暴露出以下三大挑戰:
首先是因專業背景差異導致溝通鴻溝。一方面,人工智能技術人員往往缺乏工業領域的實踐經驗,難以準確理解和把握工業專家要求,常常導致前者對生產場景的特殊需求缺乏深刻理解;另一方面,工業領域的專業人員又對人工智能技術的理解和應用能力有限,難以有效配合技術支持方實現技術落地。
其次是因項目定製形式制約泛化應用開發,目前行業內對大模型的落地開發普遍採取項目制、定製化合作方式。這種方式雖然能夠針對單個需求進行深度適配,卻嚴重製約了大模型在工業領域的泛化應用。
一方面,深度定製使得技術方無法利用已有項目經驗和基礎進行快速複製,延長了開發週期,影響了大模型產品的規模效益。另一方面,由於大模型本身的快速迭代導致缺乏標準化解決方案,每個項目都要投入大量資源進行重置基礎工作和並進行適配,增加了項目成本,降低了企業的投資回報率。例如在DeepSeek之前,我們主要考慮的是通用大模型,在DeepSeek引入思維鏈(Chain of Thought)機制,行業主流轉向“推理大模型”。隨着大模型演進,基礎技術迭代之快也讓項目制交付的質量能否保持成為雙方都需要擔心的問題。
第三方面是因商業模式不明影響持續合作,這主要包含兩點,一是AI技術在工業領域的價值變現面臨着巨大的不確定性。即便是OpenAI或Google這樣的行業龍頭,也尚未實現穩定盈利。據奧爾特曼披露,OpenAI每年虧損約50億至70億美元。而AI項目需有持續性的投入,以不斷優化和升級模型,這導致投資回報週期被大大拉長,從而削弱了企業的投資積極性。這是人工智能企業發展中一個懸而未決的問題。

大模型迭代速度很快
二是由於缺乏成熟的商業模式可參考的應用案例和標準化的收益評估體系,供需雙方對價值分配的認知也難以統一。
在對大模型落地至關重要的性能評估方面,學術界常用的AMIE、GPQA等頂刊基準測試,與工業應用場景的需求相去甚遠,無法衡量模型在真實生產環境中的技術水平。要想真正推動大模型在工業現場的規模化應用,亟需依據國內外的工業基礎條件,建立一套契合實際業務場景的評估體系,才能更高效地推進大模型在工業領域的落地。
基於上述分析,我們認為,賦能新型工業化應當以循序漸進的思路推進:在初級階段,優先在封閉且對精度要求極高的場景中採用傳統小模型,同時在對精度要求相對寬鬆的開放場景(如客服問答、流程調度等)中試用大模型。通過先易後難、先用為主的策略,以場景驅動加速技術迭代的模式,讓人工智能在工業領域不斷釋放更高的賦能價值和潛力。
現在通用人工智能仍處於“數字世界”中,而在進階階段,工業生產需要通用人工智能跨越數字與物理的邊界,真正融入“物理世界”。現在不少人推動人形機器人為代表的具身智能進入工廠幹活,就是這種探索的縮影。
從這個角度,以及之前提到的大模型和小模型在產業鏈上的“正U型”“倒U型”分佈特性,我們希望在進階階段可以構建一個大小模型協同的賦能體系:既不盲目追求單一大模型,也不小模型,而是持續探索人工智能的能力邊界,穩步推進應用落地。
最終,在高階階段,我們的目標是實現高度智能的“通用智能製造”。
現在大模型在經濟性、泛化性與專業性之間存在“不可能三角”。我們希望通過大模型和小模型串聯,基於類似Mixture of Experts(MOE)的架構,將大模型與小模型有機串聯,覆蓋端到端、全流程、全要素、全場景的需求,從而為工業整體提供深度賦能。

大模型“不可能三角”
基於上述設想,我們認為工業模型的培養與應用亦需循序漸進、分階段推進。初階段應着力優化提示工程與引導,通過精心設計的提示詞與示例,為模型提供明確的指導,以提升其對任務需求的理解和場景適應能力,實現“先行實施”的目標。
進階階段需要賦予工業模型檢索增強能力,使其在生成過程中能夠根據需要查閲外部知識庫或調用“知識記憶”,在擴展模型知識儲備的同時,進一步拓展應用場景。
高階階段則需通過大規模採集行業內的多源異構數據,從頭預訓練原生工業大模型。在這一階段,應採用模型並行化等前沿技術,充分融入領域知識與實踐經驗,使大模型能夠與其所在領域實現“天生適配”,而非簡單地將DeepSeek一體機直接搬入工廠,實現所謂的“開箱即用”。這種“開箱即用”只能用,但是用得好不好,我想一線人員是很清楚的。
在其他配套要素方面,同樣分為初階、進階和高階階段。算力方面,初階階段政府可利用現有算力資源,集中力量打造區域算力中心,為工業大模型的預訓練與工程應用提供基礎支撐,並規劃建設城市級算力網絡,初步實現毫秒級的低時延算力供應。
進階階段,隨着工業大模型逐步成熟、各行業場景應用落地,算力需求將快速攀升。須加快建設高性能算力集羣,提供算力“加油站”,以滿足工業大模型、尤其是推理環節對海量算力的迫切需求;同時加速部署市級算力網絡,進一步縮短時延,確保算力高效調度。
高階階段,隨着人形機器人、自動駕駛等新興場景興起,相關模型訓練與推理對算力需求將呈現爆發式增長。此階段要着眼長遠,擴容升級算力集羣,構建核心算力樞紐,實現毫秒級跨域調度,為“十五五、十六五”乃至“十七五”期間邁向AGI提供協同配套。
在數據層面,以此前特斯拉FSD在中國落地效果不佳為例,其主要原因在於缺乏中國本土的一手視頻數據、未針對中國場景進行優化。因此,我們期望未來在彙集各行業結構化與非結構化數據的基礎上,對這些多元異構數據及真實迭代數據進行反覆推理與訓練,形成閉環的數據飛輪,攻克能力上的“最後一公里”難題。
因此,我們必須尊重客觀實際,讓大模型優先在數據基礎較好、數字化水平較高的行業開展試點示範。這些行業在信息化建設方面已有較深積累,能夠提供相對豐富且高質量的數據資源,為人工智能模型的訓練與優化提供充分“糧食”,並通過先行先試發揮示範引領作用,形成可複製、可推廣的經驗模式。
同時,需要依託龍頭及骨幹企業的資源與研發優勢,優先解決重大應用難題。一方面,龍頭企業應發揮引領示範作用,充分利用技術、資金、人才等雄厚資源,聚焦行業共性需求,加快推動人工智能規模化應用;另一方面,也要以大模型為牽引,藉助後發優勢,引領國產工業軟件實現彎道超車。
中小微企業因自身難以研發大模型、承擔原生模型訓練與調優工作,應利用體制機制的靈活性,聚焦場景迭代。通過鼓勵中小微企業參與大模型的數據迭代,可以為大模型發展提供多元場景支持,構建大中小企業協同的智能體系。
我們常説,在工業應用領域,我國相較於美國的優勢在於擁有完整的產業鏈體系和更多的工業場景。但是更多的工業場景並不代表我們的需求會比美國方面更大,這些場景真正的價值在於由此產生的持續迭代數據。通過模型與數據飛輪的迭代模式,我們更有可能獲得強有力的創新成果。這正是憑藉全產業鏈體系和豐富工業場景,在未來長期競爭中取得優勢的關鍵。

本文系觀察者網獨家稿件,文章內容純屬作者個人觀點,不代表平台觀點,未經授權,不得轉載,否則將追究法律責任。關注觀察者網微信guanchacn,每日閲讀趣味文章。