陳經:從“AI公務員”看AI致用的前景
作者:陈经
2025年初爆火後,多家國內平台陸續接入DeepSeek。2月17日,深圳市福田區也成為其中一員,首批70名基於DeepSeek開發的“AI公務員”正式上崗。這些AI公務員不僅具備通用功能,還能結合實際業務流程,針對公文處理、民生服務、應急管理、招商引資等240個業務場景量身定製。據報道,“AI公務員”公文格式修正準確率超過95%,審核時間縮短90%,錯誤率控制在5%以內;“AI任務督辦助手”跨部門任務分派效率提升80%,按時完成率提升25%。
早在2022年末大模型問世之初,社會上就出現過體驗熱潮,但多數是將AI作為“陪聊”,漸漸的熱情就下降了,真正用於輔助寫作、編程等具體場景的相對小眾。而此次AI公務員的應用真正喚醒了普通人對於“AI致用”的認識,看到了AI在提升社會運行效率、提高政務場景服務質量的潛力與方向。
作為中國高科技產業聚集地之一,深圳敢於首開先河得益於良好的技術條件。與許多行業大模型類似,政務大模型的開發方法是以開源的“基座大模型”為基礎,加入政務場景等行業素材進行專門強化。但包括政務大模型在內,這些行業大模型應用往往受限於“幻覺”等結構性缺陷,必然存在輸出質量不穩定的問題,只在少數領域實現了窄範圍的應用。這對有極高準確性要求的政務服務而言也是致命性的難題。受限於基座大模型的能力,融入行業素材專門訓練只能緩解問題,難以對用户體驗實現根本性的提升。其結果就是AI客服等服務型大模型往往存在差錯率高、理解力弱、難以完成定製化任務等問題,只能嚐鮮,大規模推廣應用並不容易。
但隨着開源大模型DeepSeek在性能上追平美國最先進大模型的同時,算力效率上還大幅領先,局面已經發生了巨大改變。DeepSeek給出了在有限算力下實現高性能大模型輸出的方案,以DeepSeek R1“滿血版”作為基座大模型,行業大模型性能正在越過有效應用的臨界點,也讓大模型發展方向從追求絕對性能向效率革命轉變。在新的發展趨勢下,藉助政務、教育、製造業多樣化的場景應用,更高性能的場景化大模型在經歷不斷使用、反饋迭代之後,其能力將實現高效的升級,更好地滿足用户需求,其應用場景也將進一步拓展。
這就是基座大模型的優勢。中國本就具備產業鏈齊全、數字經濟繁榮的特點,大模型的潛在應用場景全球最多。一旦大模型性能有突破,再加上開源帶來的廣泛應用、快速反饋,中國的人工智能應用場景優勢就能迅速得以發揮。未來,中國大模型應用有望像電動車、無人機、機器人等領域一樣享譽全球。
這將讓中美人工智能競爭擴展一個維度。毫無疑問,美國短期內仍會嚴控高性能GPU出口,甚至將管控機制推廣到更多國家,分級管理,從而憑藉算力優勢,在大模型最高性能的競爭中保持領先。近期,OpenAI一改故作高深的神秘做派,緊急上線了多種大模型以展示能力,力圖證明DeepSeek不過是曇花一現,美國很快就能再次掌握主動。
但是,就如多數的工業應用,大模型應用並不需要最高的性能,性價比才是更優先的考量因素。且關鍵在於,開源的、性能達標的、易得的基座大模型,已經滿足了多數場景下的需求,且隨着場景化的深入,國產大模型在便利性、靈活性上都具有更大優勢。
不僅是AI公務員,許多中國企業都在摩拳擦掌、積極探索應用場景,期待將高水平開源大模型融入自家產品和服務流程。隨着中國引領大模型應用場景不斷拓寬,基座大模型研發、應用產品開發、應用推廣、反饋迭代的完整產業循環即將閉環,相信還有更多AI應用場景和新“AI職業”將被創造出來,帶給人們更多驚喜。(作者是科技與戰略風雲學會研究員)