陳經：從“AI公務員”看AI致用的前景

作者：陈经

2025-02-19

2025年初爆火後，多家國內平台陸續接入DeepSeek。2月17日，深圳市福田區也成為其中一員，首批70名基於DeepSeek開發的“AI公務員”正式上崗。這些AI公務員不僅具備通用功能，還能結合實際業務流程，針對公文處理、民生服務、應急管理、招商引資等240個業務場景量身定製。據報道，“AI公務員”公文格式修正準確率超過95%，審核時間縮短90%，錯誤率控制在5%以內；“AI任務督辦助手”跨部門任務分派效率提升80%，按時完成率提升25%。

早在2022年末大模型問世之初，社會上就出現過體驗熱潮，但多數是將AI作為“陪聊”，漸漸的熱情就下降了，真正用於輔助寫作、編程等具體場景的相對小眾。而此次AI公務員的應用真正喚醒了普通人對於“AI致用”的認識，看到了AI在提升社會運行效率、提高政務場景服務質量的潛力與方向。

作為中國高科技產業聚集地之一，深圳敢於首開先河得益於良好的技術條件。與許多行業大模型類似，政務大模型的開發方法是以開源的“基座大模型”為基礎，加入政務場景等行業素材進行專門強化。但包括政務大模型在內，這些行業大模型應用往往受限於“幻覺”等結構性缺陷，必然存在輸出質量不穩定的問題，只在少數領域實現了窄範圍的應用。這對有極高準確性要求的政務服務而言也是致命性的難題。受限於基座大模型的能力，融入行業素材專門訓練只能緩解問題，難以對用户體驗實現根本性的提升。其結果就是AI客服等服務型大模型往往存在差錯率高、理解力弱、難以完成定製化任務等問題，只能嚐鮮，大規模推廣應用並不容易。

但隨着開源大模型DeepSeek在性能上追平美國最先進大模型的同時，算力效率上還大幅領先，局面已經發生了巨大改變。DeepSeek給出了在有限算力下實現高性能大模型輸出的方案，以DeepSeek R1“滿血版”作為基座大模型，行業大模型性能正在越過有效應用的臨界點，也讓大模型發展方向從追求絕對性能向效率革命轉變。在新的發展趨勢下，藉助政務、教育、製造業多樣化的場景應用，更高性能的場景化大模型在經歷不斷使用、反饋迭代之後，其能力將實現高效的升級，更好地滿足用户需求，其應用場景也將進一步拓展。

這就是基座大模型的優勢。中國本就具備產業鏈齊全、數字經濟繁榮的特點，大模型的潛在應用場景全球最多。一旦大模型性能有突破，再加上開源帶來的廣泛應用、快速反饋，中國的人工智能應用場景優勢就能迅速得以發揮。未來，中國大模型應用有望像電動車、無人機、機器人等領域一樣享譽全球。

這將讓中美人工智能競爭擴展一個維度。毫無疑問，美國短期內仍會嚴控高性能GPU出口，甚至將管控機制推廣到更多國家，分級管理，從而憑藉算力優勢，在大模型最高性能的競爭中保持領先。近期，OpenAI一改故作高深的神秘做派，緊急上線了多種大模型以展示能力，力圖證明DeepSeek不過是曇花一現，美國很快就能再次掌握主動。

但是，就如多數的工業應用，大模型應用並不需要最高的性能，性價比才是更優先的考量因素。且關鍵在於，開源的、性能達標的、易得的基座大模型，已經滿足了多數場景下的需求，且隨着場景化的深入，國產大模型在便利性、靈活性上都具有更大優勢。

不僅是AI公務員，許多中國企業都在摩拳擦掌、積極探索應用場景，期待將高水平開源大模型融入自家產品和服務流程。隨着中國引領大模型應用場景不斷拓寬，基座大模型研發、應用產品開發、應用推廣、反饋迭代的完整產業循環即將閉環，相信還有更多AI應用場景和新“AI職業”將被創造出來，帶給人們更多驚喜。（作者是科技與戰略風雲學會研究員）