為什麼中國人工智能落地已經遙遙領先全球?_風聞
汪涛_纯科学-自由撰稿人-纯科学创始人,致力于将完善的科学方法引入社会领域1小时前
現在媒體上普遍的看法是:中美在人工智能領域處於世界上第一梯隊,與其他國家已經拉開差距,而美國又明顯領先中國。具體來説,美國在基礎人工智能技術,尤其是大模型,人工智能芯片等方面明顯領先,中國在人工智能的具體行業應用上具有優勢。
我在上一篇文章“AI大模型、中模型、小模型誰主沉浮?”對以上看法總體上也算是認同的前提下,對AI大模型、中模型和小模型各自的不同應用前景進行了具體分析。本文是在參觀過2024年10月22號開幕的北京安博會之後,有了更深入的理解,將更進一步特別細化地討論,中國人工智能技術為什麼事實上已經處於遙遙領先世界的狀態,以及究竟領先在何處。
一、傳統人工智能應用的普及
事實上,在大模型出現之前,中國在人工智能實際落地的能力上就已經處於世界非常領先的水平。因為以往人工智能最成功的技術,就是車輛、人、語音等的識別。相應成功的應用是停車收費,社區、道路等人工智能的安防監控。這些已經在中國獲得廣泛的普及,並且產生了巨大的經濟和社會效益。大模型技術的出現,是沿着原有的人工智能應用進行了更大範圍和更深程度的擴展。以往的人工智能安防應用是這樣的:
在模擬時代,記錄的視頻是獨立的數據,按行業術語説就是沒有進行“結構化”。如果要在視頻中找尋某個對象,得依靠人工逐個時間點地去翻看,這個效率實在是太低了,要查尋到某個視頻記錄,耗費很多人力資源花上幾天時間都有可能。
採用人工智能技術後,可以實現視頻的結構化。也就是可以智能地識別出視頻中車輛的車牌、顏色、車輛型號,甚至司機是否系安全帶,另外還有行人智能識別等。有了這些識別出的數據並與視頻內容相對應地進行記錄,如果再查尋視頻就會變得極為方便,只要輸入某個車牌號或其他信息內容,就可以瞬間查尋到相應時間點的視頻片段。
可以説,雖然人工智能的出現很早,並且持續地有人提出各種人工智能的應用。例如下各種棋勝過人類職業冠軍選手等,但人工智能第一次真正獲得大規模商業回報,就是視頻安防領域。其他的技術如語音識別,它只是其他各類應用的一個免費的功能(如微信的語音輸入、語音識別鼠標等),它自己很難形成獨立的產品。
但這個階段的人工智能也有一些限制,就是要想識別什麼類型的信息,必須是提前確定好,由企業研發人員進行相應數據的訓練和優化。這樣,如果要增加某個功能,比如説要新增識別三輪車,就需要企業研發人員來建模和對前方市場人員收集回來的數據進行訓練。這樣新增某個應用的週期就會非常長,成本也會非常高。
二、採用大模型技術後的人工智能應用極大擴展
採用大模型技術以後會是什麼情況?
首先是數據訓練的工作可以非常簡化,能前移到代理商或其他本地專業服務者那裏進行。這樣他們就可以對自己特定環境的對象進行針對性的訓練。例如,動物園可以用相同的軟件來訓練識別動物,而不再侷限於車輛;學校可以訓練打籃球、跳遠等,是判斷運動員有沒有犯規,而不是判斷司機有沒有系安全帶…..這一下就打開了非常廣闊的應用空間。要實現這一點需要什麼具體產品來支撐呢?首先當然就是得開發出本地或特定領域應用的數據訓練平台。

這是浙江宇視建立在自己梧桐2.0大模型基礎上的算法訓練平台,客户可以根據自己的需要訓練特定應用的數據。
這一下就讓行業的應用拓寬到近乎無限的領域。例如,可以用來監控特定受保護的動物。

可以應用到各種智慧社區細分應用場景 —— 如寵物狗佩戴的安全罩是否合規?車輛停放是否佔道?是否有着火點?是否有人違規從高層樓房拋物?垃圾袋放置是否合規?廚房的廚師工作中是否有不合衞生的行為?生產工位上的生產是否正常?被生產的零件是否正常?生產設備是否出現意外情況?嚴禁煙火的地方是否有人吸煙?……
當然,最可能點燃新一代人工智能新的大規模應用的,可能不是那些看起來有些嚴肅的業務,而是娛樂性的AI體育。正如我年初寫的一篇文章中的説的那樣:科技以好玩為本。這也是電信運營商可以大力開發的領域。
人們可能會問一個問題:大模型出現以後,以上應用的識別率是否有實質性的提升呢?回答是肯定會有一些提升。
屏幕中左下角是手機拍攝的晚上的視頻效果。主屏是硬件進步加上採用現在人工智能所達到的晚間視若白晝的效果。
這是在暗室裏拍攝的圖像效果。上面四個圖像分別是不同時期技術效果的對比。左上角是早期黑白紅外效果。右下角是獲得彩色和較高分辨率的效果。這同樣是硬件進步加上人工智能算法進步共同作用的功勞。而且以上人工智能的進步也未必全都與大模型有關係。
可以告訴大家一個可能令人非常意外的情況是:以上這些圖像識別率和還原效果等的提升的確是非常好的進步,但對人工智能尤其大模型技術來説並不是革命性的。真正重要的只是因為遠比過去更方便,所以才能讓各種細分的應用成為現實。也就是説,原來的人工智能,單純從技術上説早就可以獲得很多應用,只是因為細分市場收益與研發投入之間不成比例,所以主要是經濟性上的原因阻礙了這些應用成為現實。大模型的真正價值是使大量不同細分應用的數據訓練變得極為方便,可以不再需要研發人員參與,這才使性價比達到可以實用化的程度。
能把這種性價比實際變現的,主要就是中國企業。
將這種大模型真正落地的,就是中模型。
三、採用大模型技術靈活訪問中模型的應用
中模型可以使人工智能的應用領域無限地擴展,那麼最終用户如何同樣方便地訪問和 應用它們呢?大模型技術的確也在這方面提供了同樣的方便性。以往在視頻結構化以後,進行訪問時是採用精確或模糊的關鍵詞匹配。例如要查某個車輛號的車的行進軌跡,是輸入某個車輛號後進行精確匹配或一定程度的模糊匹配。這個對使用者輸入的關鍵詞是有一定要求的。
採用大模型技術以後,相當於有了接近語義理解的能力。輸入某個問題後,並非是精確或模糊的關鍵詞匹配,而是會通過大模型進行語義搜索。例如,浙江宇視的萬物搜,只要輸入一個問題,系統會根據問題搜索出符合要求的視頻。

輸入“一個穿着京東快遞衣報的人”,萬物搜系統就可以把視頻庫中符合要求的相應圖像給找出來。

如果輸入的是“穿着閃送衣服的人”,萬物搜的結果就是圖像中有穿着閃送衣服的人員。
你也可以輸入“帶着寵物狗的顧客”“帶小孩的顧客”“穿紅衣服的人”“手拿提包的女士”“一羣打架的人”“兩個吵架的男士”“出現老虎的畫面”“出現猛禽大鵟”“猛禽入水捕魚”等,系統都可以根據要求迅速搜索出符合語義要求的視頻結果。

這樣就使應用變得極為方便,也有利於非專業人員的應用。當然,如果增加一個語音識別輸入,就可以實現語音訪問。
四、實現中模型的設備
人們往往把對人工智能的期待集中在那些性能最強的英偉達芯片,或大型的計算中心上。但真正要實現大規模商業化應用,必須使得其成本在可控的範圍。與上述中模型應用相配合的,可以是雲,也可以是如下盒子裏的設備。通過將需要訓練的數據和應用高度約束在極為有限的範圍,就可以極大地降低數據訓練的規模和存儲容量、計算能力。使得在非常有限成本的前提下,實現所需要的功能。
人工智能各種應用中最重要的就是識別,完成識別之後,進行控制相對來説就比較容易了。無論是機器狗、無人機還是智能生產設備等都是如此。



深圳無人機團隊在沙特秀出的無人機羣展現國王頭像。
五、大模型的價值還有多少提升的空間?
最後,我們再來談一下大模型技術以及為什麼本文主題要説“中國人工智能已經遙遙領先全球”。大模型本質上的價值就是一個智能化的人機接口。簡單回顧一下人機接口的某些發展歷史是很有參考意義的。我使用電腦的歷史是從20世紀80年代初的蘋果II開始,使用過IBM的8086 AT機,蘋果的麥金塔,對微軟操作系統是從DOS 2.0版本開始用,一直到今天的Windows 11。
我在20世紀90年代初北京郵電大學研究生期間學習圖像處理時,使用的軟件開發平台是當年SGI公司的專業圖形工作站。微軟的操作系統從命令行的DOS5.0到Windows3.1是一個真正的飛躍。直到Windows95,才算趕上蘋果麥金塔視窗系統最初的效果。可能會讓大家感到非常意外的一件事情,可以説直到今天的Windows 11,效果都沒有超越上個世紀90年代初SGI工作站X-Windows 的專業水準。從Windows95大致穩定,一直到今天的Windows 11,硬件性能有近百萬倍的提升,軟件技術水平也有巨大進步,但使用者很難感覺到它有什麼本質的變化。
怎麼會是這樣?因為人類對人機接口的需求也是有限的。面向普通用户使用的微軟Windows系統並不需要最專業的視窗效果,重在普通人便於使用。普通人甚至不太希望界面有過多的變化。正因如此,才導致了界面變化太多的Windows8市場銷售上的很不成功。
但是,人們接受到的技術概念多是大眾媒體上非專業人員的炒作。美國人又特別善長於炒作概念,每隔一段時間就會換一個IT技術概念來炒作。包括炒作者本人都不完全理解這些技術內涵到底是些什麼東西。但凡出現一個新東西,都是一場“革命”,要帶來顛覆性的結果。不僅中國是如此,美國同樣是如此。甚至美國在這個領域的那些專欄作家,暢銷書作者大多也都是外行。這很容易給人們在技術上造成偏差過大的理解。
未來學家和數學家維爾諾·文奇 (Vernor Vinge)所理解的技術發展路徑
真實世界一切實際技術的發展路徑。只是在跨越新台階的瞬間,才出現讓人誤以為是奇點的特徵。
美國在大模型上的確是領先的,但這種領先就如同新的視窗系統,最容易秀出新花樣,最容易吸引外行人,但卻並不是技術進步真正能落地的商業應用所在。縱觀人工智能以及其他類似技術的發展歷史,並不是什麼到一定時間點會出現一個奇點,然後就無限地湧現或指數級提升,而是的確在某一個時間點上會出現一個瞬間指數級提升的飛躍,然後很快就基本上停滯在這個新的平台上,以非常緩慢的、甚至人們都察覺不到的進步速度繼續提升。所以,從來都沒有,未來也不會有什麼奇點,只不過是一個又一個高度有限的技術或產品台階的階段性飛躍而已。
也就是説,美國領先的大模型,已經完成了邁向新台階的過程,中國也已經完成了這個新台階的躍升過程。後續在大模型上的進步,就基本上屬於沒多大實際意義的、在新台階上緩慢的變化。中國企業在過去人工智能技術的落地能力上就已經遙遙領先全世界,例如浙江宇視可以説核心能力就是AI+視頻,在將AI技術落地上從一開始能力就非常強。在今天的中模型和小模型領域,中國企業的AI落地能力更是獨步全球,而這些工作才是有實質性意義的商業應用和進步。
延伸閲讀:
資深IT人詳解什麼是“元宇宙”——細説歷史上那些“什麼都不是”的概念
中國科技企業如何避坑:十年7個技術方向,1/128,選擇題全對