從“喂數據”到“喂現實”,MogoMind大模型撕開物理世界缺口_風聞
互联网江湖-1小时前
文:志剛@互聯網江湖
電影《I, Robot》的劇情,終於要在現實上演了?
這兩天,應朋友邀請來了一趟上海,世界人工智能大會在上海開幕了。
這屆WAIC2025,參展的企業很多,不少都是做技術應用的企業,也有不少車企。
六座特斯拉剛公佈沒多久,我就想着到特斯拉展台看看。可沒想到真正勾起我探索欲的,卻是隔壁的另一家做大模型的企業:蘑菇車聯。
這屆WAIC大會上作為中美自動駕駛玩家的代表,特斯拉帶來了賽博皮卡,蘑菇車聯發佈了首個即時理解物理世界的MogoMind大模型。
MogoMind大模型是一個為多類型智能體提供物理世界即時信息的深度理解和規劃決策服務的大模型,簡單地説,蘑菇車聯給大模型裝上了認識真實世界的“眼睛”。
皮衣教主老黃不久前説,下一波浪潮將是物理AI。
對此我深以為然。我一直都認為,DeepSeek、ChatGPT、可靈、sora湧現只是個開始,AI真正的浪潮,應該是有更多物理交互的AI。
也因此,MogoMind這樣能夠即時理解物理世界大模型,才更有看頭。
用現實“喂”出來的AI,能有多炸裂?
MogoMind大模型與其他AI大模型最大的一個不同在於,它是從即時物理世界裏長出來的,別的AI大模型是“喂數據”,而MogoMind本質上是“喂現實”。
MogoMind的數據不是產生於某個特定的數據集,而是通過接入物理世界即時動態數據,形成全局感知、深度認知。
舉個例子,在交通場景下,依靠攝像頭、激光雷達等硬件,MogoMind能實現即時全局感知,對暴雨、大霧等惡劣天氣以及道路施工、突發事件等特殊狀況,MogoMind都能快速認知理解。
如果發生突發交通事件,MogoMind可在數秒內實現交通事件的超視距即時感知,迅速計算出受影響的路段範圍,然後將預警信息推送至周邊車輛和交通管理部門。
這個能力多炸裂?相當於給駕駛員“開天眼”。
記得去年7月份的山洪導致高速路橋垮塌的新聞嗎?試想一下,如果能夠部署能感知現實環境的大模型來預警,事故傷亡是不是可能就會減少甚至避免發生?
除了識別風險即時預警這樣的“開天眼”的能力,在城市交通中,MogoMind也能感知全局,優化信號燈時長、遭遇交通事故時即時規劃路徑,提升整體的道路通行效率。
MogoMind與傳統大模型的不同在於,它解決了大模型應用的兩大核心問題:
第一:具有即時感知現實世界的能力。
從現實世界裏學習,然後通過物理交互反饋到現實,是MogoMind最大的特點。
DeepSeek也好ChatGPT也罷,市面上的大部分自然語言模型,大都由互聯網的數據集訓練而來,所以,語言大模型參數的大小,一定程度上代表能力的大小。
互聯網上的信息,其實是“二手信息”,是由人們創造,而且很可能會失真。比如AI“説謊”的問題。
今年3月份,哥倫比亞大學一份針對主流AI搜索工具的研究發現,在測試了8款AI搜索工具後,發現AI引用新聞方面平均出錯比例達60%。
各種各樣的AI大模型工具應用越來越多,今天的AI不缺創造世界的能力,而是缺“認知物理世界”的能力。
感知、理解真實世界,才是AI生產力的應有之義。
與其他自然語言模型不同,MogoMind大模型則是直接通過傳感器獲取,比如攝像頭、毫米波雷達。
換言之,MogoMind是從現實的應用場景裏面“長出來”的。
自此,AI大模型技術不再是“紙上談兵”,而是在現實世界裏,能給人類的混亂無序在物理意義上糾偏。
對此,我稱之為:“物理原生模型”。
實際上,“物理原生模型”能夠更多地幫助人們解決現實的問題,而“數據原生模型”適合作為信息生產力工具,後者多是面向C端的內容、創意工具產品。而前者更多地構成AI影響物理世界的基礎設施。
之所以產出如此大的差異,原因之一可能在於,認識感知真實世界的AI模型,也同樣擁有解決複雜的現實問題的能力。
就引出了第二個問題:“物理原生模型”有着全局視角下的AI推理、即時決策的能力。
實際上,多維的現實數據的感知、推理、分析、決策能力,使得AI大模型實現了從“單點智能”到“全局智能”,由此,AI大模型逐漸跨過“單細胞時代”。
過去的AI大模型的單點智能,就像是生命進化到“單細胞生物”階段。只能對單一環境信息作出反應,執行單一場景的任務。
而有了即時物理感知能力和全局AI認知系統,就有了感知複雜環境,並做出應對的能力。從而過渡到“多細胞時代”。
我們還是以MogoMind大模型為例,MogoMind擅長處理視頻、圖像、文本、氣象等多源數據進行深度融合分析,所以,能夠實現對物理環境信息即時認知理解。
試想這樣一個場景,暴雨天氣城市積水路段,司機很難判斷前方涉水深度是否能安全通過,而AI大模型可以結合即時天氣數據以及歷史事故數據預測潛在危險區域。從而有效避免人身、財產損失。
總體來看,與DeepSeek、ChatGPT們很不同,MogoMind基於現實數據的大模型能力很特別。
看得出來,蘑菇車聯選擇的這條路,很有前景也很有想象力。他們的目標其實是實現一件事兒:把AI的數字世界,與我們生活的物理世界融合起來。
MogoMind看似做的是大模型,但其實是在做一個連接AI與現實的操作系統。
這個“操作系統”能夠用AI連接很多領域,比如自動駕駛、智慧交通、城市治理,還能與無人機、機器人產業深入融合。
目前蘑菇車聯的兩大業務板塊是“AI網絡”和“自動駕駛車輛”。
基於MogoMind大模型,蘑菇車聯打造出一系列具備AI能力的產品,並在多個城市應用落地。比如,在進入嘉定區即時數字孿生路口,看到車輛即時信息,例如速度、經緯度、大小完全瞬時還原成數字孿生畫面。
這些即時數據,可通過佈設路側智能終端或利用已有的攝像頭等方式來獲得,然後通過AI大模型解讀分析後,再將有價值信息通過5G和C-V2X等通信技術,傳輸交管部門等應用側,
對於交通領域參與量級最大的車輛終端,AI網絡同樣可以提供即時數據、即時預警和安全效率類幫助信息。
自動駕駛車輛業務方面,目前L2+級別的軟件已經上車,RoboBus、RoboSweeper 和RoboTaxi也已經在北京、上海、天津等十餘個城市落地運營。基於物理世界的認知模型,這些已經上路的車輛,進一步深入AI大模型與物理世界的深度交互。
看完蘑菇車聯站台的內容,我不由得想到了由阿西莫夫小説改編的電影《I, Robot》。其中有這麼一段的劇情:威爾·史密斯飾演的警探發生交通事故之後,AI迅速出警處理事故現場。
這部電影於2004年上映,不由感慨,短短二十年後,科幻電影裏的場景,終於有可能變成了現實。
其實很多科幻電影中的概念,都正在成為現實。
比如,數字孿生。所謂數字孿生,簡單地講,就是用數據模擬現實世界,然後工程師、設計師可以在虛擬的世界裏,低成本搞出來各種創新、創造。
現在各個行業比如汽車、飛機乃至火箭的設計、製造過程中都有數字孿生技術的身影。
數字孿生之外,其實還有一個更炸裂,更科幻的概念:即時孿生。
所謂即時孿生,就是AI能夠認識、理解物理世界之後,通過數據模型的推演、決策,來即時解決現實裏的問題。
聽起來有些科幻,但這就是MogoMind大模型在做的事情。
從數字孿生到即時孿生,本質上是給AI一個自我生長的機會。從認識真實世界,到自我感知世界,AI便有了自我進化的機會。
由此,當AI生長出自我進化的能力,將來再與機器人產業結合,這便是未來二十年AI技術真正的想象力所在。
一場待來的物理AI應用革命
教會AI認知物理世界的能力,是AI技術應用的必然趨勢。而MogoMind則踏出物理AI應用革命的第一步。
AI大模型應用最有前景的兩個領域:機器人、自動駕駛。
本質上這兩個領域的核心是一種技術體系:AI對於物理世界的影響和反饋。
馬斯克的理想與最終目的是上火星,但還是創立特斯拉,搞自動駕駛,然後又搞機器人。本質上,這是從第一性原理的角度出發:一種技術要改變世界,必須是能反映到現實層面裏的。
AI也是這個邏輯。
當前的AI技術,影響數字世界的比例太多,影響現實世界的比例還是太少了。
未來AI生產力要發展,需要一場“物理AI應用革命”。
MogoMind的影響在於,它構建了一套基礎交通場景下的AI即時物理感知能力和全局認知系統,相當於“授AI以漁”。
這就好比老師教一個在幼兒園階段的孩子,要想讓孩子未來成為棟樑,就先得教他正確認識這個世界,然後對於物理世界要做出正確的反饋。
在“教AI認識世界”這件事兒上,MogoMind大模型踏出了關鍵的第一步。
還是拿出行領域來説,今天的AI大模型、自動駕駛技術、蓬勃發展,正如當年工業革命如火如荼,汽車工業快速增長一樣。
當年的技術為什麼能迅速改變世界?
其中一個原因可能在於蒸汽機、內燃機技術對物理世界的影響足夠直接。
跨入信息時代,人們創新知識的速度變快了,但技術對於物理世界的影響也變得沒那麼直接了。
比如互聯網技術,不是直接推動生產力,而是改變生產關係,進而推動社會發展。
AI時代與互聯網時代不同,技術對物理世界的影響正在重回主流。你看,DeepSeek、ChatGPT之後最火的不還是機器人、自動駕駛等產業?
在出行這個領域裏,這種更直接影響表現的會更明顯。
比如,全局感知的即時交通數據流分析、決策,改變了出行效率,早上出門上班通勤,路上明顯不堵車了。
再比如,AI多模態數據理解和複雜場景認知能進一步提升車輛自動駕駛能力,有了更強的輔助駕駛,開車這件事兒變得更加輕鬆、愜意了。
也許,我們數十年後再回看今天發佈的MogoMind,這些感受可能會更深。
其實不只是出行,如果放在整個AI產業,AI大模型技術融合物理世界,也將成為一個重要的技術演化節點。
紅杉AI峯會上,OpenAI CEO 奧特曼預測了未來三年AI改變我們的生活的三種方式。他認為,2025年,AI智能體真正開始走向實用;2026年,AI做出重大科學發現,推動下一波經濟增長;2027年,AI將進入物理世界創造價值。
當然,AI真正改變物理世界創造價值,還需要一個演化階段。
互聯網技術被髮明出來之後,微軟做出了office,谷歌做出了Chrome,人們才能把PC這個工具用起來。後來,隨着摩爾定律演化,PC信息處理的速度幾何倍上升,股票交易速度更快了、信息傳遞的速度也更快了。
由此,互聯網從技術生態,走向了經濟生態。
AI改變世界也需要從技術生態,走向經濟生態。這也是AI大模型技術融合物理世界的意義。
AI融入物理世界,是能產生很多經濟效益的。比如,自動駕駛降低了出行成本和風險,那麼周邊旅遊是不是就更火了?再比如,在某些特定行業,有機器人替代人們做危險係數高的工作,是不就能減少必要的安全風險成本?
從機器人到自動駕駛、從出行到千行百業,AI進一步融合物理世界,人們經濟活動的增長範式,或將就此改變。
當AI融合物理世界足夠深,機器人實體的成本進一步降低,電影裏的全民Robot的時代,也許真就不遠了。