對話後摩智能CEO吳強:未來90%的數據處理可能會在端邊
胡嘉烨

今年的世界人工智能大會(WAIC 2025),國產算力芯片的發展仍然備受關注。
在後摩智能展台,後摩智能M50系列產品首次亮相,後摩智能M50芯片與力謀®BX50計算盒子、力擎LQ50 Duo M.2卡等旗下核心產品一同位於展台的核心位置。
作為主打端邊大模型和存算一體的芯片企業,後摩智能這次帶來的M50芯片專為大模型推理設計,主要面向AI PC(人工智能個人電腦)、智能終端等場景。
“未來大模型有兩個重要發展趨勢:一是大模型的重心逐漸從訓練向推理遷移。二是逐漸從雲端智能逐漸向邊端或者端邊智能遷移。”7月25日,後摩智能CEO(首席執行官)吳強對觀察者網等表示。
他認為,未來的計算格局有可能是端、邊、雲的混合體,但是90%的數據處理可能會在端和邊,只有10%的訓練算到雲端做更昂貴或者更復雜的任務在雲端做。

圖源:觀察者網
後摩智能創立於2020年,創立早期定位為基於存算一體技術的大算力AI(人工智能)芯片研發企業。創始人吳強擁有美國普林斯頓大學博士學位,曾任地平線CTO(首席技術官)。
M50芯片被視為後摩智能過去兩年交出的一份答卷。
據介紹,M50芯片實現了160TOPS INT8、100TFLOPS bFP16的物理算力,搭配最大48GB內存與153.6 GB/s的超高帶寬,典型功耗僅10W,相當於手機快充的功率,能讓PC、智能語音設備、機器人等智能移動終端高效運行1.5B到70B參數的本地大模型,實現了“高算力、低功耗、即插即用”。
除了M50芯片,後摩智能此次發佈的產品矩陣形成了覆蓋端側到邊緣的多元算力方案。力擎LQ50 Duo M.2卡以口香糖大小的標準M.2規格,為AI PC、陪伴機器人等移動終端提供“即插即用”的端側AI能力。
吳強曾表示,國產替代的企業可以對標海外的某類產品,但絕不能用同樣的技術路徑進行照搬,如英偉達、AMD等國際巨頭的研發、工程、供應鏈能力遠超過初創企業,硬碰硬難以取得成功,創業公司需要另闢蹊徑,以一種差異化的技術路線來應對和巨頭們之間的競爭。
當前,後摩智能通過存算一體技術與大模型的深度融合,推動AI大模型在端邊側實現“離線可用、數據留痕不外露”。
吳強稱,M50芯片的發佈是後摩智能現階段邁出的重要的一步,後面會推出更多的芯片去解決端邊大模型的算力和功耗問題以及帶寬問題。“長期來説,後摩希望定位在端邊AI計算。”
在他看來,M50的發佈只是一個開始,“我們的目標是讓大模型算力像電力一樣隨處可得、隨取隨用。”

圖源:觀察者網
“無論是商業還是個人,端邊的AI都有可能成為更懂你的AI。因為它本身是有很多天生的優勢,儘管剛剛開始,大模型剛剛開始,端邊剛剛開始,但是它本身有更好的即時響應,更低的使用成本,更安全的數據隱私,以及更好的個人的用户體驗。未來這會成為一個趨勢。”吳強説。
2024年初,後摩智能把第一代芯片調整了一版,推出了M30,針對大模型做了一些調整和優化。
本次推出的M50產品可廣泛應用於消費終端、智能辦公、智能工業等多元領域,且均能在離線狀態下實現全流程本地處理,從源頭杜絕數據聯網傳輸風險。
吳強還披露了當下後摩智能的意向客户,包括聯想的下一代AI PC產品、訊飛聽見的下一代智能語音設備以及中國移動的全新一代的5G+AI邊緣計算設備等。
“目前我們看重幾個領域,一是平板和電腦這種消費終端類,大模型是生產力工具。二是智能語音系統,大模型語音會議也是我們重點佈局的方面。三是運營商的邊緣計算,5G+AI是一個趨勢。”他説道。
吳強還提到,機器人包括具身智能機器人(特指陪伴機器人),更像是十年前的智能駕駛,是一個新興的垂直賽道,格局還未定,“大家還有機會”。
“只要是端邊,只要對大模型有需要,對功耗敏感,都有可能是我們的客户,需要我們逐步地拓展。目前大方向是消費終端、智能辦公、智能工業,機器人也算其中,這是我們重點在佈局的幾個領域。”他表示。
面向未來,後摩智能已啓動下一代DRAM-PIM技術研發,通過將計算單元直接嵌入DRAM陣列,使計算與存儲的協同更加緊密高效。該技術將突破1TB/s片內帶寬,能效較現有水平再提升三倍,推動百億參數大模型在終端設備實現普及,讓更強大的AI算力能夠融入PC、平板等日常設備。
本文系觀察者網獨家稿件,未經授權,不得轉載。