心智觀察所:獨家對話|李治軍:國產操作系統與具身智能的雙向奔赴-心智觀察所、李治軍
guancha
在人工智能與操作系統深度融合的浪潮下,國產操作系統如何突破技術壁壘、構建自主生態?具身智能(Embodied AI)作為下一代人工智能的重要方向,又將如何重塑人機交互與產業形態?
觀察者網“年度科創人物·年度求索者”獲獎者、哈爾濱工業大學計算機科學與技術學院李治軍教授近日做客心智觀察所,從技術演進、生態痛點、人才培養等多維度剖析國產操作系統的突圍路徑,探討具身智能在工業、服務等場景的落地機遇,同時揭示高校科研與產業需求深度聯動的挑戰與可能性。

【對話/觀察者網心智觀察所】
心智觀察所:李教授您好。您現在在哈工大當老師,之前讀書時也在哈工大,這些年來您一直在關注的領域是什麼?您目前最關心的話題是什麼?
**李治軍:**我從本科階段就對操作系統特別感興趣,當時覺得操作系統是軟件領域的複雜系統,從研究生到博士到後來我工作科研也一直圍繞操作系統。從 Windows 95誕生的1995 年開始,我見證了Windows系統的發展、Linux的興起,以及中國鴻蒙系統的誕生。
如今,機器人作為未來的重要端設備,也需要操作系統作為支撐。從國家發展角度來看,中國長期面臨 “缺芯少魂” 的困境,其中“芯”指芯片,“魂”指操作系統。近年來,國家、政府、行業和市場對操作系統的重視程度不斷提高,這讓我感到非常興奮。操作系統研究一直是我的專業,也是我的夢想所在,我希望能將具身智能操作系統變為現實。
心智觀察所:對於普通用户來説,我們對操作系統較為熟悉的是PC電腦和手機移動端。我想了解一下,您的操作系統應用在機器人上,目前是否已經開始量產了?它的應用場景又是怎樣的?在什麼場景下我們會用到您的操作系統呢?
**李治軍:**操作系統確實是軟件領域極為複雜的系統。從PC機的Windows、Linux,到手機的安卓、iOS,再到我國的鴻蒙系統,這些操作系統逐漸進入大眾視野,解決了眾多問題。機器人作為未來的設備,被認為是人類進入具身智能時代甚至人工智能時代的關鍵。機器人操作系統必須具備新的特性,其中最重要的就是自主性。機器人應,而不像手機和PC那樣需要人為操作。
目前,全球範圍內尚未出現成熟的機器人操作系統,整個行業都在不斷探索。我們在這一領域起步較早,也取得了一些成果,但還需經受實際檢驗。機器人的應用場景主要集中在自主化場景。比如工廠因為老齡化加劇,生產環境的惡劣性,需要替代人工,機器人在B端的應用需求逐漸增加。
人是會理解周圍環境的,能自主決策,但現在還沒有一個機器人能夠完成這個事情,我們的目標就是用我們的操作系統加上機器人,能夠解決在工廠內對人的替代和自主決策,能夠適應場景的變化。我們已經在一些工廠進行了原型示範,但尚未達到量產階段。
心智觀察所:您提到機器人將我們帶向具身智能和人工智能的時代,能否請您簡單科普一下這兩個概念?“機器人”和“具身智能”,它們是否可以畫等號?
**李治軍:****肯定不能畫等號。**具身智能是“內涵”,而機器人只是其中的一種外在表現形式。聊聊天還不是人工智能。人工智能具身化,“具身”就是物理世界,具身智能強調人工智能與物理世界的融合,機器人是這種融合的一種典型手段,但它不是全部。未來,具身智能可能會以多智能體混合的形式呈現。未來可能沒有道路,都是飛行車、無人機、機器人;比如我們今天錄影棚未來會具備很多自主智能,燈光可以自主調節,這些都可以叫做具身智能,未來大概是這個樣子。
機器人是具身智能的外在表現,當然這個表現也不一定非要是機器人,無人機視角也可以。包括可能未來還有一些別的形態的,不一定非得要像人形,或者可以稱之為智能體。
心智觀察所:您是什麼時候開始萌生創業的想法,想要從教授轉型成一個創業者呢?
**李治軍:****這個問題問得非常好,我也想了好久。**我是做操作系統的,它是一個宏大的系統,往往需要做出來看實際效果,需要在實際場景中應用和迭代,而不僅僅停留在實驗室階段。
它不像人工智能其它領域的研究,比如做數據集,做算法,可以很快產生結果。它是個綜合的系統,必須要在實際中發揮作用,否則不像一個算法。你給它個數據集,在這個數據集上產生結果了以後,不能説在A處可以工作,在B處不能工作。
一個好的操作系統,就像手機一樣,它可以應對各種場景,低能耗,高負載等等;能應對打遊戲或者聊天的場景,應該經得住各種各樣的檢驗,而這樣的系統的話就不能僅僅停留在實驗室,一定要在實際中使用它才會逐漸迭代,或者説做得越來越好。
正是因為這個專業的特性,和我個人的興趣,我始終覺得只是做個原型系統,總是差個勁兒。,我很想把它真正用起來。要真正用起來,光靠學校的力量是不夠的,必須要靠產業,靠整個社會。
心智觀察所:在創業過程中,您是否發現您嚮往的領域與您之前的認知有所不同?或者説,創業是否給您帶來了對研究領域的全新認識?
**李治軍:**在創業過程中,我發現實際需求與理論研究之間存在差距。作為老師,一開始往往是個理想主義者,可能全世界的所有科技工作者都是這樣的,理想主義者喜歡給一個解決方案,這是實際上人類科技的終極夢想——我們能解決一切問題,但後來在實際創業的過程中會上發現實際上創業是很綜合的,客户更關心解決方案的可行性和成本效益,而不僅僅是技術指標的先進性。這促使我重新定義問題,關注實際需求,並通過不斷迭代來優化產品。創業是一個綜合性的過程,需要兼顧技術、市場和客户需求。
我們以前可能定義了一個問題,理論上它的確是個問題,指標可以定得很漂亮,但實際中客户可能並不關心這種定義。
可能越來越多的學校和公司現在也都已經非常重視。創新和產業或者説應用,應該是一種雙輪驅動或者互相迭代、互相反哺的局面。當然這也對老師有些挑戰,就是我們需要更多的去深入理解需求,而不是靠自己去定義。
心智觀察所:回顧您的創業經歷,您覺得有哪些坑是您踩過而不希望再次踩到的?也不希望其他創業者再去重複這些錯誤呢?
**李治軍:**創業者應儘快將產品推向市場,通過用户反饋進行快速迭代,而不是追求完美產品。創業者需要關注實際需求,而不是憑藉自己的主觀判斷去定義問題。
具身智能作為新興領域,給創業者和產業界帶來諸多啓示。有投資人曾問我國外是否有可借鑑的公司,經調研發現,當前情況下難以找到完全成熟的模式可供照搬。例如微軟、亞馬遜等公司的成功模式雖曾為國內提供參考,但具身智能領域尚無明確的參考模板。因此,產業發展不應總想着照搬,而要注重鼓勵創新。
同時,創新者需儘快將成果產品化,雙方在合作中相互容忍、反饋,推動不斷迭代優化,這對產業發展至關重要。
在機器人這一新興領域,國內外尚未形成成熟的模式,創業者應抓住機遇,積極探索,注重產品化和市場需求的結合。
心智觀察所:您曾在一家大型手機公司擔任首席科學家,手機產業想要與具身智能結合,這究竟是一個噱頭,還是確實存在真實需求呢?
**李治軍:**從發展的角度來看,如今小米等著名手機廠商已成功涉足汽車領域,這表明行業融合與創新不斷向前發展。像微軟這樣的科技巨頭也在投資人工智能公司,如 OpenAI。因此,我認為,無論是計算設備、PC、還是手機等等,它們都在隨着社會發展而不斷進步。手機廠商進軍機器人領域並非噱頭,未來可能成為一種趨勢。手機廠商和機器人在某些方面具有共性,例如,手機雖然成本和產業鏈較機器人簡單,但仍然涵蓋從芯片到封裝、通訊模組、電路以及存儲等多個硬件和軟件環節。
未來機器人行業的發展將類似於手機行業,從機械部件到生態系統,再到應用開發,機器人的發展路徑可能與手機類似。許多人甚至認為未來手機將成為一種超級動態設備,替代或擴展機器人功能。因此,手機廠商憑藉人才和技術積累,有可能成功擴展到機器人領域。然而,這並不意味着手機廠商一定能做好機器人,因為機器人行業具有獨特的行業特徵,目前主要集中在B端市場,而未來可能轉向C端市場,如機器人保姆和養老護理等。不過,在可預見的未來,B端場景仍將是主流,行業積累know-how至關重要。
例如,機器人生產涉及的機械工藝和生產流程,是手機廠商所不熟悉的領域。需要B端行業專業人士,如工業互聯網從業者,來指導和幫助手機廠商進軍機器人領域。因此,我認為手機廠商轉型到機器人領域是有可能的,但需要多個行業的協同合作才能實現成功。
目前,國內外尚未出現明確的機器人操作系統競品。國外有一些公司在探索類似解決方案,例如通過多模型融合實現機器人協作和環境理解。我們致力於通過系統與模型的結合,在這一領域取得突破,與國際同行展開競爭。
心智觀察所:在具身智能領域中國不一定是落後的,可能在有一些地方我們和西方是齊頭並進,或者我們已經在某種程度上領先了。目前西方有沒有做同類的競品?
**李治軍:**這個問題實際上投資人問過我們好多次。就我所研究的智能機器人操作系統而言,目前國內外明確發佈的同類系統還不多見。像iOS這樣明確公佈的手機操作系統,在機器人領域尚未出現明確的同類發佈,但確實有一些解決方案出現,有些可能通過模型或多種模型融合的方法來實現。
國外在這方面有一些公司,比如Figure AI,我們主要是對標他們。Figure AI在多機型協作和場景理解等方面表現出色,他們的多機器人協作視頻展示了機器人之間流暢的動作和對環境的高效執行能力。我們的團隊希望通過系統層面的解決方案,結合模型能力來實現類似的效果,而Figure AI則更多是從模型的角度出發。我相信他們也會逐漸結合系統能力來發展。
實際上,具身智能可以被描述為一個三角關係:硬件本體、系統和算法模型。這三者缺一不可,最終需要建立一個具有生態的平台。或許可以把這個結構看作兩者的結合,一部分人做硬件,另一部分人做系統和模型的結合。Figure AI在這方面做得很好,值得我們學習,他們的成長速度也非常快。
心智觀察所:您提到的“本體、算法、系統”需要協同工作,這讓我想到硬件和軟件的軟硬協同。您團隊成員來自不同學科背景,他們如何協作?他們的學科背景是什麼?又是如何加入您的團隊的?
**李治軍:**我的團隊主要由學校的團隊和外部合作人才構成。最初,我專注於操作系統,隨着人工智能的興起,我們意識到必須與人工智能領域的人才結合。
因此,團隊中有一部分人是做模型的,包括大模型、小模型,涉及機器人控制、強化學習等。雖然我們不可能成為所有領域的專家,但必須瞭解模型的特性,以便選擇合適的模型並與系統集成,實現垂直整合。
學校團隊以系統為核心,成員包括我指導的碩士、博士以及年輕教師。他們一直跟隨我從事操作系統的研發工作。我們還刻意補充了與模型相關的人才,特別是自然語言處理和視覺理解模型方面的人才,以便更好地理解和處理場景信息。
在機器人領域,硬件耦合是不可或缺的。我們需要兩類硬件相關的人才。一類是算力人才,他們要懂計算機中的CPU、GPU、網絡、I/O等,並能夠與機器人本體各關節貫通。
另一類是機械人才,他們要懂機器人的關節自由度和機械結構。雖然我們不直接從事機械設計,但需要將機器人的機械能力抽象為計算能力,以便與機器人廠商進行有效對接。
總的來説,我們的團隊由四部分組成:以系統為核心的人才、模型相關人才、算力人才和機械人才。這種多元化的團隊結構有助於我們在機器人操作系統和人工智能領域進行深入研究和開發。
心智觀察所:您提到北京舉辦的人形機器人馬拉松大賽,這是全球首個此類賽事。網友評價褒貶不一,有人批評機器人摔倒、外觀醜陋。作為創業者,您如何應對這些負面聲音?
**李治軍:**我作為老師,最近的相關認知有所改變。大眾希望產品一開始就完美,但技術發展需要迭代。早期手機、PC雖不完美,但不斷改進才有了今天的產品。創業者要敢於展示不完美的產品,接受質疑,並持續改進。
愛因斯坦曾講過三隻小板凳的故事,前兩隻雖粗糙,但不可或缺。這種精神對社會很重要。機器人發展也是如此,當前的不足是迭代過程的一部分。
心智觀察所:如果將人形機器人發展比作馬拉松,目前進展如何?距離終點還有多遠?
**李治軍:**若以人類身體能力為終點如奧運會展現的優美運動能力,當前的機器人還處於極早期階段。這段距離看似漫長,但科技正在加速迭代。例如,大模型顯著提升了藥物研發效率,量子計算等領域也逐步突破。儘管前路遙遠,但科技爆發可能大幅縮短進程。保守或樂觀估計,未來10年內或將迎來顛覆性變化。
心智觀察所:在人形機器人賽道創業困難漫長,但值得堅持。作為創業者,持續馬拉松需要哪些支持和陪跑者?
**李治軍:**人形機器人是人工智能時代的典型代表。人類文明的核心在於智能,若機器人或其他智能體能發展成熟,或將推動社會進入全新階段。
例如,未來機器人可能自主製造火箭,甚至開拓宇宙文明——這將是人類未曾設想的全新世界。當然,如此宏大的命題需要全方位投入。以手機為例,從諾基亞功能機到智能終端,背後是基礎設施、人才、資本等系統性工程。而人形機器人的發展涉及更復雜的鏈條:政府需引導方向,資本需保持耐心,科技工作者需持續創新,甚至需聯動職業教育。例如,我們正推動高中生參與具身智能數據採集——如同互聯網依賴海量數據,物理模型也需要更多真實世界的數據支撐。唯有全社會協同“陪跑”,這一目標才可能實現。
心智觀察所:我們深知商業的基本邏輯始終圍繞企業發展與成長的目標。而作為教授或技術理想主義者,如何平衡日常工作中的企業增長需求與技術的持續迭代發展,這也是我們需要探討的核心命題。
**李治軍:**這確實是一個值得深入討論的矛盾點。以學術界為例,部分發表高質量論文的學者,其研究成果往往過於超前,難以實現產業化轉化。這種現象並非負面,而是社會現實的客觀呈現——例如產出千餘篇論文中,可能僅有一兩篇最終實現產業化。但需注意的是,若沒有這千篇的基礎積累,那一兩篇突破性成果也難以誕生。
另一現象是,部分學者與企業合作緊密,產業化成果顯著,卻難以產出創新性論文。這反映出社會整體對創新缺乏耐心。從長期視角看,千篇論文中必有一篇具有應用價值,因此無需過度糾結當下研究是否“有用”。關鍵在於保持長期主義,也就是允許階段性成果發表並獲取反饋,同時堅信最終能產出真正有價值的成果。但需警惕為發論文而發論文、為創新而創新的形式主義。
企業層面也是這樣。若僅追逐短期利益,榨取客户現有價值,是難以持續的。真正吸引用户的是通過創新創造的深層價值。例如早年操作系統研發因週期長、見效慢而難獲投資,但如今企業逐漸意識到,僅優化表層交互無法顯著提升體驗,底層技術創新才是關鍵。
當下趨勢已顯現融合的可能性。以人形機器人為例,若僅強調運動性能如馬拉松而忽視工業場景應用,或僅專注替代工人而缺乏技術創新,均不可持續。大模型的發展則提供了創新範式——企業通過行業應用反哺技術創新,形成良性循環。這種產研耦合或將成為未來創新與產業結合的主流模式。
心智觀察所:您多次提及“耐心”,近年來“耐心資本”概念備受關注。作為創業者,您是否獲得了這類資本支持?
**李治軍:**感謝投資人的支持。我們剛完成天使輪融資,後續還將追加投資。具身智能操作系統項目在投決會上確實存在爭議——部分投資人質疑操作系統盈利模式,畢竟Windows主要依賴Office盈利,安卓通過應用生態創收,鴻蒙系統研發投入超百億卻難直接變現。但最終項目仍獲通過,尤其某資深投資人力排眾議,認為這代表未來方向。正是這種真正具有耐心的資本支持,才讓公司得以成立並發展至今。
操作系統賽道投入產出週期極不匹配已是行業共識。以Windows和鴻蒙為例,前者研發需數千人團隊,後者投入高達數百億。機器人操作系統同樣面臨商業變現難題,許多投資人直言難以盈利。但那位堅持投資的前輩認為,這正是“做難而正確的事”的價值所在。這種對技術長期價值的篤信,體現了資本市場的成熟度提升,也反映出社會對深層創新的期待。
心智觀察所:我們觀察者網總部位於長三角地區的上海,瞭解到長三角國家技術創新中心與您有合作。能否簡要介紹您與他們的合作模式?
**李治軍:**長三角國家技術創新中心是國家級重要創新平台。其核心任務是通過項目孵化和對接創新資源,支持推動科技成果與產業化結合。長三角國創中心對我們的支持主要體現在兩方面。
第一方面是資金支持。我們的項目經過國創中心的嚴格遴選,獲得其直接投資,以天使輪注資形式完成,這既是對項目的認可,也為項目的早期發展提供了關鍵助力;
然後還有資源對接。長三角國創中心構建了創新資源、研發載體和產業需求的創新體系和生態,因此中心為我們鏈接了豐富的客户、行業應用場景等資源,並提供市場推廣等服務,全方位助力企業成長。這種支持對初創企業的技術落地和市場化至關重要。
心智觀察所:您始終關注青年成長與教育。對於希望進入具身智能領域的年輕人或選擇相關專業的學生,您有何建議?
**李治軍:**用一句話概括:具身智能是代表未來的前沿領域,充滿挑戰與機遇。我不僅要求自己的碩博團隊全面轉向該方向,還通過講座向高中生、大學生普及其重要性。
人工智能已深入社會生活如語音交互普及,而具身智能則更進一步——它將數字智能與物理世界結合,通過物聯網、機器人等技術實現環境感知與實體操控。這種“數物融合”的特性使其成為極具價值的賽道。無論是高校新生還是從業者,都應積極投身這一領域,把握創造巨大價值的機遇。
心智觀察所:您研發的操作系統作為微觀載體,與宏觀的物聯網生態有何關聯?當前中國在具身智能和AI基礎設施方面處於何種發展階段?需要哪些力量共同推動?
**李治軍:**物聯網的本質是物理世界的數字化、網絡化與智能化。我選擇操作系統作為切入點,因其是連接硬件與應用的底層核心,正如互聯網時代的電商平台承載商業變革,操作系統將在萬物互聯時代成為關鍵基礎設施。
中國正處於從數字化向智能化躍遷的階段,需多方協同。在技術層面上,有操作系統、機器人載體、6G衞星網絡、在GPU領域等需同步突破;而且各領域需發展適配自身場景的智能系統,形成一種技術拼圖,這就既需要底層技術研究者,也需要跨學科複合型人才推動應用落地。
作為從業者,我專注於操作系統與機器人融合方向,這也是個人學術積累與行業趨勢的雙重選擇。
**心智觀察所:**人工智能與具身智能的進步需要長期投入,不能僅關注短期商業成果。希望社會各界給予技術創新者更多耐心與支持,共同培育這一改變人類生活方式的領域,也感謝李教授做客觀察者網。

本文系觀察者網獨家稿件,文章內容純屬作者個人觀點,不代表平台觀點,未經授權,不得轉載,否則將追究法律責任。關注觀察者網微信guanchacn,每日閲讀趣味文章。