竟是毫末率先量產城市輔助駕駛,北京上路,自動識別紅綠燈_風聞
量子位-量子位官方账号-2022-04-20 22:45
賈浩楠 發自 凹非寺
量子位 | 公眾號 QbitAI
2022年車主翹首以盼、車企們都在爭奪的產品是什麼?
城市輔助駕駛,帶自主領航的那種。
為啥?
紅綠燈路口、環路、人車混行都能自主應對,設置好導航,駕駛員就能完全解放,只扮演安全員的角色。

絕大部分車主最枯燥、最疲憊的駕駛體驗,解決了。
但城市道路上輔助駕駛的落地難度,絕對可以稱得上目前乘用車智能駕駛量產的“聖盃”。
異形目標、不同交通標識、模糊的車道線等等對感知能力挑戰巨大;違規通行目標、複雜路口的博弈…對AI的認知決策能力要求,與L2不可同日而語。
所以,量產上車城市輔助駕駛,是實力和潛力的最好證明。
不過萬萬沒想到,量產“第一”之名,花落老牌車企長城汽車,今年年中即將上市。

而去年年底,長城旗下的多款車型,已經率先量產了高速領航輔助駕駛。
這樣的速度和成果,好像“不可思議”。
但背後的“秘籍”已經不是秘密:
毫末智行。
“非典型”自動駕駛創業公司、中國最快量產智能駕駛產品、乘用車物流車雙線並舉…
毫末智行這家公司成立不到3年,率先在國內實現城市領航輔助功能量產,速度和力度都讓業內吃驚。

AI Day現場的火熱程度可見一斑。投資人、合作伙伴、AI技術大牛紛紛到場,主辦方甚至要臨時添加座椅。
大家好奇的,是這家自動駕駛公司到底有什麼秘密?
中國首個量產城市輔助駕駛,什麼水平?
城市道路上的領航輔助駕駛功能,去年開始不少主機廠或無人車公司都放出過Demo。
其中還包括華為、小鵬、以及特斯拉這樣的明星公司。
不過毫末智行即將量產的城市NOH功能,號稱首戰即有這麼幾個“行業之先”。
中國率先量產的城市輔助駕駛。如果之前各家的量產上車時間表不變,下半年長城汽車交付的魏牌摩卡車型,將是中國用户能買到的第一款有城市領航輔助的汽車。
率先在多種動力形式上實現城市輔助駕駛。魏牌摩卡,既有燃油車,也有插混車型。另外下半年上市的歐拉純電新車,也會搭載毫末智行城市NOH。

△ 毫末智行董事長張凱
當然,毫末城市NOH,本身也打破了自動駕駛創業公司的記錄。下半年量產上車,滿打滿算距離成立3週年。
對於這樣的量產進度,毫末智行董事長張凱給出了這樣的總結:
截止這個月,已經有6款車型搭載毫末智行智能駕駛系統的第六款車型。使毫末智行向既定目標——3年搭載100萬台車,又邁進了一大步。
量產當然是實力體現,但只是一部分。
真正的功夫,還要看應對城市複雜路況是不是足夠“老司機”,乘坐體感夠不夠舒適,最重要的,安全嗎?
實車體驗最能説明問題。
體驗路線分佈在北京順義城區核心,全長11.2公里,包括兩個環島、6個轉彎,以及十幾個紅綠燈。
具體路況嘛,既有通暢的城市主幹道,也有人車混行、較為混亂的路口。

按照場景的簡單到複雜,我們把體驗下來的毫末城市NOH實際表現分成這6個要點。
紅綠燈識別
紅綠燈識別的難度在於不同地區交通標示標準不一,這需要後台有一個儘可能完備的數據庫供系統學習。
去每一個路口採集數據樣本當然不現實,毫末採取的方法是通過圖像合成和遷移學習,加快技術的迭代。
這其中,主要技術難題是真實數據和合成數據的混合訓練問題。
通過圖像合成技術可以擴大學習的樣本量,但是真實和合成數據在特徵空間及概率分佈不一致,導致使用有效率大打折扣。

△ 毫末智行CEO顧維灝
所以毫末使用了遷移學習中領域泛化的混合遷移訓練方法,利用合成數據定向彌補真實場景中缺失的數據樣本及不斷調整訓練策略,減小二者特徵空間的概率分佈差異。
有了足夠的數據訓練,就可以對路面上不同形式的紅綠燈識別。
比如,在大路口場景中,紅綠燈離車輛距離很遠,在圖像數據上目標更小更難以識別:

所以這樣的場景從感知到決策,全方位的要求都很高。
避讓其他目標
除了能準確識別車道線,並根據導航選擇合適路徑,NOH還會動態避讓其他加塞的車輛和行人,保障安全:

對於加塞的車輛或行人,NOH會根據目標速度、路徑綜合判斷剎車、方向調整程度,不會猛然剎停,保證安全的前提下兼顧通行效率。
而且毫末NOH對於避讓行人的原則貫徹到位,即使通過無人的路口或斑馬線,也會提前減速。
無保護轉彎
無保護左右轉,如今並不是一個難度極高的項目。不過毫末NOH表現的亮眼之處在於能處理多車道交互的複雜路口,包括正確識別交通燈和待轉區。

這樣的路口難度在於尺寸較大,首先是系統需要感知識別的範圍更廣,目標的數量和類型更多;相應的,其他目標出現違規行為的可能性也更高。
車道線識別
同是領航輔助,城市場景下的車道線識別和高速難度完全不同。
城市內車道線更加密集,種類更多,形式更為複雜,而且常常有污損情況。
面對這樣的挑戰,毫末智行設計了BEV Transfomer。
攝像頭的數據傳回後,首先對2D 圖像用 Resnet + FPN 進行處理,之後進行BEV映射,這部分利用交叉注意力層(Cross Attention) 來動態確定某一幀圖像中的內容在相機所屬 BEV 空間中的位置。

通過多個Cross Attention,最終組成一個完整的 BEV空間。
當視覺數據完成了在BEV的投射,就天然具備了和激光雷達點雲圖的融合能力。
最後,系統還會綜合考慮BEV的歷史數據,加入與時間有關的特徵,進一步提升識別的準確率和連續性。
進出環島
環島對於自動駕駛系統來説一直是一個巨大的挑戰。其中既有較為複雜的規則,還要根據導航路線擇機乾淨利落地切入切出。
對於感知系統來説,準確識別車道線,還包括能分清楚環路的邊界,之前特斯拉FSD測試時,常發生衝上中央路基的情況。

毫末NOH除了準確感知、識別環路,並根據導航選擇合適路線。而且面對環島中其他車輛短時間內數次變道的行為,也能準確識別和合理避讓。
這一點的難度其實比平直路面大得多,因為連續大麴率的彎道,對於車輛的速度、轉向精度要求更高。
複雜場景挑戰:路口碰上違規車,怎麼辦?
城市場景難,其實不在複雜的車道線和交規,而是難在隨時可能發生的不可預知的場景。
這些場景也是考驗一個城市領航輔助系統是不是老司機的試金石。
比如,我們的試乘車本來正常直行通過一個十字路口,結果垂直車道一輛左轉汽車先是闖紅燈搶行,使得NOH緊急停車避讓:

左轉綠燈亮了以後,這輛車卻停在超出待轉區的十字路口中央不動了…而此時我們直行的綠燈已經轉紅。
我們有意沒有接管,想看看NOH到底會怎麼辦。
緊急避讓保證安全後,NOH用幾秒時間確認搶行車停止不動,然後系統並沒有受到直行綠燈轉紅的影響而停在路中間,確認安全後儘快通過路口:

換成人類司機,這其實也是唯一合理且安全的處理方式。
這套方案,除了軟件算法全部由毫末智行自研,硬件方案中的自動駕駛計算平台也是毫末自研,算力達到360T。

對比來看,今年大部分車廠翹首以盼等交付的英偉達Orin芯片,是256T算力。
此外,傳感器方面,量產NOH方案採用12個攝像頭、5個毫米波雷達、2個激光雷達以及12個超聲波雷達。
這就是中國首個量產城市輔助駕駛的真實情況,你感覺它夠“老司機”嗎?
自動駕駛“思想鋼印”?
毫末NOH的量產速度如此之快,甚至有業內人士表示百思不得解。
毫末曾經給自己的業務方法論,起了一個頗為神秘的名字:
自動駕駛思想鋼印。

不瞭解《三體》也沒關係,毫末智行所謂的“思想鋼印”,其實就是自動駕駛公司都繞不過去的數據閉環能力。
一般來説,自動駕駛數據閉環萬變不離其宗,關鍵流程都是“數據收集處理-訓練-部署-再收集”的循環,以此迭代升級AI司機的能力。
涉及到數據層面,總共三個過程:收集、處理、反饋。
只不過在毫末這裏,加上了兩個附加條件:低成本和高速度。
對應到毫末智行數據智能體系中,分別是數據的自動化處理程度,和模型快速驗證。
AI Day上毫末智行CEO顧維灝介紹毫末最新的數據積累和應用情況:
毫末智行智能駕駛系統目前裝機量為數萬,截止今年四月用户貢獻的實際路測里程超過700萬公里,而且這個數字還在以每天數萬公里的速度增加。

數據的收集問題,毫末已經解決,但要讓AI明白數據含義,還需要認知過程,解決從客觀世界到駕駛動作的映射。
除了從實時數據上歸納影響駕駛行為的因素,系統還需要對照更大規模的數據樣本來學習規律。
所以,數據處理的核心聚焦到快速標註上。
為此毫末研發了一個高效標註系統,應用無監督自動標註算法,這套系統從數據標註的底層入手,對大批量數據進行自動標註,再由人工校對後反饋給系統,不斷提升準確性和效率,逐漸減少人力工作量。

目前,毫末已經有超過70%的數據由系統自動標註處理。
數據處理的自動化能力建設有什麼意義?
隨着未來兩年毫末智能駕駛系統裝機量達到百萬,人工標註數據的成本即使按0.5元一公里來算,也會迅速上升到數億甚至十億級別。
別説創業公司,國內車企自主三強每年淨利也不過幾十億,這條路顯然是走不通的。
所以,建立數據閉環其實不難,真正能持續下去的是“低成本獲取數據”。
數據處理好之後,已經可以餵給算法進行訓練,那麼訓練好的模型,如何驗證效果?

尤其是在短時間對多個功能進行不同升級後,如果把所有版本依次拿到實車上跑一遍,然後再開發下一個版本…自動駕駛可能就永無實現之日了。
所以要把把驗證工作放在仿真系統中進行。
毫末智行將每一次路測都還原為仿真中的“元宇宙”,同一場景下不同光照、不同天氣,不同曝光條件都可在系統中調整,由此來模擬算法在不同工況下的表現。
這樣的流程,其實也可以理解成算法迭代的自動化,對應着思想鋼印中的“高速度”。
毫末智行這一套數據智能體系,叫雪湖,也叫MANA。
痴迷《三體》的毫末工程師們以此命名,含義是像面壁者邏輯掉入雪湖後參悟黑暗森林法則一樣,從MANA開始,毫末也掌了握自動駕駛的核心能力。

在MANA系統的加持下,毫末智行的“AI司機”,已經不間斷訓練駕駛技巧長達20萬小時,虛擬駕齡已相當於人類司機2萬年的駕駛時長。
毫末智行的高速、城市NOH快速上線,業內看起來好像“開掛”一般,但瞭解深層原因後並不匪夷所思。
本質就是高度自動化的數據智能能力,保證了AI老司機能力快速迭代的基本條件,再加上長城汽車的大規模量產渠道。
所以,討論“毫末現象”的核心其實應該是:毫末智行的經驗和模式,可以被其他無人車初創公司複製嗎?
毫末智行,能被複制嗎?
自動駕駛創業,毫末是最特殊的一個。
成果、技術給行業什麼樣的啓示?至少能總結出三個方法論。
首先是大船放小船。
你可以説毫末智行是長城汽車旗下,但它卻不屬於長城汽車上市集團。

長城入股但不直接管理,讓毫末智行以科技公司的效率和靈活性運營,不受大集團業務流程所累,激發創造力。
同時,長城汽車又保持了一個車圈老大哥的“大度”,允許毫末智行公開融資、IPO,團隊的積極性也有了充分保障。
第二是長城汽車給毫末智行提供規模量產的渠道,這種“kick start”也是毫末智行進度驚人的基礎。
更出乎意料的是,長城汽車沒有把毫末智行的產品指定成“專供”,反而鼓勵毫末團隊去市場擴展其他的主機廠客户。

毫末智行董事長張凱在AI Day上介紹了毫末的開放合作原則:
合作方可以選擇採用全棧技術解決方案,可以選擇在數據智能雲端服務層面與我們合作,也可以選擇軟件或硬件層面,或者功能模塊層面的合作;甚至可以選擇和我們進行源代碼級別的定製。
從全棧解決方案到源代碼,這6個產品層面毫末智行都可以開放合作。
這也讓毫末未來的業務規模和技術迭代有了更大的空間。
最後一點,也是最重要的,是毫末智行本身的數據閉環能力。
海量數據湧進系統,數據的存儲、傳輸,以及數據處理的人工、時間其實都是成本,毫末智行的數據智能體系,針對每個可能的成本產生環節,都有專門的優化機制。
很難相信這是不到3年時內摸着石頭過河探索出來的,更像是一開始就規劃好的佈局。
與車廠的緊密聯繫、數據閉環能力、大規模上量的渠道…這些是毫末智行模式最基礎的3個方法論。
自動駕駛創業公司能不能複製?
當然可以。
與車廠建立緊密聯繫不難,事實上幾乎所有老牌車企都迫切轉型,有團隊有技術的無人車公司不乏青睞。
所以量產渠道這個問題至少表面上看不難解決。
但深度綁定之後自身的前景和潛力會不會被限制?小船到最後會不會成大船的一塊“木板”?
畢竟像長城汽車這樣開放的車企不多,更多主機廠傾向於緊緊攥住自己的“靈魂”不撒手。

更關鍵的是,硬核實力夠不夠,能不能像毫末一樣建立起一套高度自動化的低成本數據智能技術體系?
這一點,可能唯有實現那一刻才算證明。
所以,毫末智行確實給自動駕駛創業提供了另一種可以踐行模式。
其他無人車創業公司可以照搬,只是要做到毫末智行的程度,實力、機遇缺一不可。