死磕,讓特斯拉一騎絕塵_風聞
看世界杂志-看世界杂志官方账号-世界比想象更有趣2022-05-31 22:53

特斯拉軛式方向盤
對於中外同行而言,特斯拉是公認的行業標杆,實現了產品的垂直整合、全棧自研,因而在製造智能電動汽車方面,具有最大的靈活性和高效率。
近日,特斯拉首席執行官馬斯克在All in Summit技術峯會上表示,要在今年年底將參加FSD Beta測試的人數,從現在的10萬人擴大到100萬人。
這一在2020年10月發佈的自動駕駛測試版軟件,至今已歷經數十次更新,可以看作特斯拉在實現L5級自動駕駛這一終極目標上的墊腳石。但該計劃目前僅對北美地區用户開放,候選車輛需要搭載特斯拉HW3.0自動駕駛硬件平台,並且對申請人的駕駛習慣評分也有一定要求。
那麼,為何馬斯克選擇在今年,大幅降低FSD Beta的申請門檻?特斯拉所採用的純視覺自動駕駛路線,又有何特殊價值?

特斯拉首席執行官馬斯克
1
深度學習讓AI理解道路
雖然FSD Beta幾乎代表着目前家用級乘用車在自動駕駛領域的最高水準,但本質上來説,其仍然屬於L2自動駕駛的範疇,出現緊急情況時,仍然需要駕駛員及時接管,並且車企不對開啓狀態下發生的事故負責。
根據駕駛自動化分級標準,“是否駕駛人在駕駛車輛”,是L2與L3及以上自動駕駛技術的分水嶺。L3自動駕駛意味着發生事故以後的責任,要由車企承擔。
目前世界上僅有一家乘用車企奔馳,宣佈對旗下的Drive Pilot L3自動駕駛系統導致的駕駛事故負責,且其約束條件極為苛刻。而特斯拉旗下車輛在“Autopilot”(自動駕駛)狀態下發生的亡人事故已有多起,為何還要在此時宣佈將大規模增加測試用户的數量呢?
這還要從當前自動駕駛技術的核心——深度學習——講起。
深度學習並不是一個新概念。其所依賴的神經網絡早在1943年,就由美國心理學家麥卡洛克和數學家皮茨提出,在上世紀末計算機蓬勃發展的時期,受到學界的重視。
最近麻省理工(MIT)計算機科學和人工智能實驗室公佈的一段視頻顯示,人工智能領域大神Yann LeCun在1990年代初,便創造了速度極快的AI數字識別系統。而2006年傑弗裏·辛頓發表的一篇文章,則讓人們意識到,通常用來渲染遊戲等3D畫面的GPU圖形處理器,可被用於大大加速神經網絡的學習速度。
之後的AlphaGo與韓國棋手李世石的世紀大戰,更是讓深度學習“出圈”——全世界的人們意識到,只要擁有足夠多的樣本與算力,深度學習可謂無所不能。
而深度學習技術應用到自動駕駛中,就是通過收集的大量路測數據,在經過人工和自動化標註後,放到超級計算機上進行反覆訓練,得到訓練完畢的自動駕駛模型,從而賦予車載人工智能理解道路狀況的能力。
然而,基於深度學習的自動駕駛技術,實際上非常依賴於其訓練樣本。機器首先需要理解車輛所能遇到的所有可能的危險狀況,才能相對應做出正確的決策。
針對這一問題,自動駕駛巨頭Waymo和絕大多數車企的做法,都是以儘量多的路測里程,嘗試覆蓋所有可能出現的長尾場景。

自動駕駛巨頭Waymo發佈會
而特斯拉作為全球範圍內汽車保有量最多的自動駕駛企業,在這一點上具備獨一無二的優勢:每一個用户實際上都可以成為其數據收集員,將自身的日常行駛數據進行脱敏處理後,上傳到特斯拉的“超級大腦”——由25個特斯拉自研深度學習處理器D1組成的“Dojo”道場超級計算機中,進行日夜無休的重複訓練。
道場超級計算機1.1 EFLOPS的運算速度,是上述1990年代MIT實驗室那台用於數字識別的計算機算力的550億倍。如此恐怖的計算能力,自然具備同時處理大量訓練樣本的能力。這大概就是特斯拉放開自動駕駛系統測試名額限制的一大原因。
而有了更多的參與測試者與強大的超級計算機,特斯拉的自動駕駛系統迭代將更快,也就能儘早摘得L5級自動駕駛的桂冠。
有趣的是,成為一個優秀的人類駕駛員,並不需要學習大量的長尾場景,因為和如今的人工智能相比,人腦的“泛用性”更強一些,在很多小概率事件面前可以做出相對合理的選擇。
然而,自動駕駛對於模型內已經覆蓋到了的危險場景,往往能夠處理得相當完美與從容,而且能讓汽車在面對道路突發狀況時,在極短的時間內完成信息收集、感知預測、決策執行這三個關鍵步驟,實現超越人類認知能力與反應速度極限的規避動作。這也是馬斯克堅信自動駕駛比人類駕駛更加安全的原因。

特斯拉自動駕駛示意圖
2
死磕視覺方案
聊完了軟件,我們再來聊聊硬件。
自動駕駛的硬件江湖,目前大致可分為兩大陣營:以國產造車新勢力為代表的多傳感器融合路線,和以特斯拉為代表的純視覺感知路線。
馬斯克從其著名的“第一性原理”出發,堅持認為純視覺方案是人眼與機器達成和諧統一的唯一路徑。北美地區自2021年5月起交付的Model 3和Model Y上的輔助駕駛系統,就只裝配了8顆攝像頭;而2022年2月起,交付的高端車型Model S和Model X,不再配備雷達。

特斯拉Model S
取消了所有的雷達配置,顯示了馬斯克將純視覺方案死磕到底的決心。而這一方案的基石,便是由設計了AMD“Zen”系列架構的硅谷芯片大神Jim Keller,與Jim的繼任者,曾負責蘋果A5到A9處理器的Pete Bannon共同設計的FSD自動駕駛芯片。
這顆芯片於2018年底宣佈研發成功,單顆算力達到了72 TOPS(萬億次每秒,衡量自動駕駛芯片算力的單位),並在2021年初作為HW3.0硬件平台的核心,搭載在特斯拉旗下一眾車型上,代替了此前使用的算力僅為1 TOPS的英偉達Parker系列芯片。
相對應的,國產造車新勢力近年的自動駕駛配置,彷彿也成為了各大廠商“秀肌肉”的舞台:激光、毫米波、超聲波雷達和攝像頭數量不斷刷新上限,而自動駕駛芯片的算力更可謂進展神速。
英偉達在2017年公佈的Xavier自動駕駛芯片,以32 TOPS的算力碾壓了當時算力普遍在2 TOPS徘徊的競爭對手。但在2020年量產上市後,以小鵬P7為代表的諸多車型中搭載的Xavier在車主的手裏還沒捂熱,英偉達就宣佈其下一代自動駕駛芯片Orin將在2022年初交付車企,算力高達252 TOPS。

英偉達Xavier自動駕駛芯片
在去年的GTC圖形技術大會上,英偉達又宣佈將在2025年推出算力高達1000 TOPS的Atlan自動駕駛芯片。而以華為200 TOPS的MDC610,和地平線128 TOPS的征程5為代表的國產陣營,以及高通預計明年上市的Ride系列,也都在這片市場中掙扎求生。
3
打破自動駕駛芯片壟斷
車載芯片的算力指標,彷彿代替了發動機的馬力,成為了智能車時代各大車企新的發力點。
但在如今自動駕駛芯片“百花齊放”的盛況背後,卻是以色列老牌自動駕駛技術解決方案廠商Mobileye長達十餘年的技術壟斷。

使用Mobileye技術的無人駕駛汽車
直到2014年,特斯拉宣佈研發初代自動駕駛技術時,所採用的仍然是Mobileye所提供的“黑箱式”自動駕駛算法。車企僅能得到Mobileye自動駕駛系統所給出的計算結果,無法得知算法的具體邏輯,也無法針對使用地區的特點,對算法進行更改與調校。
這樣的模式,在傳統車企間流行了很長一段時間,但顯然不能讓技術狂人馬斯克滿意。
特斯拉研發出第一代自動駕駛芯片後,造車新勢力紛紛轉向自研或開放式芯片的懷抱;Mobileye也日漸式微,在2017年被芯片巨頭英特爾收購;其在2020年推出的Eye Q5芯片,也給予了汽車廠商自定義算法的權限。
Mobileye並非沒有技術實力,其在Eye Q5芯片上應用的解決方案Super Vision,實現了用7個遠距單目攝像頭構建完整的SFM(Structure From Motion,三維立體環境模型)的壯舉,將其單目攝像頭與傳統算法的技術優勢地位發揮到了極致。

Mobileye的三維立體環境模型
但其前幾年的“不思進取”,讓各大廠商紛紛研發出了自己基於多傳感器融合的深度學習算法。雖然Mobileye在相比深度學習困難得多的傳統算法領域,仍然無人能敵,但其在自動駕駛市場的壟斷地位已經一去不歸了。
理性來看,融合方案與純視覺之爭,其實是成本與效率之爭。融合方案能夠得到更加確切的車身周圍的環境信息,但激光雷達的高成本,與對來自多重數據源數據的時空標記和匯聚,成為了車企當下面臨的難題。
而純視覺方案採用的攝像頭雖然成本較低,但需要在浩如煙海的樣本數據中,尋找到有效場景,並對其進行標註,再將其作為模型訓練。這對企業的數據收集和深度學習能力,提出了極高要求。
這場比拼,鹿死誰手猶未可知,但它帶動着激光雷達、機器人、自然語言理解等領域在近幾年飛速發展,至少能讓人們相信,我們正走在一條光明的道路上。
作者 | 馬點秋
責任編輯 | 吳陽煜 [email protected]
美編 | 劉陽
看世界雜誌新媒體出品,戳這裏關注更多精彩