高富帥 Waymo PK 西裝暴徒 Tesla_風聞
42号车库-42号车库官方账号-最懂智能电动汽车的汽车新媒体。2019-05-10 21:38
眾所周知,自動駕駛技術感知領域存在着廣泛的技術分歧,以激光雷達為主的多傳感器融合派和以攝像頭為主的視覺優先派就孰優孰劣進行了曠日持久的技術交手。最近,激光雷達陣營的旗手 Waymo 和攝像頭陣營的龍頭特斯拉又一次交鋒了。
不體面的互懟
新一輪的交鋒最早要追溯到 4 月 22 日,在特斯拉自動駕駛投資者日上,Elon Musk 再一次向激光雷達開炮。
用激光雷達的都是傻 X,任何依賴激光雷達的公司註定是要失敗的。它們是昂貴、不必要的傳感器。
為什麼要如此的出言不遜呢?
Elon 向來無所顧忌、囂張跋扈,這樣的個性與他過去 20 年來每每進入一個新領域總是力排眾議一意孤行最後又總能取得成功密切相關。
在特斯拉推出自動駕駛芯片的投資者日上,分析師第 N 次質疑特斯拉 Autopilot 的技術路線。考慮到 Elon 自 2015 年底就完全接管,直接領導和招聘 Autopilot 團隊,這不是質疑攝像頭的潛力,這是在質疑 Elon 對技術前景的判斷。已經反覆解釋過 N 次的 Elon 終於爆發也就不足為奇了。
Elon 這麼一鬧,不少激光雷達陣營的從業人員都出來回應。不過吃瓜羣眾最期待的 Waymo,彼時並沒有發聲。
Waymo 在等待時機,在 5 月 8 日的 Google I/O 2019 大會上,Waymo CTO 兼工程副總裁 Dmitri Dolgov 和 Waymo 首席科學家 Drago Anguelov 展開了全面反擊。
Elon 僅使用攝像頭而去掉激光雷達是「非常危險」的(very risky)。
你可以設想僅通過攝像頭實現自動駕駛,但你需要最好的攝像頭系統來解決問題。所以這是一個非常大的賭注,你可以實現它,但是非常非常冒險且不必要。
Anguelov 認為激光雷達幫助 Waymo 為用户創造了更安全的用户體驗。
我們擁有更豐富的數據也更準確,我們更容易建立正確的模擬環境。激光雷達幫助汽車確定道路上的汽車和其他物體如何相互作用,如果你只用攝像頭,所有這一切都要難得多,而且有更多限制。
Dolgov 的回應讓特斯拉徹底陷入窘境。
(對於攝像頭和激光雷達)我們不是非此即彼,我們兩者兼具。一切都是為了充分汲取兩個感知體系下的世界並以一種可理解的方式將他們結合起來,從而擁有最強大、最安全的系統。
激光雷達從本質上講沒什麼昂貴的東西,我們已經大幅降低了從第一代到當前的激光雷達的價格。你可以想象隨着我們的擴張,成本下降空間會有多大。
我們有一個(自動駕駛車隊運營區域)擴張到鳳凰城外的路線圖和一些計劃。
(2018 年 12 月,Waymo 在美國亞利桑那州鳳凰城的限定區域內正式推出了自動駕駛汽車打車服務 Waymo One。)
對於 Waymo 方面的反駁,Elon 徹底失去了耐心,選擇以「任何購買特斯拉全自動駕駛功能的用户都能在今年(晚些時候)使用 Autopilot(全程無需人工干預)從加州開到紐約」結束戰鬥。(括號中豐富的細節來自 Elon 此前關於 Autopilot 的表述)
看着這些在自動駕駛領域世界級的科學家和技術專家沒營養的互懟,我感到很失落,這樣不好。自動駕駛汽車是一個新生事物,我們應該讓普通消費者理解,為什麼 Waymo 和 Tesla 的分歧沒有太大價值,為什麼自動駕駛不同技術路線的感知最終會殊途同歸。
Waymo?
我們直接從 Waymo 的反擊説起吧。不得不説,無論 Elon 怎麼回應,Waymo 的精確打擊都切中要害,一擊必中。
僅使用攝像頭而去掉激光雷達是「非常危險」的
我們更豐富、更準確,一切都是為了更強大、更安全
這會在消費者心中形成一個認知:攝像頭 = 危險;激光雷達 = 安全。實際上,特斯拉的對面不是 Waymo 一個人,Waymo 陣營的規模有多大呢?外媒 The Verge 的標題一語中的。
IT’S ELON MUSK VS. EVERYONE ELSE IN THE RACE FOR FULLY DRIVERLESS CARS
The Tesla CEO is forging his own path toward full autonomy
這是 Elon Musk VS 其他任何人在自動駕駛賽道的對決
特斯拉 CEO 以自己獨有的方式實現自動駕駛
下面我們一一展開討論。
Elon 説激光雷達的主要問題在於「昂貴」和「不必要」,激光雷達更安全已經解決了「不必要」的問題,那麼「昂貴」呢?
與大多數車企、自動駕駛公司不同,如今 Waymo 早已不再採購激光雷達領域的頂級大廠 Velodyne 的產品,而是走了內部自主研發的路線。與特斯拉自研芯片類似,自主研發激光雷達給 Waymo 帶來了獨特的競爭力。
比如説,同等性能的激光雷達,Waymo 自研的成本要遠低於採購 Velodyne。早在 2017 年年初的底特律車展上,Waymo CEO John Krafcik 就宣佈,Waymo 已經將激光雷達的成本下降了 90% 以上。
Waymo 此前採購 Velodyne 的 64 線激光雷達成本為 75,000 美金左右,下降 90% 以上意味着 Waymo 將成本控制在了 7,500 美金以內。
考慮到 Autopilot 2.+ 的 BOM 成本控制在 2,500 美金左右,Elon 仍然可以維持既有態度:Waymo 的工作是卓有成效的,但今天的激光雷達成本遠未達到商業化臨界點。
但是,別忘了 Waymo 暴降 90% 以上的表態是在 2017 年,Waymo 激光雷達團隊一直在為性能的提升和成本的下降不斷努力。
4 月 24 日,《福布斯》曝光了 Waymo 正在測試的下一代感知系統,包括激光雷達系統和攝像頭系統都做了升級。Waymo 沒有披露新款激光雷達的提升或改進細節,但確認「新傳感器系統最近幾周開始在舊金山灣區測試」。
如果我們回顧一下 Waymo 在過去兩年來取得的各種進展,會發現 Waymo 商業化的速度還是相當令人印象深刻的。
Waymo 跟 FCA 和捷豹路虎達成了共計 8.2 萬輛規模的自動駕駛車隊採購協議
Waymo 實際路測里程超過 1000 萬英里,虛擬測試里程超過 70 億英里
Waymo 自動駕駛打車服務 Waymo One 正式上線
Waymo 在密歇根設廠,100% 專注於量產 L4 級自動駕駛汽車
除了上述進展,Waymo 值得關注的另一個原因在於下面這張圖。
除了車頂的激光雷達,Waymo 還在車正前方和正後方,左右兩側各配備了短程、高分辨率中程和高性能長距激光雷達。Waymo 堆料狂魔的底氣來自對自研傳感器成本的控制,而充分的傳感器佈置反過來又在技術層面做到了自動駕駛領域無可爭議的第一。
我們如何看待 Waymo,Waymo 正在憑一己之力解決沒有眾包車隊收集海量數據、激光雷達成本居高不下、算法改進乏力等一個又一個自動駕駛汽車商業化道路上的攔路虎們。
通用 Cruise 正在快速追趕,成長為耀眼的新星。但如果從技術、成本、商業化等各個角度綜合判斷,撇開不走尋常路的特斯拉不談,自動駕駛領域應該劃分為 Waymo 和其他。
特斯拉!
然而現實世界是不允許撇開特斯拉的,下面我們來聊這家公司。先回到文章開頭的互懟,你仔細觀察,會發現有趣的細節的。
Waymo 首席科學家 Drago Anguelov 批評特斯拉僅用攝像頭「非常非常冒險且不必要」,但關於僅用攝像頭落地自動駕駛,他的評價是「你需要最好的攝像頭系統來解決問題」、「你可以實現它但這是一個巨大的賭注」以及「所有這一切都要難得多」。
作為斯坦福大學計算機科學、人工智能和機器學習領域的博士、Waymo 首席科學家,Drago Anguelov 對攝像頭感知的潛力,對計算機視覺 + 人工智能技術的邊界有着清晰的認知。完全基於攝像頭實現自動駕駛的挑戰巨大,但並不是説這完全不可行。
Waymo 的感知為什麼以激光雷達為主?這是由歷史因素決定的。在 Google 無人車項目起步的 2009 年,人工智能技術還沒有取得顯著進展。這直接導致彼時以攝像頭為主做自動駕駛汽車的視覺感知是完全不可行的。
那是誰給了 Elon 站在行業對立面的勇氣?
2012 年,深度卷積神經網絡驅動的 ImageNet 大規模視覺識別挑戰賽錯誤率大幅下降到了 16%,被認為是前所未有的突破,也成為新一波人工智能浪潮繁榮的起點。這直接撬動了人工智能和計算機視覺識別技術的快速發展。
所以發展到今天,Waymo 的感知體系和特斯拉的感知體系出現了明顯的差異。
Waymo 以激光雷達為主,基於點雲的感知(Point-cloud based)依賴於由有源傳感器收集的 3D 空間中的點(或測量到對象的距離)的數據。算法可以涉及通過點的密度,幾何形狀或圖案從大量點導出結構以便檢測物體,正確地檢測和識別故障。
特斯拉以攝像頭為主,基於視覺的感知(Vision-based)依賴於相機數據。因此,這些算法剖析基於像素的視頻以檢測環境中的車輛、行人和其他障礙物。算法可以使用幾何、光流、顏色或其他圖像特徵進行檢測。
Waymo 在 2017 年的技術博客中提到激光雷達的關鍵意義是這麼説的。
我們自主研發的激光雷達可以區分真實的行人和人形海報,它能識別三維形狀,檢測靜止物體,精確測量距離。
所以特斯拉攝像頭為主感知的核心問題在於,賦予攝像頭和激光雷達類似的,識別 3D 空間物體的能力。換句話説,通過不同像素的切割,賦予自動駕駛系統識別和理解圖像深度信息的能力。
在 Elon 向激光雷達開炮一天後。美國康奈爾大學一項名為《源自視覺深度估算的偽激光雷達(Pseudo-LiDAR),縮小自動駕駛 3D 物體探測差距》的研究中,研究人員使用低成本低分辨率的立體相機通過預算深度像素反向投影 3D 點雲,實現了點雲質量的大幅提升,精度從 10% 提升到 37.9%,快速逼近激光雷達 66% 的平均精度。
考慮到該研究基於 40 萬像素攝像頭實現,與最先進、最高分辨率的攝像頭體系有着巨大的差距,也沒有應用模型蒸餾(model distillation)或實時預測(anytime prediction)提升探測精度及速度,研究人員的結論是這項研究的改進前所未有,有着廣闊的前景和潛力。
那麼特斯拉是怎麼做的呢?
在特斯拉自動駕駛投資人當天,特斯拉官方 Twitter 發佈了這樣一條視頻,配文「通過此3D 重建可以顯示,特斯拉車輛能從 8 個攝像頭所拍攝的短短几秒的視頻中收集大量深度信息」。
這與康奈爾大學的視覺感知研究路徑異曲同工。
當然,自動駕駛感知還存在着廣泛的問題需要科學家和工程師去克服。但更多時候,這是激光雷達和攝像頭的共性挑戰。
比如在白雪完全覆蓋的路況下,攝像頭對車道線、道路邊界、路牌、障礙物的識別能力都將大幅降低,但雪的密度也會影響激光雷達的反射效果,產生幻影障礙(Phantom obstacles)。從而干擾激光雷達的感知能力。
所以,無論是基於激光雷達的多傳感器融合還是基於攝像頭的視覺為主,本質上都是賦予機器以人類感知環境的能力。這就是為什麼 Waymo 和 Tesla 的分歧沒有太大價值,為什麼自動駕駛不同技術路線的感知最終會殊途同歸。
看點還是有的,高富帥 Waymo 和西裝暴徒 Tesla,誰先勝出?