作為馬斯克口中的「傻子王」,Waymo終于發(fā)話了。
在馬斯克大肆抨擊激光雷達(dá)十多天后,Waymo高管在Google I\/O 開發(fā)者大會上對其進(jìn)行了公開駁斥。
「你可以想象只用攝像頭進(jìn)行自動駕駛,但你需要最好的攝像系統(tǒng)才能真正做到這一點(diǎn)?!筗aymo首席科學(xué)家Drago Anguelov表示:「因此,這是一個非常大的賭注,你有可能實(shí)現(xiàn)它。但這非常非常冒險,而且沒有必要?!?/span>
1
「傻子論」:不用激光雷達(dá)的理由
半個月前,馬斯克在特斯拉舉辦的「Autonomy Day」上,對激光雷達(dá)傳感器大肆抨擊:「傻子才用激光雷達(dá),任何依賴激光雷達(dá)的人注定要完蛋。注定是這樣?。す饫走_(dá))是昂貴的、不必要的傳感器。這就像有一大堆昂貴的附屬品。比如,一個闌尾是壞的,但現(xiàn)在你有了一大堆闌尾,你會發(fā)現(xiàn)這太荒謬了。」
如果你對激光雷達(dá)不太了解,我們先來對它做個介紹。
激光雷達(dá)是一種會發(fā)射激光的雷達(dá),它把不可見的光脈沖發(fā)送到世界上,并計算出它們返回的時間。這使得它在低分辨率下呈現(xiàn)出黑色和紅色的圖像,但與每個像素間的距離精確。一些激光雷達(dá)還能告訴你目標(biāo)彈開的速度有多快。這樣,它就有了超人的視覺,盡管分辨率低,目前的高成本和更有限的范圍意味著它不是在每個方面都優(yōu)秀。
激光雷達(dá)將3D成像技術(shù)引入自動駕駛汽車計算機(jī),是目前大多數(shù)其他自動駕駛系統(tǒng)的關(guān)鍵元件。目前,Waymo、Uber、福特、通用Cruise等公司將激光雷達(dá)與攝像頭結(jié)合使用,讓自動駕駛汽車了解道路和道路上的情況。
價格昂貴是馬斯克抨擊激光雷達(dá)的一個主要原因。
但目前,每個主要的機(jī)器人車開發(fā)商和大多數(shù)創(chuàng)業(yè)公司都使用激光雷達(dá)與攝像頭和雷達(dá)相結(jié)合的解決方案。他們傾向于增加更多的雷達(dá)和一個或多個激光雷達(dá),有些還添加了不同類型的激光雷達(dá),甚至夜視攝像頭。
之所以這么做,是因?yàn)樵谒麄兛磥?,現(xiàn)在并不是降低成本的時候?,F(xiàn)在是最大限度保證安全的時候,并且要盡快實(shí)現(xiàn)它,以及首先進(jìn)入市場??煽啃允顷P(guān)鍵。
從技術(shù)上看,在激光雷達(dá)+攝像頭或者攝像頭的選擇上,前者是更快、更安全的路徑。更多的信息,特別是更可靠的信息是更好的選擇。
如果想僅僅使用攝像頭,則必須在一定程度上理解一幅圖像,接近人類用眼睛和大腦所做的事情。
沒有激光雷達(dá)超人的測距能力,人類通過智能計算出與遙遠(yuǎn)物體的距離。我們知道人和車有多大,所以一輛車或一個人如果看起來越小,我們就知道它離我們越遠(yuǎn)。當(dāng)我們移動時,我們通過這個物體相對于另一個物體移動的方式來推測距離。
當(dāng)物體離我們很近時,我們也能從兩只「立體」眼睛和通過眼睛聚焦光線的方式得知距離。這些都是有用的,但事實(shí)證明,人們只用一只能看到遠(yuǎn)處的眼睛就可以很好地駕駛——真正的關(guān)鍵在于正確理解場景。
激光雷達(dá)無需任何理解就能知道萬物之間的固有距離。它在這方面近乎完美。對很多事情來說,「賭上你的生命」是可靠的——而且必須如此。人們可以也確實(shí)將「理解」添加到激光雷達(dá)的方案中,但這并不總是必要的,因此,你可以更寬容地理解錯誤。
激光雷達(dá)可以在白天或晚上工作,而攝像頭必須處理不斷變化的外部光線。
Waymo(激光雷達(dá)傳感器的先驅(qū))首席技術(shù)官Dmitri Dolgov承認(rèn)早期版本的激光雷達(dá)「非常昂貴」。但他同時認(rèn)為,這種高成本與大多數(shù)新技術(shù)首次開發(fā)時沒有什么不同。
「從根本上來說,激光雷達(dá)并不昂貴?!笵olgov說,「我們已經(jīng)大幅降低了從第一代到現(xiàn)在的激光雷達(dá)產(chǎn)品的價格??梢韵胂?,隨著規(guī)模的擴(kuò)大,我們將節(jié)省多少成本?!?/span>
今年3月,Waymo宣布,將開始向不與該公司自動拼車服務(wù)競爭的客戶銷售激光雷達(dá),包括機(jī)器人、農(nóng)業(yè)、安全等行業(yè)的公司。這個額外的渠道可能會幫助Waymo通過擴(kuò)大生產(chǎn)來提高規(guī)模經(jīng)濟(jì),最終進(jìn)一步降低其為自己的汽車生產(chǎn)零部件的價格。
2
純視覺真的什么都能扛?
特斯拉在眾多主流汽車制造商中獨(dú)樹一幟,只使用了攝像頭+雷達(dá)的解決方案。馬斯克表示,特斯拉的自動駕駛技術(shù)將完全依賴內(nèi)置攝像頭。
特斯拉選擇攝像頭方案的原因很簡單,目前根本沒有量產(chǎn)并能真正商業(yè)化推開的激光雷達(dá)。
特斯拉現(xiàn)在在銷售汽車,即使他們想裝激光雷達(dá),也裝不上。但是,他們未來的計劃也是無激光雷達(dá)的。
特斯拉決定只用8個攝像頭(前面3個、每側(cè)2個、后面1個)加上前面一個雷達(dá)和一些用于近距離工作的超聲波傳感器來解決駕駛問題。
但現(xiàn)在,計算機(jī)視覺還不是那么好。
在過去幾年里,計算機(jī)視覺技術(shù)取得了一系列驚人的突破,每個人都在使用它們。但是,這項(xiàng)技術(shù)并沒有可靠到能「堵上你的性命」的地步,至少現(xiàn)在還不可靠。問題是,這種情況是否會發(fā)生,以及何時會發(fā)生。
大多數(shù)人說「什么時候」而不是「如果」,特斯拉和其他人說,既然人類只用眼睛就能開車,那么,顯然這是可以做到的。但我們旅行時只用腿,這并不是說汽車應(yīng)該用腿而不是輪子。鳥兒扇動翅膀,但這并不能證明飛機(jī)也應(yīng)該這樣做。有時,機(jī)器的方法是贏家。我們還不知道答案。
早期的激光雷達(dá)非常非常昂貴,但正如很容易預(yù)測的那樣,任何電子技術(shù)都不會永遠(yuǎn)昂貴下去。數(shù)十家公司正在建造新的激光雷達(dá),其成本不會對出租車的成本造成任何負(fù)擔(dān),也不會對私家車的成本帶來太大影響。
如果成本不是問題所在(特別是因?yàn)楝F(xiàn)在還不是廉價的時候),那么大多數(shù)開發(fā)人員都已經(jīng)表明,更可靠的信息是一個顯而易見的選擇。
「一旦解決了視覺問題,(激光雷達(dá))就一文不值了?!?/span>
馬斯克提出了如下觀點(diǎn)。他知道自動駕駛的問題很難解決,盡管他經(jīng)常錯誤地宣稱特斯拉很快就能解決這個問題。太難了,你需要非常非常好的計算機(jī)視覺來解決它。
大多數(shù)人都同意他的觀點(diǎn)——他們認(rèn)為激光雷達(dá)不能獨(dú)自完成這項(xiàng)工作(盡管谷歌的第一代汽車基本上只用激光雷達(dá)和雷達(dá)就可以開得很好)。確實(shí)需要很好的計算機(jī)視覺來完成這項(xiàng)工作。
但如果按照馬斯克所說的,計算機(jī)視覺就必須非常好,好到它可以為你做激光雷達(dá)能做的一切。就像人類的視覺皮層一樣,它必須在各種光線下工作。它必須能夠可靠地計算出所有東西的距離。如果它能做到這一切,那么你就不需要激光雷達(dá)了。如果你開發(fā)使用激光雷達(dá),你就浪費(fèi)了大量時間和金錢在一些你最終并不需要的東西上。
因?yàn)閿z像頭的分辨率更高,它們能看到彩色的東西、更遠(yuǎn)的東西——你的攝像頭能做到這一點(diǎn),甚至做的更好。
也許有一天他是對的。但沒有人知道那一天是什么時候。我們知道不是今天,我們可以猜測可能是在2030年之前。但我們今天想制造汽車。我們知道,便宜的激光雷達(dá)很快就會出現(xiàn)。
特斯拉正在豪賭。他們押注,視覺上的突破將很快實(shí)現(xiàn)。他們希望自己成為實(shí)現(xiàn)這一目標(biāo)的人,通過使用他們定制的神經(jīng)網(wǎng)絡(luò)硬件和從不斷增長的特斯拉汽車車隊中收集到的海量數(shù)據(jù)。其他公司則押注于一個更安全的賭注,他們認(rèn)為,實(shí)現(xiàn)突破還有很長的路要走,而便宜的激光雷達(dá)更有可能出現(xiàn)。
即使在視覺能力達(dá)到良好的那一天,許多人仍然可能會選擇保留非常低成本的激光雷達(dá),據(jù)預(yù)測,激光雷達(dá)將在那個時候出現(xiàn)。它們所提供的優(yōu)勢永遠(yuǎn)不會為零,而且,完全「賭上你的生命」的可靠性基本上不需要任何妥協(xié)。
即使你可以用一只眼睛通過一個單色濾鏡開車,你也不能這么做。你可以為了節(jié)省一大筆錢而放棄安全,但不能為了節(jié)省一點(diǎn)錢而放棄安全。
一個致命案例佐證了目前計算機(jī)視覺能力的缺陷。
上周,特斯拉因一起致命事故被起訴。在這起事故中,特斯拉的算法顯然誤解了車道標(biāo)志,并將車駛?cè)肓说缆泛统隹谠训乐g的假「車道」。它直接撞上了防撞護(hù)欄,致使駕駛者當(dāng)場死亡。
按照特斯拉目前的技術(shù)水平,它有時會錯過車道標(biāo)志。由于它的雷達(dá)和視覺算法都未能識別出這道屏障,所以它撞上了防護(hù)欄。
同樣,這種情況有時會發(fā)生在今天的技術(shù)上。雷達(dá)可以看到它,但作為靜止物體,雷達(dá)系統(tǒng)無法準(zhǔn)確地分辨它們的位置,因此,當(dāng)雷達(dá)從路徑附近的靜止物體反彈回來時,你不能每次都剎車。
更重要的是,計算機(jī)視覺系統(tǒng)無法識別障礙。有一種可能的假設(shè)是,它們只是沒有受過檢測這些障礙的訓(xùn)練,尤其是檢測受損的;十多天前,一個普通的人類司機(jī)打破了這道屏障。
神經(jīng)網(wǎng)絡(luò)只能識別它們接受過訓(xùn)練的東西,或者類似的東西。特斯拉的網(wǎng)絡(luò)訓(xùn)練有素,能夠識別道路上每輛車的后部以及某些類型的物體,但在2018年,它們可能沒有接受過這方面的訓(xùn)練。
它們繼續(xù)開車,更糟的是,它們加速了,因?yàn)樗鼈儸F(xiàn)在認(rèn)為有了一條完全開放的新車道,這是自適應(yīng)巡航控制在這種情況下經(jīng)常做的。
激光雷達(dá)系統(tǒng)幾乎肯定能探測到這個障礙。
如果是在安裝了激光雷達(dá)系統(tǒng)的情況下啟用Autopilot,激光雷達(dá)系統(tǒng)就會檢測到那輛橫穿馬路、撞死Joshua Brow(特斯拉駕駛者)的貨車。
激光雷達(dá)系統(tǒng)不需要知道它們前面的物體是什么,也不需要知道它在哪里,它到底有多大。適當(dāng)?shù)募す饫走_(dá)\/軟件系統(tǒng)確實(shí)能更好地了解障礙是什么,它們與視覺相結(jié)合,將達(dá)到視覺無法單獨(dú)達(dá)到的水平。
總之,解決視覺問題,讓它告訴你激光雷達(dá)告訴你的一切,是一個非常艱巨的任務(wù)。不久前,很難找到任何一個人說這是迫在眉睫的。如今,也有這樣的人,包括馬斯克,但大多數(shù)人仍然認(rèn)為這很難。
但特斯拉希望,他們能從特斯拉車隊的汽車中收集大量數(shù)據(jù),這將是找到解決方案的秘密因素。如果是這樣,使用 Autopilot 駕駛,表明特斯拉仍然還有很長的路要走。特斯拉的 Autopilot 提供了一個屏幕來顯示其感知系統(tǒng)的輸出,任何使用它的人都知道它仍然相當(dāng)不穩(wěn)定。
訣竅是,你不需要解決視覺問題就能得到一個輔助駕駛儀Autopilot,你甚至不需要那么接近。
從99%的精準(zhǔn)視力(可以成為一名不錯的司機(jī)助手)到99.99999%的精準(zhǔn)視力,是一個漫長的旅程,你可以用自己的生命打賭。
Sterling Anderson曾是特斯拉Autopilot的負(fù)責(zé)人,現(xiàn)在是Aurora的首席產(chǎn)品官,喜歡稱他的老東家的方法為,試圖通過建造一個更高的梯子到達(dá)月球。(馬斯克確實(shí)對登月略知一二。)
3
馬斯克如果押錯了呢?
特斯拉的賭注可能會取得好結(jié)果。
想要持有自動駕駛股票投資組合的投資者可能希望同時擁有Waymo(如果可能的話)和特斯拉。這是普通多元化投資者的正確策略。
盡管賭注很大,但還是有一些安全網(wǎng)的。如果特斯拉無法用他們最新的硬件很快解決全自動駕駛問題,他們?nèi)匀挥谐錾碾妱悠嚇I(yè)務(wù)。
他們在電力傳動系統(tǒng)和高科技汽車設(shè)計方面擁有明確的領(lǐng)導(dǎo)地位。他們的自動駕駛產(chǎn)品(autopilot products)將繼續(xù)增加新的和出色的功能,即使它們不能在車內(nèi)沒有人的情況下沿著海岸開車,或者在你睡覺時把你的車開到另一個城鎮(zhèn)。
有一些早期功能可以更容易地解決,而且可能不需要激光雷達(dá),例如:
停車場代客泊車
在處理電子郵件時應(yīng)對交通堵塞
深夜低速行駛,最終,白天作業(yè),將汽車送往充電站
無人監(jiān)督的高速公路駕駛,先是在稀疏的高速公路上駕駛,然后在更擁擠的高速公路上駕駛
在預(yù)先批準(zhǔn)的有限范圍內(nèi)低速運(yùn)作
更好的ADAS(高級駕駛輔助系統(tǒng)),讓你開車時越來越難撞車
它們并不像機(jī)器人出租車(robotaxi)那樣令人興奮或者有利可圖。但它們?nèi)匀环浅S杏?,特斯拉可能是第一個實(shí)現(xiàn)上述一些功能的汽車制造商。(一些汽車制造商已經(jīng)實(shí)施了無人監(jiān)管的交通擁堵操作。)
如果特斯拉決定它需要激光雷達(dá),在吞下一些驕傲后,它將需要對它們的汽車進(jìn)行一些重新設(shè)計。
雖然前向激光雷達(dá)可能很難添加到后視鏡的攝像頭陣列中,但目前特斯拉還沒有明確的地方可以安裝低阻力激光雷達(dá)。它必須比現(xiàn)在的型號小。前向激光雷達(dá)是最安全的關(guān)鍵。
4
馬斯克如果賭對,其他公司也不吃虧
人們在研究這個問題時常犯的一個錯誤是,忘記了其他公司并沒有把全部精力投入到激光雷達(dá)中。
有和特斯拉一樣熱衷于神經(jīng)網(wǎng)絡(luò)和視覺的,他們只是想把神經(jīng)網(wǎng)絡(luò)和視覺與激光雷達(dá)結(jié)合起來,而且他們有資金在這兩方面進(jìn)行研究。
一個特別重要的競爭對手是谷歌的兄弟公司W(wǎng)aymo。
幾乎所有人都同意,在神經(jīng)網(wǎng)絡(luò)方面,谷歌是全球領(lǐng)導(dǎo)者。那些向世界傳授深度神經(jīng)網(wǎng)絡(luò)新方法的先驅(qū),如杰夫·辛頓本人,為谷歌工作。在圍棋比賽中擊敗人類冠軍的神經(jīng)網(wǎng)絡(luò)來自谷歌。Waymo有使用谷歌神經(jīng)網(wǎng)絡(luò)的權(quán)限,使用TPU神經(jīng)網(wǎng)絡(luò)處理器的權(quán)限。
Dolgov在Medium上的一篇文章中寫道:
谷歌的人工智能研究人員也幫助 Waymo在通往真正的自動駕駛汽車的道路上起步。
當(dāng)深度學(xué)習(xí)開始起步時,Waymo的自動駕駛工程師與谷歌大腦團(tuán)隊并肩工作,將深度網(wǎng)絡(luò)應(yīng)用于Waymo的行人檢測系統(tǒng)。即使在早期,結(jié)果也是顯著的ーー在幾個月的時間里,能夠?qū)⑿腥藱z測的錯誤率降低100倍,使Waymo的系統(tǒng)更安全、也更有能力在道路上行駛。
「我們使用TensorFlow生態(tài)系統(tǒng)和谷歌的數(shù)據(jù)中心(包括TPU)訓(xùn)練神經(jīng)網(wǎng)絡(luò);TPU可以更有效地訓(xùn)練我們的網(wǎng)絡(luò),效率提升高達(dá)15倍?!?/span>
「憑借我們多年的經(jīng)驗(yàn),與Google AI的合作,以及強(qiáng)大的基礎(chǔ)設(shè)施,我們比以往任何時候都更接近一個交通更安全、更容易、更便捷的未來?!笵olgov在文章最后總結(jié)道。
雖然馬斯克宣稱特斯拉的神經(jīng)網(wǎng)絡(luò)芯片是「世界上最好的」,但事實(shí)并非如此——谷歌的TPU更好,除了Waymo,其他人買不到它。
不過,沒關(guān)系,因?yàn)樵谏窠?jīng)網(wǎng)絡(luò)方面,硅谷有很多初創(chuàng)公司都在開發(fā)他們自己版本的「世界上最好的芯片」,你會在2019-2020年看到很多這樣的公司。與此同時,英偉達(dá)的GPU可以做到這一點(diǎn),性能超過特斯拉的芯片,但它們的功耗更高。
如果激光雷達(dá)明顯是多余的,Waymo和其他幾家公司將準(zhǔn)備轉(zhuǎn)移。
他們沒有特斯拉的車隊,但是有辦法得到這些資源,盡管有時成本更高,而特斯拉聰明地讓客戶為收集數(shù)據(jù)和為特斯拉做測試的機(jī)會付費(fèi)。 (Uber和Lyft還有更多的司機(jī)可能會為他們做同樣的事情。)
如果正如馬斯克預(yù)測的那樣,激光雷達(dá)敗了,特斯拉將擁有優(yōu)勢,但并非是不可逾越的優(yōu)勢。
他還必須確保自己下的其他賭注也能兌現(xiàn)——比如沒有詳細(xì)地圖的駕駛——以及使用機(jī)器學(xué)習(xí)來做出戰(zhàn)術(shù)駕駛決策,比如在十字路口使用哪條車道。他也(溫和地)反對模擬測試:他們使用模擬測試,但不像Waymo和其他一些玩家那樣廣泛使用。
特斯拉可能仍需要在其軟件成熟時調(diào)整其傳感器??拷嚨牡胤剑瑪z像頭看不到,如果遇到惡劣天氣,汽車側(cè)面和后部也沒有雨刷。即使在那些地方,激光雷達(dá)的愛好者也不會避開神經(jīng)網(wǎng)絡(luò)。他們使用神經(jīng)網(wǎng)絡(luò)理解激光雷達(dá)數(shù)據(jù),就像他們用它來理解攝像頭數(shù)據(jù)一樣。 (它們也可用于雷達(dá)數(shù)據(jù)。)由于激光雷達(dá)的分辨率較低,這些神經(jīng)網(wǎng)絡(luò)更加簡單和快速。
馬斯克表示,特斯拉「明年」將有100萬輛自動駕駛出租車上路,雖然特斯拉的叫車計劃缺乏許多重要細(xì)節(jié)。
至于Waymo何時將其自動拼車服務(wù)Waymo One推向進(jìn)行初始測試的鳳凰城地區(qū)以外的市場,Waymo高管對具體時間守口如瓶。
「我們有一個路線圖和將業(yè)務(wù)擴(kuò)展到鳳凰城以外的地區(qū)的計劃。」Dolgov說,「但一如既往,我們的部署將以安全為前提?!?/span>
參考來源:Mashable、福布斯、Wired
轉(zhuǎn)載請注明出處。