2016年,特斯拉宣布其生產(chǎn)的所有特斯拉汽車(包括入門車型 Model 3)都將配備可實(shí)現(xiàn)完全自動(dòng)駕駛功能的硬件,并且安全級(jí)別將遠(yuǎn)遠(yuǎn)高于人類自己駕駛。
看到這條消息,讓我想到了有關(guān)無(wú)人駕駛實(shí)現(xiàn)路徑的兩個(gè)主要問(wèn)題:
信息輸入端(Input):視覺(jué)還是激光雷達(dá)?
信息處理端(Processing):算法為王還是數(shù)據(jù)為王?
無(wú)人駕駛汽車上主要的傳感器:激光雷達(dá)、攝像、毫米波雷達(dá)、GPS、超聲波雷達(dá)和車輪轉(zhuǎn)角傳感器等。
無(wú)人駕駛:以視覺(jué)為主還以激光雷達(dá)為主?
Elon Musk 曾經(jīng)在公開(kāi)場(chǎng)合多次說(shuō)過(guò),不用激光雷達(dá)只用攝像頭,也能實(shí)現(xiàn) Level 4 以上的無(wú)人駕駛。但是我個(gè)人覺(jué)得他這么說(shuō)其實(shí)是有商業(yè)化方面的考慮。
特斯拉的汽車已經(jīng)在售,賣出去的車只能更新軟件,肯定不能換硬件,比如全部重新裝上激光雷達(dá)(不然今天特斯拉官方也不會(huì)說(shuō)現(xiàn)在在產(chǎn)的特斯拉汽車會(huì)換上新的硬件系統(tǒng))。
況且,Google 無(wú)人車用的 64 線 Velodyne 激光雷達(dá)本身的價(jià)格高達(dá) 75000 美元,這幾乎和低配版特斯拉在美國(guó)的售價(jià)差不多了。
特斯拉的車要賣的好必須控制成本,Google 的無(wú)人車目前還只是處于測(cè)試階段,幾百輛的規(guī)模當(dāng)然可以什么好用用什么,相比于特斯拉幾萬(wàn)的產(chǎn)銷量,花不了多少錢。
今年 5 月 7 日,美國(guó)佛羅里達(dá)州的一位特斯拉車主在使用 Autopilot 時(shí)發(fā)生車禍,最終不幸生亡。由此還導(dǎo)致給特斯拉提供計(jì)算機(jī)視覺(jué)技術(shù)的 Mobileye 創(chuàng)始人 Amnon Shashua 與 Elon Musk 之間的口水戰(zhàn),雙方最終還鬧掰了:Mobileye 宣布在與特斯拉合同結(jié)束后不再繼續(xù)合作。
在特斯拉 9 月 11 日發(fā)布的Autopilot 8.0 版本中,特斯拉把毫米波雷達(dá)采集到的數(shù)據(jù)作為了控制系統(tǒng)判斷的主要依據(jù),而不是之前 Mobileye 的攝像頭。
說(shuō)起 5 月份的車禍,其實(shí)在車禍發(fā)生前,特斯拉的毫米波雷達(dá)已經(jīng)感知到有障礙物,但是攝像頭因光線的問(wèn)題,沒(méi)有發(fā)現(xiàn)在藍(lán)天白云背景下的大貨車,最后導(dǎo)致車禍發(fā)生。Musk 肯定也知道了攝像頭并不靠譜,所以才在 Autopilot 的新版本中把毫米波雷達(dá)的數(shù)據(jù)作為主要參考依據(jù)。
綜上所述,Musk 說(shuō)「不用激光雷達(dá)只用攝像頭,也能實(shí)現(xiàn) Level 4 以上的無(wú)人駕駛」更多是出于商業(yè)化方面的考慮。
此舉意在一邊用現(xiàn)有的傳感器收集數(shù)據(jù),一邊等激光雷達(dá)價(jià)格降下來(lái)。個(gè)人認(rèn)為,如果固態(tài)激光雷達(dá)的價(jià)格真能如宣傳中所說(shuō)下降到 100 美元到 200 美元,為了保證汽車行駛的安全性,Musk 肯定是會(huì)用的。
大數(shù)據(jù)與算法:對(duì)于實(shí)現(xiàn)無(wú)人駕駛哪個(gè)更重要?
一年前這個(gè)時(shí)候,下圖所示的微博引起了網(wǎng)友們的爭(zhēng)論。
一方認(rèn)為:數(shù)據(jù)為王,再牛的智能算法也拼不過(guò)海量的數(shù)據(jù)。而另一方則認(rèn)為:數(shù)據(jù)只是建材,強(qiáng)大的分析能力才能讓它變成摩天大樓,對(duì)效率的追求導(dǎo)致了算法,大數(shù)據(jù)取代不了算法。
有意思的是,近日 Google 和特斯拉都公布了各自的測(cè)試?yán)锍虜?shù)。
據(jù)華爾街日?qǐng)?bào)美國(guó)當(dāng)?shù)貢r(shí)間 10 月 5 日?qǐng)?bào)道,Google 宣布自己的無(wú)人駕駛汽車剛剛完成 200 萬(wàn)英里道路行駛里程。而特斯拉創(chuàng)始人 Elon Musk 也于幾天后在個(gè)人 Twitter 上宣布:特斯拉 Autopilot 發(fā)布后的 1 年中累計(jì)行駛里程已達(dá)到 2.22 億英里。
Google 和特斯拉兩方的表態(tài)表面上似乎也印證了微博討論中雙方的觀點(diǎn):數(shù)據(jù)為王 VS 算法為王。那實(shí)際情況究竟如何?
我們不妨考慮另一個(gè)類似的現(xiàn)象:大多數(shù)人認(rèn)為 Google 的搜索比微軟的 Bing 搜索在質(zhì)量上做得略好一點(diǎn)的原因是 Google 的算法好。
但在前 Google 工程師吳軍博士看來(lái),「這種看法在 2010 年之前是對(duì)的,因?yàn)槟菚r(shí) Bing 在技術(shù)和工程方面明顯落后于 Google。但今天這兩家公司在技術(shù)上已經(jīng)相差無(wú)幾了,Google 還能稍稍占優(yōu),很大程度上靠的是數(shù)據(jù)的力量?!?/div>
與搜索算法尚不成熟的 2000 年不同,今天已經(jīng)不存在一個(gè)未知的方法,僅憑它就能將準(zhǔn)確率提高哪怕一個(gè)百分點(diǎn)。Google 憑借 PageRank 算法給搜索結(jié)果帶來(lái)了質(zhì)的變化,而好的搜索結(jié)果能吸引更多的用戶使用 Google 的搜索引擎,這不知不覺(jué)間給 Google 提供了大量的點(diǎn)擊數(shù)據(jù)。
有了這些數(shù)據(jù)之后,Google 可以訓(xùn)練出更精確的「點(diǎn)擊模型」,而點(diǎn)擊模型貢獻(xiàn)了今天搜索排序至少 60% 到 80% 的權(quán)重,這將吸引更多的用戶,整個(gè)過(guò)程是一個(gè)典型的不斷自我強(qiáng)化的正反饋過(guò)程。
在 Google 內(nèi)部,產(chǎn)品經(jīng)理們都遵循這樣一個(gè)規(guī)則:在沒(méi)有數(shù)據(jù)之前,不要給出任何結(jié)論。由此可見(jiàn),Google 的企業(yè)使命已經(jīng)融入了員工的日常工作中。Google 正是充分利用了大數(shù)據(jù)的力量,順利成為了對(duì)整張互聯(lián)網(wǎng)舉足輕重的樞紐節(jié)點(diǎn),非常自然地實(shí)現(xiàn)了對(duì)互聯(lián)網(wǎng)的壟斷。
再舉一個(gè)例子,9 月 27 日 Google 發(fā)布了新版本的神經(jīng)機(jī)器翻譯系統(tǒng)(Google Neural Machine Translation,GNMT),宣稱該系統(tǒng)的翻譯質(zhì)量接近人工筆譯。
大多數(shù)網(wǎng)友在實(shí)際測(cè)試過(guò)后,表示眼前一亮。與此同時(shí),這也引起了某些翻譯工作者的恐慌:「作為翻譯看到這個(gè)新聞的時(shí)候,我理解了 18 世紀(jì)紡織工人看到蒸汽機(jī)時(shí)的憂慮與恐懼。」而這其實(shí)也是充分利用大數(shù)據(jù)的結(jié)果。
其實(shí)早在 2005 年,Google 的機(jī)器翻譯質(zhì)量就讓全世界從事自然語(yǔ)言處理的人震驚不已了:從來(lái)沒(méi)有從事過(guò)機(jī)器翻譯的 Google,在美國(guó)國(guó)家標(biāo)準(zhǔn)技術(shù)研究所(National Institute of Standards and Technology,NIST)的年度測(cè)評(píng)中遙遙領(lǐng)先。
如下圖所示,在阿拉伯語(yǔ)到英語(yǔ)翻譯的封閉測(cè)試集中,Google 系統(tǒng)的 BLUE 評(píng)分為 51.31%,領(lǐng)先第二名將近 5%,而提高這 5 個(gè)百分點(diǎn)在過(guò)去需要研究 5 到 10 年。
Google 究竟是做到的呢?除了 Google 一貫的行事風(fēng)格——把該領(lǐng)域全世界最好的專家、南加州大學(xué) ISI 實(shí)驗(yàn)室的弗朗茲-奧科(Franz Och)博士挖過(guò)來(lái)之外,最關(guān)鍵的還是 Google 手里握有改進(jìn)機(jī)器翻譯系統(tǒng)所需要的大數(shù)據(jù)。
機(jī)器翻譯專家 Franz Och,供職于人類長(zhǎng)壽公司(后來(lái)他又轉(zhuǎn)行到了大數(shù)據(jù)醫(yī)療領(lǐng)域)
從奧科 2004 年加入 Google 到 2005 年參加 NIST 測(cè)試,期間只有一年時(shí)間,如此短的時(shí)間只夠他將在南加大的系統(tǒng)用 Google 的程序風(fēng)格重新實(shí)現(xiàn)一遍,完全沒(méi)有額外的時(shí)間做新的研究。而從上圖中我們可以看到,Google 和南加大系統(tǒng)的水平差了 5 到 10 年。
其中的秘密就在于:奧科在 Google 還是用的在南加大使用過(guò)的方法,但充分利用了 Google 在數(shù)據(jù)收集和處理方面的優(yōu)勢(shì),使用了比其他研究機(jī)構(gòu)多上萬(wàn)倍的數(shù)據(jù),訓(xùn)練出一個(gè)機(jī)器翻譯的六元模型(一般來(lái)講 N 元模型的 N 值不超過(guò) 3)。當(dāng)奧科使用的數(shù)據(jù)是其他人的上萬(wàn)倍時(shí),量變的積累導(dǎo)致了質(zhì)變的發(fā)生,而這就是當(dāng)今人工智能領(lǐng)域最權(quán)威的幾位專家之一杰弗里-辛頓(Geoffrey Hinton)教授所堅(jiān)持的「多則不同」吧。
值得一提的是,上圖中的排在末位的 SYSTRAN 公司是一家使用語(yǔ)法規(guī)則進(jìn)行翻譯的企業(yè),在科學(xué)家們還沒(méi)有想到或者有條件利用統(tǒng)計(jì)的方法進(jìn)行機(jī)器翻譯之前,該企業(yè)在機(jī)器翻譯領(lǐng)域是最領(lǐng)先的。但現(xiàn)在與那些采用了數(shù)據(jù)驅(qū)動(dòng)的統(tǒng)計(jì)模型的翻譯系統(tǒng)相比,它的翻譯系統(tǒng)就顯得非常落后了。
經(jīng)過(guò)上述分析,對(duì)本小結(jié)的問(wèn)題終于可以下一個(gè)較安全的結(jié)論:在當(dāng)下的企業(yè)競(jìng)爭(zhēng)中,相比于算法或數(shù)學(xué)模型,數(shù)據(jù)的重要性的確要大得多,即數(shù)據(jù)為王。
因?yàn)榍罢咄蓪W(xué)術(shù)界在幾十年前就已經(jīng)發(fā)現(xiàn)了,所有企業(yè)都可以加以利用,但是多維度的完備數(shù)據(jù)并不是每一個(gè)企業(yè)都擁有的。
今天很多企業(yè)在產(chǎn)品和服務(wù)的競(jìng)爭(zhēng),某種程度上已經(jīng)是數(shù)據(jù)的競(jìng)爭(zhēng)了,可以說(shuō)沒(méi)有數(shù)據(jù)就沒(méi)有智能。因?yàn)閺睦碚撋现v,只要能夠找到足夠多的具有代表性的數(shù)據(jù),就可以利用概率統(tǒng)計(jì)結(jié)果找到一個(gè)數(shù)學(xué)模型,使得它和真實(shí)情況非常接近,從而節(jié)省了大量人力成本或給予了用戶更愉悅的體驗(yàn)。
總結(jié)
特斯拉已經(jīng)積累的 2.22 億英里行駛數(shù)據(jù),以及未來(lái)將要積累的數(shù)據(jù),對(duì)于他們研發(fā) Level 4 以上的無(wú)人駕駛汽車是非常有幫助的,特斯拉可能會(huì)最終會(huì)先 Google 一步實(shí)現(xiàn)量產(chǎn)。
目前出于商業(yè)化的考慮,已量產(chǎn)的特斯拉用「攝像頭 毫米波雷達(dá) 超聲波雷達(dá)」作為主要傳感器,但是等到低成本的固態(tài)激光雷達(dá)性能更穩(wěn)妥。我相信 Musk 肯定是會(huì)裝上去的(有網(wǎng)友已經(jīng)在加州的道路上拍到頭上頂著激光雷達(dá)的特斯拉汽車偷偷在做測(cè)試了),因?yàn)檫@對(duì)于保證實(shí)現(xiàn) 99.9999% 的車輛行駛安全性是非常有幫助的。
轉(zhuǎn)載請(qǐng)注明出處。