閱讀 | 訂閱
閱讀 | 訂閱
機(jī)器人

機(jī)器視覺(jué)緊追猛趕 終與機(jī)器人齊駕并驅(qū)

星之球激光 來(lái)源:虎嗅網(wǎng)2016-01-05 我要評(píng)論(0 )   

  自拍美圖、人臉識(shí)別、無(wú)人駕駛很難說(shuō)計(jì)算機(jī)視覺(jué)還高冷地?zé)o人知曉,其實(shí)它早已潛入日常生活中。40年前,這項(xiàng)與機(jī)器人本為一家的技術(shù),一度因識(shí)別精準(zhǔn)率過(guò)低被嫌棄,...


  自拍美圖、人臉識(shí)別、無(wú)人駕駛……很難說(shuō)計(jì)算機(jī)視覺(jué)還高冷地?zé)o人知曉,其實(shí)它早已潛入日常生活中。40年前,這項(xiàng)與機(jī)器人本為一家的技術(shù),一度因識(shí)別精準(zhǔn)率過(guò)低被嫌棄,緊追猛趕后,如今終于回到與機(jī)器人并駕齊驅(qū)的高尖水平。
  最新的計(jì)算機(jī)視覺(jué)進(jìn)展到什么程度?
  2015年12月13日,烏鎮(zhèn)世界互聯(lián)網(wǎng)大會(huì)舉辦前夕,第14屆國(guó)際計(jì)算機(jī)視覺(jué)大會(huì)(ICCV)在南美智利舉辦,這場(chǎng)2年一屆的頂尖盛會(huì),展示了這一領(lǐng)域的最近突破。本屆ICCV被微軟亞洲研究院搶走了頭條。他們的視覺(jué)計(jì)算組研發(fā)出全新深度學(xué)習(xí)方法,具備152層類神經(jīng)網(wǎng)絡(luò),比原先多出132層,即用同樣的百萬(wàn)比資料就可以訓(xùn)練出深層的類神經(jīng)網(wǎng)絡(luò)。這些最先進(jìn)的深度學(xué)習(xí)類神經(jīng)網(wǎng)路,能將照片中的車、房、人、物……等等一千類物件精準(zhǔn)地識(shí)別出來(lái),平均錯(cuò)誤率從幾年前的動(dòng)輒50%,到今年已經(jīng)降到3%,已可接入實(shí)際應(yīng)用。
  華人自古以來(lái)的圖像情節(jié)
  ICCV頭條中的“亞洲”字眼非常醒目,實(shí)際上微軟這項(xiàng)里程碑式成果的發(fā)明者全是中國(guó)人。如果這還無(wú)法證明計(jì)算機(jī)視覺(jué)的世界版圖正向亞洲遷移,來(lái)看下一項(xiàng)證據(jù)。
  ICCV通常在北美、歐洲等技術(shù)發(fā)達(dá)的國(guó)家舉行,今年的大會(huì)贊助商名單中竟出現(xiàn)了不少中國(guó)企業(yè)身影,商湯科技、百度、Viscovery創(chuàng)意引晴,漢字在贊助榜上快占據(jù)半壁江山。除了在世界頂尖國(guó)際會(huì)議上越發(fā)活躍之外,中國(guó)的計(jì)算機(jī)視覺(jué)學(xué)者也藉由區(qū)域型會(huì)議如ACCV,以及國(guó)內(nèi)計(jì)算視覺(jué)大會(huì)CCCV、RACV,凝聚了大量的政、商、媒體、學(xué)界的焦點(diǎn)與資源。
  過(guò)去十年,中國(guó)人在計(jì)算機(jī)領(lǐng)域的分量和影響力逐年增加,相關(guān)學(xué)者越來(lái)越多,我在美國(guó)讀博士班的時(shí)候,教授就很好奇,“為什么你們?nèi)A人對(duì)計(jì)算機(jī)視覺(jué)特別感興趣?”我回答說(shuō),“因?yàn)槲覀兊奈淖志褪菑南笮挝淖珠_始,本身從圖像引申來(lái)的,看文字就像在看圖像一樣。”
  中國(guó)很多面孔雖沒(méi)有去國(guó)外念過(guò)博士,但卻在這個(gè)領(lǐng)域越來(lái)越有影響力。微軟亞洲研究院的首席研究員孫劍博士,正是此類人物。近年來(lái)藉由“阿里云”的“天池”平臺(tái)舉辦的各項(xiàng)競(jìng)賽,包括剛剛舉辦完的“淘寶穿衣搭配算法競(jìng)賽”與“阿里大規(guī)模圖像搜索大賽”,也都幫助中國(guó)在圖像識(shí)別研究走在于世界的最前面。
  五年前,中國(guó)計(jì)算機(jī)視覺(jué)的市場(chǎng)還小于美國(guó),現(xiàn)在,兩國(guó)做計(jì)算機(jī)視覺(jué)的新創(chuàng)公司數(shù)量已旗鼓相當(dāng)。如果碰上合適的具體市場(chǎng)應(yīng)用,過(guò)幾年很有可能超越美國(guó),且成為贏家通吃的局面,就像以色列的MobileEye獨(dú)占全球的“車輛撞擊預(yù)警系統(tǒng)”一樣。
  中國(guó)獨(dú)特的市場(chǎng)需求:視頻+廣告
  計(jì)算機(jī)視覺(jué)雖未迎來(lái)里程碑式的巨大風(fēng)口,但一個(gè)接一個(gè)的小風(fēng)口從未斷過(guò)。90年代人臉偵測(cè)成熟之后,現(xiàn)在所有的相機(jī)都可以框出人臉。下一項(xiàng)成熟的技術(shù),人臉識(shí)別,還可以精準(zhǔn)識(shí)別誰(shuí)是誰(shuí)?,F(xiàn)在從臉書上傳照片,會(huì)自動(dòng)匹配好所有好友的標(biāo)簽,非常方便。在安防領(lǐng)域方面,全球有幾十家數(shù)得上的智能監(jiān)視系統(tǒng)廠商,可以輕松監(jiān)測(cè)畫面中的人物移動(dòng)。
目前大家搶著要解決的,是如何提升影像中物件識(shí)別的準(zhǔn)確度。一旦可以輕易知道畫面中存在的人物、物件、場(chǎng)景,就能用增強(qiáng)現(xiàn)實(shí)做游戲(AR)、監(jiān)測(cè)自動(dòng)駕駛的環(huán)境等等。中國(guó)的巨頭BAT都在做計(jì)算機(jī)視覺(jué)應(yīng)用。阿里舉辦商品識(shí)別大賽,第一年就推出了一百萬(wàn)商品做識(shí)別,但像同款女裝識(shí)別還比較困難,受材質(zhì)、穿著者身材影響,沒(méi)法直接商品化應(yīng)用。騰訊有自己的視頻服務(wù),有自建團(tuán)隊(duì)做視頻中商品識(shí)別、廣告關(guān)聯(lián),從頭吃到尾。百度有無(wú)人駕駛、云平臺(tái)、圖像搜索等。
  眾多可商業(yè)化應(yīng)用中,“視頻內(nèi)容關(guān)聯(lián)廣告”是中國(guó)獨(dú)創(chuàng)于世界的特色市場(chǎng)。這塊技術(shù)比YouTube早跑了兩年,不同于YouTube一家獨(dú)大,中國(guó)至少有十家企業(yè)競(jìng)爭(zhēng),都是賠錢在搶市場(chǎng)。阿里和優(yōu)酷、騰訊、愛(ài)奇藝、搜狐等視頻大佬,都開始鉆研基于視頻內(nèi)容識(shí)別的關(guān)聯(lián)廣告,即邊看邊購(gòu)物體驗(yàn)。
  現(xiàn)在看視頻時(shí)接觸的各類明星同款商品推送,已經(jīng)是深淺不一的機(jī)器視覺(jué)技術(shù)。觀賞綜藝節(jié)目時(shí),隱藏在屏幕背后的機(jī)器腦“看到”你喜愛(ài)的明星和商品,在網(wǎng)絡(luò)海洋中幫你挖出他的八卦,同款鞋子、手機(jī)。這就是智能化的視頻內(nèi)容辨識(shí),用機(jī)器取代人眼、人腦,識(shí)別甚至肉眼無(wú)法認(rèn)知的物件紋路、形狀、商標(biāo),用大數(shù)據(jù)技術(shù)做到更相關(guān)的商品、知識(shí)信息匹配推送。雖然各公司還在摸著石頭過(guò)河,但這塊應(yīng)用做好則用戶與商家皆大歡喜。
  機(jī)器視覺(jué)的未來(lái)
  計(jì)算機(jī)視覺(jué)的未來(lái)何去何從?這塊領(lǐng)域的大佬、加州伯克利大學(xué)的Jitendra Malik教授,十年前就斗膽預(yù)測(cè)了未來(lái)十年計(jì)算機(jī)視覺(jué)的重要發(fā)展,如今驗(yàn)證了他的大部分預(yù)測(cè)都是對(duì)的。在今年的ICCV大會(huì)上,Malik教授又做了十大方向的預(yù)測(cè),結(jié)合場(chǎng)景的語(yǔ)義分析就是其中重要一塊。未來(lái)物件識(shí)別還會(huì)持續(xù)推進(jìn),朝畫面中所帶訊息、不同場(chǎng)景下的情感和意義的識(shí)別發(fā)展。也許未來(lái),機(jī)器視覺(jué)就成讀心專家,準(zhǔn)備好迎接這位朋友了嗎?
 

轉(zhuǎn)載請(qǐng)注明出處。

機(jī)器人機(jī)器視覺(jué)
免責(zé)聲明

① 凡本網(wǎng)未注明其他出處的作品,版權(quán)均屬于激光制造網(wǎng),未經(jīng)本網(wǎng)授權(quán)不得轉(zhuǎn)載、摘編或利用其它方式使用。獲本網(wǎng)授權(quán)使用作品的,應(yīng)在授權(quán)范圍內(nèi)使 用,并注明"來(lái)源:激光制造網(wǎng)”。違反上述聲明者,本網(wǎng)將追究其相關(guān)責(zé)任。
② 凡本網(wǎng)注明其他來(lái)源的作品及圖片,均轉(zhuǎn)載自其它媒體,轉(zhuǎn)載目的在于傳遞更多信息,并不代表本媒贊同其觀點(diǎn)和對(duì)其真實(shí)性負(fù)責(zé),版權(quán)歸原作者所有,如有侵權(quán)請(qǐng)聯(lián)系我們刪除。
③ 任何單位或個(gè)人認(rèn)為本網(wǎng)內(nèi)容可能涉嫌侵犯其合法權(quán)益,請(qǐng)及時(shí)向本網(wǎng)提出書面權(quán)利通知,并提供身份證明、權(quán)屬證明、具體鏈接(URL)及詳細(xì)侵權(quán)情況證明。本網(wǎng)在收到上述法律文件后,將會(huì)依法盡快移除相關(guān)涉嫌侵權(quán)的內(nèi)容。

網(wǎng)友點(diǎn)評(píng)
0相關(guān)評(píng)論
精彩導(dǎo)讀