導(dǎo)語:目前,有研究人員正在設(shè)計讓機器人難以抓取的對抗性物體,以訓(xùn)練機器人的抓取能力。
智東西7月10日消息,近日,加州大學(xué)伯克利分校(University of California, Berkeley)的研究人員正在設(shè)計一些機器人難以操控的物體,以提高計算機視覺算法處理對抗圖像的性能,加強機器人抓取物體的能力。
一、對抗圖像能提高計算機視覺算法能力
近幾年來,許多研究人員對對抗圖像進行了大量研究,這些圖片被進行了微妙的修改,讓計算機視覺算法都難以準(zhǔn)確地識別出正確圖像。
例如,谷歌大腦(Google Brain)的研究人員曾通過開發(fā)一種讓計算機和人類都難以判斷的對抗圖像,以確認(rèn)這項能夠欺騙人工神經(jīng)網(wǎng)絡(luò)的技術(shù),是否也能欺騙人們大腦內(nèi)部的生物神經(jīng)網(wǎng)絡(luò)。
這些研究人員的目的,主要是想利用這些對抗圖像來幫助他們設(shè)計更加強大的計算機視覺算法。
因為“對抗性”的本質(zhì)是一種人為的惡劣條件,如果計算機算法能夠處理這些對抗圖像,就意味著這些算法能夠處理其他大多數(shù)棘手的事情。
二、如何設(shè)計異形立方體
最近,加州大學(xué)伯克利分校的研究人員,將對抗圖像訓(xùn)練計算機視覺算法的這一概念擴展到了機器人的抓取能力中。
研究人員將簡單而普通的三維形狀進行微調(diào),令傳統(tǒng)機器人用兩個手指都難以牢固抓取。
這些對抗物體的關(guān)鍵點在于,它們只是看起來容易抓,但對于兩指(平行顎)抓取工具來說,卻很難抓取。
被調(diào)整后的對抗物體與它們的實際幾何形狀之間的區(qū)別是很微妙的。
例如,研究人員將一個正方體的三個平面都設(shè)計成一個淺金字塔形狀,其中最小的金字塔只有10度的斜率,并且每個金字塔對面的一側(cè)使一個規(guī)則的平面。
這樣的設(shè)計導(dǎo)致該正方體上沒有直接相對的平面,如果機器人的兩指抓取工具試圖夾住傾斜的表面,那么機器人施加的力會導(dǎo)致物體扭曲并滑落,從而抓取失敗。
隨著立方體形狀的復(fù)雜性增加,研究人員開發(fā)對抗性版本的過程也變得越來越困難。
研究人員針對立方八面體(有八個三角形面和六個正方形面的多邊形),在模擬設(shè)計中隨機調(diào)整該立方體的頂點,使它得到一個沒有直接相對表面的頂點。
對于更復(fù)雜的形狀,如相交的圓柱體,研究人員則使用深度學(xué)習(xí)算法來生成對抗性的例子。
三、系統(tǒng)預(yù)測抓取成功率100%,實際僅為13%
研究人員進行這項研究的目的不僅僅是為了挫敗機器人糟糕的抓取算法,而是為了開發(fā)工具,幫助機器人提高抓取物體的能力,并希望它們能可靠地在現(xiàn)實世界中工作。
機器人系統(tǒng)在規(guī)劃抓取方式時,通常會尋找光滑的相對平面,這些表面對它來說是容易捏合的。
但由于研究人員設(shè)計的對抗立方體和真實立方體之間的差異很小,難以被3D傳感器捕捉到,因此大多數(shù)機器人系統(tǒng)會將抓取任務(wù)判斷得很容易,結(jié)果卻以立方體扭曲并脫離機器人的控制而失敗。
當(dāng)研究人員在真實世界中進行初步測試時,會嘗試用兩個部件套在手指形成的兩邊平行的夾鉗去夾取這個“對抗性”物體。
在每一種測試情況中,機器人系統(tǒng)在計算抓取成功率時都預(yù)測會100%成功,然而對抗立方體和立方十面體的實際成功率僅為13%。
研究人員表示,他們將計劃用不同類型的抓取工具和吸力抓具來測試這些物體,試圖找到最具對抗性的對抗物體。
結(jié)語:嘗試提高機器人更好服務(wù)人類的能力
加州大學(xué)伯克利分校的研究人員利用對抗物體,來幫助計算機視覺算法提高性能的這項研究雖然還未成熟,但也為研究人員進一步加強機器人抓取能力的方式提供了有意義的參考。
在未來,如果機器人能真正完美解決對抗物體的抓取問題,也許能更好地應(yīng)用到人們的社會生活和生產(chǎn)的真正實踐中,給人們帶來更多的便利。
轉(zhuǎn)載請注明出處。