從《星球大戰(zhàn)》、《星級穿越》再到《超能陸戰(zhàn)隊》,人們已經(jīng)對各種各樣的機(jī)器人產(chǎn)生了濃厚的興趣。本網(wǎng)站已經(jīng)報道過不少關(guān)于機(jī)器人的新聞,比如主打家庭場景的 Rokid。而近日,Rokid 也在一次活動中亮相。
據(jù)了解,Rokid 的名字由來是這樣的:Rokid=“Robot”+“Kid”,意為產(chǎn)品本身具有生命感會成長學(xué)習(xí)。外觀上,Rokid 使用了高曲率的非球面殼體作為顯像界面,其中間是全向型陣列的 8 顆數(shù)字麥克風(fēng),下方為一個鋁合金箱體全向型音箱,最上方是它的 1200 萬像素的攝像頭。
在 Rokid 的殼體內(nèi)部隱藏一個 WVGA 級別的 DLP 投影機(jī)與全色域 LED 陣列組合。結(jié)合可以深度學(xué)習(xí)的自然語音、準(zhǔn) 3D 的 UI、燈光和音效來實(shí)現(xiàn)交互試聽。
就像之前報道中提到的,Rokid 有多項識別技術(shù):聲紋識別、人臉識別、手勢識別、動作識別、遠(yuǎn)場語音識別、聲音尋向以及 ACE 自身音源消除等。語音交互尤其是機(jī)器人體驗(yàn)中最重要的一環(huán),在問及為何不與第三方語音語言技術(shù)方案商合作時,其 CEO Dan 對動點(diǎn)科技表示語音庫的很多數(shù)據(jù)都是消噪的,而在正常的家庭使用場景中,機(jī)器人接收的語音信息都是夾帶周邊噪音、語氣的。
“我們希望從最底層開始收集正常家庭場景的語音數(shù)據(jù),跟用戶的交流增多的同時,也有利于 Rokid 的成長中帶有用戶自己的個性。”據(jù)介紹,基于聲紋和圖像識別,Rokid 會分辨家里的每一個成員,根據(jù)不同的人來進(jìn)行個性化的服務(wù)。
在現(xiàn)場,記者試了一下通過 Rokid 來開啟掃地機(jī)器人、拉窗簾等家庭應(yīng)用場景,體驗(yàn)還是不錯的。而這些應(yīng)用也會通過其底層通信協(xié)議與開發(fā)者合作來實(shí)現(xiàn)。另外在家庭娛樂功能上,Rokid 已經(jīng)接入蝦米音樂、墨跡天氣等數(shù)據(jù),未來還會在兒童教育等方面有所拓展。
在硬件系統(tǒng)上,Rokid 使用了 8 核 CPU 及多核協(xié)處理器支撐所有的高速運(yùn)算,硬件接口的可擴(kuò)展性可便于開發(fā)者使用。需要補(bǔ)充的是,Rokid 還提供了一個可進(jìn)行二次開發(fā)的圖形化工具,以便降低在這個平臺上進(jìn)行二次開發(fā)的門檻。
在體驗(yàn)的過程中,“Hey 若琪,幫我…”的指令來實(shí)現(xiàn)與 Rokid 的交流,不過可能是當(dāng)時 WiFi 環(huán)境的緣故,Rokid 起初并未很好地識別出語音指令。不過這也語言語音指令也是一個不斷積累的過程。Dan 表示目前的 Rokid 形態(tài)是一個初步亮相,在正式發(fā)布時還會在多方面進(jìn)行改進(jìn)優(yōu)化。不過 Rokid 不是可移動的,Dan 認(rèn)為家庭機(jī)器人是不應(yīng)該動的,更多的層面應(yīng)該是提供個性化的場景解決方案。
對于價格方面,由于此次不是正式發(fā)布,對方?jīng)]有公布。
其實(shí),目前很多機(jī)器人的場景體系大都不是非常完善,而要實(shí)現(xiàn)自由對話相信也是整個行業(yè)的一個需要不斷努力和突破的課題吧,最后我想用一段與 Rokid 有意思的對話作為結(jié)尾。
“Hey 若琪,我們結(jié)婚吧。”
“我是機(jī)器人,你這個禽獸。”