閱讀 | 訂閱
閱讀 | 訂閱
電子加工新聞

語音識(shí)別是移動(dòng)互聯(lián)網(wǎng)的下個(gè)突破亮點(diǎn)

激光制造網(wǎng) 來源:鈦媒體2013-09-10 我要評(píng)論(0 )   

這幾天,可穿戴設(shè)備突然一下熱起來了,國內(nèi)廠商一口氣發(fā)布了好幾款智能手表,有映趣科技的inWatch,土曼科技的TWatch、盛大果殼電子的GeakWatch等,當(dāng)然,最重頭的還是...

       這幾天,可穿戴設(shè)備突然一下熱起來了,國內(nèi)廠商一口氣發(fā)布了好幾款智能手表,有映趣科技的inWatch,土曼科技的TWatch、盛大果殼電子的GeakWatch等,當(dāng)然,最重頭的還是三星在德國舉行的發(fā)布會(huì)上,發(fā)布了智能手表Galexy Gear。

      智能手表不是新發(fā)明的,有很多早就在市面上流行的產(chǎn)品,如索尼的SmatWatch等,就連做芯片的高通也發(fā)布了一款智能手表。大家早就看出,這里面是有前景的,是未來的一大趨勢(shì),只是如果巨頭不出手,這個(gè)市場(chǎng)就很難被激活。

       智能手表到底是用來做什么的?在當(dāng)前技術(shù)條件下,還只能發(fā)短信,拍個(gè)照,記錄筆記,充當(dāng)健身輔助設(shè)備,在手機(jī)的支持下實(shí)現(xiàn)通話等,或許未來還可以在NFC的支持下完成近場(chǎng)支付等功能。智能手表的未來,一定不是滿足用戶的娛樂需求,而是著眼于普通人日常生活領(lǐng)域的諸多實(shí)際需求,這是由其自身特點(diǎn)所決定的。但我更關(guān)心的是,智能手表靠什么輸入文字,傳送信息。

       智能手表屏幕較小,使用額外的S-pen一類的輔助工具也并不現(xiàn)實(shí),在當(dāng)前條件下看,唯有依靠語音輸入了。語音輸入看上去是個(gè)不大的基礎(chǔ)應(yīng)用,實(shí)現(xiàn)起來卻需要非常復(fù)雜的技術(shù)能力,已經(jīng)涉及到人工智能AI的范疇,而且這個(gè)技術(shù)已經(jīng)進(jìn)化了幾十年,似乎還沒得以大規(guī)模商用,可見其開發(fā)難度。

        13年前我曾買過一張IBM的Viavoice光盤,裝到電腦上后對(duì)著電腦練了一下午,希望其能快速熟悉我的個(gè)人口音,哪怕能有90%的識(shí)別率,也能為我繁重的文案工作減輕不少負(fù)擔(dān)。這次試驗(yàn)最終還是失敗了,卻并不令人沮喪,至少領(lǐng)略了世界前沿的語音識(shí)別技術(shù),理解到識(shí)別自然語言對(duì)于計(jì)算機(jī)而言有多么難了。在當(dāng)時(shí),Viavoice是世界最尖端的語音識(shí)別技術(shù)。

        Gear中內(nèi)置了三星自己的S-Voice,另外也和百度合作,將百度語音助手預(yù)裝了進(jìn)去??磥戆俣扰c三星的關(guān)系相當(dāng)不一般,前有百度云,后有語音助手,對(duì)看重安卓更甚iOS的百度,支持力度相當(dāng)大。不過,還是有理由相信,百度語音助手的技術(shù)實(shí)力已達(dá)到三星所期望的程度,預(yù)裝其語音產(chǎn)品,可以給智能手表帶來更好的用戶體驗(yàn)。語音有可能是智能手表的唯一輸入方式,在這方面無法做到準(zhǔn)確,易用,快捷,是很難讓用戶買單的,會(huì)成為其發(fā)展瓶頸。


       在周日的下午下載了百度語音助手,進(jìn)行了一番測(cè)試。我發(fā)現(xiàn),普通話方面的語音識(shí)別準(zhǔn)確率,已經(jīng)到了令人驚喜的地步。除了一些停頓和轉(zhuǎn)折,機(jī)器在識(shí)別上仍有一定困難外,基礎(chǔ)字詞很少會(huì)出現(xiàn)錯(cuò)誤,只要對(duì)自己的普通話有一定自信,基本都能做到99%以上的識(shí)別率。

       之后我還對(duì)百度語音助手進(jìn)行了上海話和英文的測(cè)試,發(fā)現(xiàn)效果并不理想,用上海話說了一串上海市井小吃的名字,基本無法識(shí)別,但在將上海的區(qū)縣名稱挨個(gè)念出來后,發(fā)現(xiàn)還是有一定的識(shí)別率。至于英文,則是基本無法識(shí)別??磥恚@一版語音助手,仍是以普通話識(shí)別為基礎(chǔ)的,還沒有考慮到更多需求。


        我不知道這是否代表中文普通話語音識(shí)別的最高水平了,其他一些語音識(shí)別工具,如搜狗和科大訊飛等產(chǎn)品,是不是也能做到差不多的識(shí)別效果。這一次的測(cè)試,與13年前的那次從感覺上完全不一樣。Viavoice是一種學(xué)習(xí)型的語音識(shí)別軟件,你需要適時(shí)地對(duì)識(shí)別結(jié)果進(jìn)行調(diào)整,以方便機(jī)器下一次識(shí)別,積累下來的識(shí)別數(shù)據(jù)要妥善保護(hù),要是因?yàn)橐淮沃匮b系統(tǒng)而導(dǎo)致丟失的話,一切都得重來。從商用角度來看,這還做不到多好的商用體驗(yàn),而如今的語音識(shí)別技術(shù),從體驗(yàn)上明顯已能讓人看到曙光。

       甚至可以認(rèn)為,只有在語音識(shí)別技術(shù)取得革命性突破之后,可穿戴設(shè)備真正的爆發(fā)之日才會(huì)到來。設(shè)想你可以與智能手表和眼鏡實(shí)現(xiàn)人機(jī)對(duì)話,戴著眼鏡時(shí)不必再傻傻地說句OK
 

      Glass才能開啟攝像,只需用生活中最自然的語言即可完成指令發(fā)送,之后再由機(jī)器將任務(wù)完成情況用語音反饋給你,到那時(shí),屏幕的作用將弱化,移動(dòng)互聯(lián)網(wǎng)的新入口將誕生。

       過去一年,百度在硅谷建立了IDL實(shí)驗(yàn)室,進(jìn)行深度學(xué)習(xí)方面的研究,在利用軟硬件模擬人腦方面試圖獲得更多成果。而這些工作,在過去印象中總是由IBM,貝爾實(shí)驗(yàn)室等大機(jī)構(gòu)所做的,出了能商用的成果,大家去買授權(quán)好了,像百度這樣的廣告公司也來搞這個(gè),著實(shí)令人感慨萬分。

       不過,這些耗費(fèi)甚巨卻見不到短期產(chǎn)出的基礎(chǔ)研究項(xiàng)目,使得百度在語音識(shí)別技術(shù)方面有了相當(dāng)不錯(cuò)的進(jìn)步,還沒有達(dá)到商用化的地步,最起碼也已可以進(jìn)行積極布局,積累用戶了。

       未來隨著手持設(shè)備的小型化,甚至穿戴化,各種智能眼鏡,手表等層出不窮,誰能在語音輸入方面取得領(lǐng)先優(yōu)勢(shì),誰就能掌握了用戶的一個(gè)基礎(chǔ)需求,誰也就能在這個(gè)由鼠標(biāo)鍵盤、觸屏和語音所組成的互聯(lián)網(wǎng)世界里,占據(jù)一個(gè)重要入口。

 

轉(zhuǎn)載請(qǐng)注明出處。

暫無關(guān)鍵詞
免責(zé)聲明

① 凡本網(wǎng)未注明其他出處的作品,版權(quán)均屬于激光制造網(wǎng),未經(jīng)本網(wǎng)授權(quán)不得轉(zhuǎn)載、摘編或利用其它方式使用。獲本網(wǎng)授權(quán)使用作品的,應(yīng)在授權(quán)范圍內(nèi)使 用,并注明"來源:激光制造網(wǎng)”。違反上述聲明者,本網(wǎng)將追究其相關(guān)責(zé)任。
② 凡本網(wǎng)注明其他來源的作品及圖片,均轉(zhuǎn)載自其它媒體,轉(zhuǎn)載目的在于傳遞更多信息,并不代表本媒贊同其觀點(diǎn)和對(duì)其真實(shí)性負(fù)責(zé),版權(quán)歸原作者所有,如有侵權(quán)請(qǐng)聯(lián)系我們刪除。
③ 任何單位或個(gè)人認(rèn)為本網(wǎng)內(nèi)容可能涉嫌侵犯其合法權(quán)益,請(qǐng)及時(shí)向本網(wǎng)提出書面權(quán)利通知,并提供身份證明、權(quán)屬證明、具體鏈接(URL)及詳細(xì)侵權(quán)情況證明。本網(wǎng)在收到上述法律文件后,將會(huì)依法盡快移除相關(guān)涉嫌侵權(quán)的內(nèi)容。

網(wǎng)友點(diǎn)評(píng)
0相關(guān)評(píng)論
精彩導(dǎo)讀