應(yīng)用

技術(shù)

物聯(lián)網(wǎng)世界 >> 物聯(lián)網(wǎng)新聞 >> 物聯(lián)網(wǎng)熱點(diǎn)新聞
企業(yè)注冊(cè)個(gè)人注冊(cè)登錄

巨頭紛紛押注的智能翻譯機(jī),會(huì)是第一款成功的消費(fèi)級(jí)AI硬件嗎?

2018-01-30 14:23 億歐

導(dǎo)讀:智能音箱留給我們最大的反思大概就是,寧愿在泥土中多蟄伏一會(huì)兒,也不要開出畸形的花。如今智能翻譯機(jī)已經(jīng)開始破土而出,愿它能結(jié)下AI消費(fèi)硬件的第一枚果實(shí)。

a_副本.jpg

圖片來自“123rf.com.cn”

  到了今天,已經(jīng)很少有人再提人工智能音箱了。使用率低、售價(jià)跳水、缺乏銷售數(shù)據(jù)……我們不能武斷地說智能音箱涼了,但的確不少所謂的AI企業(yè)的硬件夢(mèng)碎了。

  相對(duì)于一些盲目涌入AI的公司,一些科技公司似乎找到了另外一條硬件路——翻譯機(jī)??拼笥嶏w推出了曉譯翻譯機(jī)、谷歌推出了實(shí)時(shí)翻譯耳機(jī),搜狗也在最近推出了搜狗旅行翻譯寶和搜狗速記翻譯筆。

  開始呈現(xiàn)扎堆趨勢(shì)的智能翻譯機(jī),是否會(huì)顛覆智能音箱成為下一個(gè)AI硬件浪潮?

  打敗大魔王,AI消費(fèi)級(jí)硬件當(dāng)務(wù)之急是走出手機(jī)的陰影

  我們可以先從智能音箱的前車之鑒來看,智能翻譯機(jī)最該避開哪些坑。

  除了產(chǎn)品質(zhì)量良莠不齊等等弊端之外,智能音箱最大的問題是沒有一項(xiàng)功能超出手機(jī)功能的子集。播放音樂、語音交互、傳達(dá)命令,這些功能其實(shí)都能在手機(jī)上很好的完成,讓智能音箱的使用率不斷被壓榨。

b_副本.png

  其實(shí)不光是智能音箱,現(xiàn)在開始搭載移動(dòng)AI芯片的手機(jī)簡直是AI消費(fèi)級(jí)硬件界的大魔王,讓很多產(chǎn)品毫無用武之地。智能翻譯機(jī)也是一樣,翻譯App已經(jīng)能滿足大部分的消費(fèi)級(jí)翻譯需求,翻譯機(jī)一方面要趕上翻譯App文字、圖片多種媒介適用的特點(diǎn),另一方面還要保證離線使用、操作簡單和續(xù)航時(shí)間長,從而獲得與手機(jī)之間的差異化優(yōu)勢(shì)。這很可能會(huì)成為讓智能翻譯機(jī)不會(huì)重蹈智能音箱覆轍的重要優(yōu)勢(shì)。

  三次迭代,什么才是智能翻譯機(jī)的最終形態(tài)?

  其實(shí)這是一個(gè)最淺顯道理,智能翻譯機(jī)的產(chǎn)品迭代的方向也一直朝著替代和超越翻譯App發(fā)展。

  第一代智能翻譯機(jī)應(yīng)該是以科大訊飛的曉譯為代表,主打隨說隨譯。這一代產(chǎn)品其實(shí)是最為尷尬的:雖然有強(qiáng)大的自然語言處理技術(shù),可以較為準(zhǔn)確的進(jìn)行翻譯工作,但很多功能還需連接手機(jī)借助網(wǎng)絡(luò)才能使用。

c_副本.png

  這類作為手機(jī)外置產(chǎn)品的翻譯機(jī)和手機(jī)中的翻譯App比起來幾乎毫無競爭力,除了曉譯之外,同類產(chǎn)品還有有道翻譯蛋、全球譯等等。雖然到后來第一代智能翻譯機(jī)都增加了離線語言的種類,但比起App的拍照翻譯等功能,還是差了一截。

  谷歌推出的實(shí)時(shí)翻譯耳機(jī)Pixel Buds可以被看做第二代智能翻譯機(jī),這類翻譯機(jī)常常以耳機(jī)的形態(tài)出現(xiàn),有些需要WiFi/藍(lán)牙與手機(jī)連接。同類產(chǎn)品還有IBM Watson和Lingmo推出的Translate One2One。實(shí)時(shí)翻譯耳機(jī)相比單純的翻譯機(jī)有著更豐富的功能,除了用作翻譯還可以當(dāng)成藍(lán)牙耳機(jī)使用,并且翻譯速度更快,在雙方都配置耳機(jī)時(shí)可以很好的進(jìn)行拾音和語音生成,方便交流。但大多數(shù)翻譯耳機(jī)還是作為手機(jī)外設(shè)存在,自身并不具備真正的翻譯功能,甚至谷歌的Pixel Buds只能配適谷歌Pixel手機(jī)。

  而搜狗推出的搜狗旅行翻譯寶,可以說是第三代智能翻譯機(jī)了。除了提高翻譯速度和準(zhǔn)確率外,還加入了OCR技術(shù),讓用戶可以進(jìn)行實(shí)景翻譯,并且擺脫了翻譯APP對(duì)網(wǎng)絡(luò)連接的依賴。

  高準(zhǔn)入門檻和優(yōu)質(zhì)的參與者,或許才是智能翻譯機(jī)的王牌

  智能翻譯機(jī)不會(huì)成為智能音箱的另一個(gè)原因,就是這一行業(yè)較高的準(zhǔn)入門檻。

  和智能音箱簡單的接收語音信號(hào)、下達(dá)指令不同,智能翻譯機(jī)的實(shí)時(shí)離線翻譯對(duì)機(jī)器翻譯、語音識(shí)別、圖像識(shí)別、語音生成甚至知識(shí)圖譜技術(shù)都有很高的要求。

  就拿在海外餐館點(diǎn)菜使用搜狗旅行翻譯寶這一簡單的場(chǎng)景來說,就需要拍下照片進(jìn)行圖像識(shí)別,找到其中的文字并翻譯成中文,和他人對(duì)話時(shí),智能翻譯機(jī)需要通過定向波束掃描規(guī)避噪音,準(zhǔn)確拾音并進(jìn)行翻譯。在翻譯過程中,還需要擁有相關(guān)領(lǐng)域的知識(shí)圖譜,才能準(zhǔn)確的捕捉到俚語、術(shù)語、雙關(guān)語等等人類專屬的文字游戲。而想要這一切都在離線狀態(tài)下進(jìn)行,還需要強(qiáng)大的壓縮技術(shù),讓模型得以存儲(chǔ)終端中。

  所以在智能翻譯機(jī)領(lǐng)域很難見到類似智能音箱的盛況:各種相關(guān)的和不相關(guān)的企業(yè)都來趕風(fēng)口。目前智能翻譯機(jī)領(lǐng)域的參與者,基本有三類。

  第一類是專業(yè)從事AI技術(shù)開發(fā)的企業(yè),如科大訊飛和IBM Waston。第二類是擁有巨大用戶規(guī)模,通過自身產(chǎn)品,像輸入法、搜索等業(yè)務(wù)在知識(shí)圖譜和語音技術(shù)上建起壁壘的企業(yè),比如搜狗、谷歌。第三類,是一些垂直研發(fā)翻譯產(chǎn)品的企業(yè),像有道云、全球譯等等。較高的準(zhǔn)入門檻對(duì)智能翻譯機(jī)形成了一種保護(hù),競爭對(duì)手都各有優(yōu)勢(shì),不至于出品太過劣質(zhì)的產(chǎn)品讓市場(chǎng)對(duì)整個(gè)品類失望。

  智能音箱留給我們最大的反思大概就是,寧愿在泥土中多蟄伏一會(huì)兒,也不要開出畸形的花。如今智能翻譯機(jī)已經(jīng)開始破土而出,愿它能結(jié)下AI消費(fèi)硬件的第一枚果實(shí)。