技術(shù)
導(dǎo)讀:VoiceAI主要研究技術(shù)即是聲紋識(shí)別。聲紋識(shí)別賽道作為一個(gè)正在爆發(fā)的藍(lán)海市場(chǎng),涌現(xiàn)出了不少玩家,業(yè)內(nèi)人士預(yù)測(cè),聲紋識(shí)別是指紋和人臉之后的下一個(gè)生物識(shí)別技術(shù)。
36氪2019年2月18日?qǐng)?bào)道,聲揚(yáng)科技VoiceAI已完成千萬級(jí)Pre-A輪融資。VoiceAI主要研究技術(shù)即是聲紋識(shí)別。聲紋識(shí)別賽道作為一個(gè)正在爆發(fā)的藍(lán)海市場(chǎng),涌現(xiàn)出了不少玩家,業(yè)內(nèi)人士預(yù)測(cè),聲紋識(shí)別是指紋和人臉之后的下一個(gè)生物識(shí)別技術(shù)。
聲紋識(shí)別應(yīng)用廣泛 抑或是下一風(fēng)口
關(guān)于聲紋識(shí)別,簡(jiǎn)而言之,是將聲信號(hào)轉(zhuǎn)換成電信號(hào),再用計(jì)算機(jī)進(jìn)行識(shí)別的技術(shù)。聲紋識(shí)別作為重要的辨認(rèn)技術(shù),廣泛應(yīng)用于金融、交通、醫(yī)療、教育、旅游等公共服務(wù)領(lǐng)域認(rèn)證服務(wù)。不過,聲紋識(shí)別更大的應(yīng)用前景在于安防領(lǐng)域,比如刑偵破案、門禁、銀行交易等等。此外,在智能家居等領(lǐng)域,為了安全,也為了更好的智能體驗(yàn),比如在人聲鼎沸情境中準(zhǔn)確識(shí)別哪句話是主人下達(dá)的命令等,有人認(rèn)為它將會(huì)成為智能家居未來發(fā)展的關(guān)鍵,抑或是語音交互的下一個(gè)風(fēng)口。從其發(fā)展前景而言,聲紋識(shí)別的市場(chǎng)潛力巨大,前景可觀。
如今,在聲紋識(shí)別需求日益增長(zhǎng)的情況下,投身于聲紋識(shí)別的企業(yè)開始崛起,部分并已取得了不錯(cuò)的成果。比如國(guó)外的Nuance、VoiceVault、Voice Biometrics、PhoneFactor,或是國(guó)內(nèi)的科大訊飛、中科信利、廈門天聰、上海電虹等。
人們何以看重聲紋識(shí)別?
人工智能主要有三個(gè)研究方向:視覺識(shí)別、智能語音、自然語言處理NLP。其中,在語音識(shí)別領(lǐng)域,聲紋識(shí)別屬于相對(duì)藍(lán)海市場(chǎng),解決的主要是“我是我”的問題,多應(yīng)用在安全驗(yàn)證場(chǎng)景。在語音轉(zhuǎn)文字賽道,各家的效果可能趨于0.1%、0.2%的差距,為了避免同質(zhì)化競(jìng)爭(zhēng),許多公司選擇從“聲紋識(shí)別”切入。
聲紋識(shí)別相對(duì)于其他生物識(shí)別最大的優(yōu)勢(shì)主要體現(xiàn)在以下幾點(diǎn): 一是非接觸式識(shí)別,相對(duì)于指紋識(shí)別而言,它更加便捷;二是降低侵犯隱私風(fēng)險(xiǎn),相對(duì)于人臉識(shí)別而言,社會(huì)大眾對(duì)于聲紋識(shí)別的抵觸大大降低,隨便采集到的一段話便可以進(jìn)行聲紋識(shí)別;三是獲取語音的識(shí)別成本低,相對(duì)于人臉識(shí)別、指紋識(shí)別等,聲紋識(shí)別只要求麥克風(fēng)便可以進(jìn)行采集。
從近幾年情形可以看出,相比于指紋識(shí)別、人臉識(shí)別等生物識(shí)別技術(shù),聲紋識(shí)別是“低調(diào)”的,但市場(chǎng)需求的確存在,且市場(chǎng)熱度也有上升趨勢(shì)。
聲紋識(shí)別難以成為“獨(dú)行俠”
盡管前景可觀,但就目前而言,聲紋識(shí)別要想真正成熟并落地,還需要克服一些難題。與其他類型識(shí)別一樣,聲紋識(shí)別訓(xùn)練也需要龐大的數(shù)據(jù)積累及對(duì)數(shù)據(jù)的精確標(biāo)注,并且難上加難:聲紋識(shí)別訓(xùn)練庫的建立,至少要保證性別比例分布為50%±5%,包含有不同年齡段、不同地域、不同口音、不同職業(yè)。同時(shí),測(cè)試樣本應(yīng)該涵蓋文本內(nèi)容是否相關(guān)、采集設(shè)備、傳輸信道、環(huán)境噪音、錄音回放、聲音模仿、時(shí)間跨度、采樣時(shí)長(zhǎng)、健康狀況和情感因素等影響聲紋識(shí)別性能的主要因素。
因此嚴(yán)格說來,聲紋識(shí)別當(dāng)“獨(dú)行俠”的機(jī)會(huì)微乎其微。只有在智能家居等相對(duì)局限的場(chǎng)景中才能夠獨(dú)立提供服務(wù)。在更多場(chǎng)景下,則是通過與人臉、語音等其他識(shí)別技術(shù)配合,進(jìn)行身份確認(rèn)。
聲紋識(shí)別對(duì)數(shù)據(jù)的要求其實(shí)比語音識(shí)別還要高很多,這條路會(huì)很難。但慶幸的是,我國(guó)目前也有許多AI初創(chuàng)公司在堅(jiān)持做拓荒者。用SpeakIn的COO易鵬宇所說,“這不正是創(chuàng)業(yè)者需要做的事嗎?”
(本文據(jù)36氪、新智元、中國(guó)智能制造網(wǎng)、雷鋒網(wǎng)、安防知識(shí)網(wǎng)、鎂客網(wǎng)、信息整理,中國(guó)安防展覽網(wǎng)編輯)