應(yīng)用

技術(shù)

物聯(lián)網(wǎng)世界 >> 物聯(lián)網(wǎng)新聞 >> 物聯(lián)網(wǎng)熱點(diǎn)新聞
企業(yè)注冊個人注冊登錄

AI同傳PK人類同傳,這或許是兩個職業(yè)

2018-04-16 09:28 智能相對

導(dǎo)讀:然而,就目前來看,AI同傳前路未明,太早將其與人類同傳對立起來實(shí)在是“杞人憂天”。除了取代,AI同傳其實(shí)有更好的路。

  人工智能又又又摔了個跟頭。

  今年的博鰲亞洲論壇上,第一次出現(xiàn)了AI同傳。值得注意的是,這是博鰲論壇創(chuàng)辦17年首次采用人工智能同傳技術(shù)。然而,在如此重要的場合,現(xiàn)場配備的騰訊AI同傳卻掉了鏈子。詞匯翻譯不準(zhǔn)確、重復(fù)、短語誤用等“烏龍”引來各方“嘲笑”。

  人們總是把AI跟人類職位對立起來,各種“取代論”層出不窮。博鰲論壇會議前,就出現(xiàn)了許許多多的“取代論新聞”引起了各界關(guān)注。最終,AI同傳“翻車”,引來外界一片唏噓。

  然而,就目前來看,AI同傳前路未明,太早將其與人類同傳對立起來實(shí)在是“杞人憂天”。除了取代,AI同傳其實(shí)有更好的路。

微信圖片_20180416092942.jpg

  圖為AI同傳內(nèi)容

  AI同傳進(jìn)階之路:變智能問題為數(shù)據(jù)問題

  很多人都覺得人工智能如果要處理自然語言,就必須理解自然語言。實(shí)質(zhì)上,AI翻譯靠的是數(shù)字,更準(zhǔn)確地來說,是統(tǒng)計。AI同傳出錯,并不是“智能”不夠,實(shí)質(zhì)上,是數(shù)據(jù)和模型出了問題。

  1.AI同傳還需要理解力

  首先,AI同傳要去理解場景。在博鰲論壇上,會議現(xiàn)場專業(yè)度高、覆蓋度廣,AI對特殊場景的理解還不夠。場景對于語義具有至關(guān)重要的影響,相同的一句話在不同的場景里有不同的意思。舉個例子,“好 ”這個字在百度漢語顯示有多種語義,既可以表示稱贊,也可以表示狀態(tài),還可以表達(dá)問好……諸如此類,語義的表達(dá)和理解都要結(jié)合具體的場景。在具體的句子中,這種語義與情景的結(jié)合就更為緊密,更需要機(jī)器理解學(xué)習(xí)。

  其次,AI要理解口語的模糊邏輯。口語翻譯是不會百分百傳譯的,根據(jù) AIIC(國際會議口譯員協(xié)會)的規(guī)定,同傳譯員只要翻譯出演講者內(nèi)容的80%就已經(jīng)算是合格了(90 %~100 %的“同傳”幾乎是不可能的)。這意味著AI工作量減少嗎?當(dāng)然不,正是這種模糊的東西使得AI同傳更加困難,除此之外,口語沒有標(biāo)點(diǎn)符號來標(biāo)志句子,缺少了必要的聲調(diào)和停頓,就很容易造成句子的歧義。而模糊的指令極有可能出現(xiàn)的是滿屏的錯碼。

  2. 隱馬爾可夫模型(HMM)解決統(tǒng)計數(shù)據(jù)之外的語言問題

  然而,在參考騰訊AI同傳的失誤后,我們發(fā)現(xiàn),僅僅增加數(shù)據(jù)量還是不夠的,在現(xiàn)實(shí)生活中,我們也會遇到零概率或者統(tǒng)計量不足的問題。

  比如一個漢語的語言模型,就足足達(dá)到20萬這個量級。曾有人做過這樣一個假設(shè),如果刨掉互聯(lián)網(wǎng)上的垃圾數(shù)據(jù),互聯(lián)網(wǎng)中將會有100億個有意義的中文網(wǎng)頁,這還是相當(dāng)高估的一個數(shù)據(jù),每個網(wǎng)頁平均1000詞,那么,即使將互聯(lián)網(wǎng)上上所有中文內(nèi)容用作訓(xùn)練,依然只有1013。

  為了解決數(shù)據(jù)量的問題,我們提出了隱馬爾可夫模型(HMM)。實(shí)際應(yīng)用中,我們可以把HMM看作一個黑箱子,這個黑箱子可以利用比較簡潔的數(shù)據(jù),處理后得出:

  1. 每個時刻對應(yīng)的狀態(tài)序列;

  2. 混合分布的均值和方差矩陣;

  3. 混合分布的權(quán)重矩陣;

  4. 狀態(tài)間轉(zhuǎn)移概率矩陣。

  看起來可能比較復(fù)雜,簡單點(diǎn)說,這個模型可以通過可觀察的數(shù)據(jù)而發(fā)現(xiàn)這個數(shù)據(jù)域外的狀態(tài),即隱含狀態(tài)。也就是說,我們可以憑借一句話,來探索出這句話后的隱含的意思,從而解決一些微妙的語義問題。

    如上圖所示,這個模型能夠通過你提供的可以明顯觀察的句子,推斷出一個人隱含的心情狀態(tài)(開心OR難過),并得到最后的行為判斷(宅、購物、社交),即通過已知推斷出未知。

  而如何優(yōu)化這個模型,得到最優(yōu)隱含狀態(tài)?人們提出了許多解決問題的算法, 包括前向算法、Viterbi算法和Baum-Welch算法。此中奧妙,難以盡述。但不能否認(rèn)的是,在深度學(xué)習(xí)的基礎(chǔ)上,數(shù)據(jù)+模型就能很好地打造出一款A(yù)I同傳翻譯,數(shù)據(jù)越大,神經(jīng)網(wǎng)絡(luò)更好。即使翻譯結(jié)果不盡如人意,但只要建設(shè)足夠大的數(shù)據(jù)庫,建立更好的模型,打磨算法,AI同傳很快就會有更大的提升。

  NLP金字塔頂端反哺底端:打造高質(zhì)量AI同傳

  除了增加數(shù)據(jù)庫和打磨數(shù)據(jù)模型,AI同傳還可以從哪些方面提升呢?我們不妨借鑒一下其它的技術(shù)。下圖中,這四個方面代表了人們在 NLP 領(lǐng)域的一些進(jìn)步。用金字塔形來表示這四個技術(shù)之間的關(guān)系,難度是逐級上升的。

  目前,聊天機(jī)器人和閱讀理解這一塊兒已經(jīng)取得了很大的突破。而AI閱讀理解技術(shù)的進(jìn)步不止是NLP的高階進(jìn)化,還有一層意義是,科學(xué)之間是相通的,技術(shù)之間可以互相借鑒,金字塔頂端技術(shù)可以反哺底端。

  在自然語言處理上,人區(qū)別于AI的點(diǎn)在于人有先驗(yàn)知識。即人們在聽到某個字時,會自然地聯(lián)想到后一個字,或者會被一個詞觸發(fā)了一句話的聯(lián)想。比如,我們聽到“中”,既有可能想到“國”,也可能想到“間”。但是AI“聯(lián)想”的詞卻依靠數(shù)據(jù)。它說“北”,如果輸入的數(shù)據(jù)不變,那后面跟的就是“京”。

智能相對論(ID:aixdlun)行業(yè)分析師顏璇曾經(jīng)在《AI在閱讀理解領(lǐng)域開始“跑分”,這個“人類好幫手”還能去哪炫技》一文中總結(jié)了AI閱讀理解的技術(shù)層面,我們或許可以從中得到閱讀理解技術(shù)反哺AI同傳的方法。

  AI閱讀理解技術(shù)的流程如下,Embedding Layer(相當(dāng)于是人的詞匯級的閱讀知識)→Encoding Layer(相當(dāng)于人通覽全文)→Matching Layer(相當(dāng)于帶著問題讀段落)→Self-Matching Layer(相當(dāng)于人再讀一遍進(jìn)行驗(yàn)證)→AnswerPointerLayer(相當(dāng)于人綜合線索定位答題)。

  綜合來看,閱讀更偏向的是 Multi-turn,即做完一次輸入輸出后,要把結(jié)果作為下輪輸入的一部分繼續(xù)輸出,系統(tǒng)在運(yùn)作時需要考慮上下文。而翻譯,則是 Single-turn,一句話進(jìn)一句話出。

  合理利用后,機(jī)器翻譯即使現(xiàn)在是 Single-turn,將來也有可能是 Multi-turn;AI同傳現(xiàn)在沒用到上下文背景,將來也有可能結(jié)合上下文做到翻譯質(zhì)量更佳。

  如今,創(chuàng)作還是人工智能正在摸索的領(lǐng)域,而一旦這個領(lǐng)域有了突破,將一些技術(shù)應(yīng)用到AI同傳里,我們或許可以達(dá)到翻譯的最高境界——”信、達(dá)、雅”。

  在未來,AI不會擠占人類同聲傳譯員的空間

  AI同傳會取代人類翻譯嗎?當(dāng)然不會。先不說語言本身的復(fù)雜,我們可以來看看同傳的實(shí)際應(yīng)用場景。

  在實(shí)際工作中,不論是口譯還是直接對話都需要同傳來完成,不會有被服務(wù)方只聘用其中的一個職能。也就是說,AI同傳不僅要學(xué)會翻譯,還要學(xué)會聊天。而在這一塊兒,機(jī)器還有很大的進(jìn)步空間。那么,AI同傳的用處在哪里呢?

  1. AI共享同傳,僅針對普通人的市場

  人們出國旅游,常常會遇到語言溝通問題,然而,并不是每個人都配得起一個專業(yè)的口語翻譯。這時候,如果一個可穿戴設(shè)備亦或者一部手機(jī)就能為你同聲傳譯,想必會減少很多人的出國成本。隨身攜帶一位專屬的同聲傳譯,是不是覺得很酷呢?

  智能硬件一直是AI的狂熱地帶。就在去年,微軟和華為合作,在 Mate 10 手機(jī)中嵌入了微軟的神經(jīng)網(wǎng)絡(luò)機(jī)器翻譯,可以算得上是在終端運(yùn)行神經(jīng)網(wǎng)絡(luò)機(jī)器翻譯的第一例。

  如果AI同傳的硬件設(shè)備出世,更可能的商業(yè)模式是出租或者共享。即按需求進(jìn)行租用,有一個專門的技術(shù)公司負(fù)責(zé)租賃,正如共享單車一樣,我們的使用費(fèi)會降到極低。而這類AI的應(yīng)用場景并不在復(fù)雜的會議現(xiàn)場,而是日常生活,出外旅游等,語料庫的建設(shè)也會更加簡單。

  如此,AI同傳只是更加惠民而已,卻不會取代在某個特殊場景比如金融會議、醫(yī)療會議等更加專業(yè)的人類同傳。

  將AI同傳與硬件設(shè)備相結(jié)合,創(chuàng)造切實(shí)可用的語音接口,還可以在很大程度上提高用戶在移動終端、可穿戴、智能家居、智能汽車等智能設(shè)備的體驗(yàn),真正在交互層面實(shí)現(xiàn)智能時代的人機(jī)結(jié)合。

  2.AI同傳成為同聲翻譯的考官

  同聲傳譯需求量成倍增加,但是合格的同聲傳譯的數(shù)量卻增長非常緩慢,據(jù)了解,現(xiàn)實(shí)市場上能夠十句話翻譯出十句的同傳譯員寥寥無幾。同時,擁有高級口譯資格證書的人并不一定能勝任同聲翻譯,同聲翻譯還需要進(jìn)行專業(yè)的技能訓(xùn)練,而有些合格的同聲翻譯人員也并不一定有口譯證書。

  目前,我國還沒有一個固定的機(jī)構(gòu)來負(fù)責(zé)同聲翻譯的相關(guān)事宜,也沒有一套統(tǒng)一的標(biāo)準(zhǔn)對同聲翻譯的工作進(jìn)行考評。

  面對這樣的困境,我們或許可以在AI同傳上開個腦洞。

  人們可以利用AI數(shù)字化、標(biāo)準(zhǔn)化等特點(diǎn),以數(shù)據(jù)庫為依托,將AI訓(xùn)練成單一功能性的考核機(jī)器,針對不同的應(yīng)用場景,對同聲傳譯員進(jìn)行考核和評級,從而規(guī)范人才市場。

  這里或許可以參考駕駛培訓(xùn)機(jī)器人。駕培機(jī)器人包含了高精度GPS導(dǎo)航技術(shù)、慣性技術(shù)和虛擬傳感技術(shù)、視頻檢測、數(shù)據(jù)處理、無線傳輸、指紋身份識別等高新技術(shù),能夠精確記錄、判斷駕駛?cè)瞬倏v駕駛機(jī)動車的真實(shí)能力。

  同理,AI同傳也可以在各種場景里,去觀察、判斷考生的翻譯能力,以及考生對翻譯規(guī)則的熟悉、理解程度。這個系統(tǒng)可以減少考試員的勞動強(qiáng)度和人為因素,確??荚嚬?、公正,考核方法科學(xué)準(zhǔn)確。

  簡單來講,我們的目標(biāo)是通過智能機(jī)器,使考核自動化,選撥或者是訓(xùn)練真正的人才,而并非取代人類的翻譯能力。

  更有意思的是,在考核過程中,AI又能不斷吸收新養(yǎng)分,增加口語類文本語料庫,何樂而不為呢?