技術(shù)
導(dǎo)讀:一組微軟研究團(tuán)隊(duì)于本周三宣布,他們已經(jīng)創(chuàng)造了第一個(gè)能夠?qū)⒅形男侣劮g成英文的機(jī)器翻譯系統(tǒng),精確度與人類(lèi)譯者一致。
一組微軟研究團(tuán)隊(duì)于本周三宣布,他們已經(jīng)創(chuàng)造了第一個(gè)能夠?qū)⒅形男侣劮g成英文的機(jī)器翻譯系統(tǒng),精確度與人類(lèi)譯者一致。該公司表示,它通過(guò)來(lái)自各種在線報(bào)紙的約2000條語(yǔ)句樣本對(duì)這一系統(tǒng)進(jìn)行了反復(fù)測(cè)試,并將測(cè)試結(jié)果與人類(lèi)譯者的翻譯進(jìn)行了比較,它還甚至聘請(qǐng)了外部的雙語(yǔ)顧問(wèn)來(lái)進(jìn)一步驗(yàn)證機(jī)器的精確度。
這一被稱(chēng)為newstest2017的樣本集已于去年秋天在研究會(huì)議WMT17上發(fā)布。
令人感到驚訝的是研究人員能夠如此快速的達(dá)到這一里程碑,尤其是機(jī)器翻譯是人們幾十年來(lái)一直在試圖解決的問(wèn)題。
微軟指出,許多人甚至認(rèn)為達(dá)到與人類(lèi)相同水平的目標(biāo)可能永遠(yuǎn)無(wú)法實(shí)現(xiàn)。
負(fù)責(zé)微軟語(yǔ)音、自然語(yǔ)言和機(jī)器翻譯工作的技術(shù)專(zhuān)家黃學(xué)東,在微軟的一篇博文中表示:“在機(jī)器翻譯任務(wù)中達(dá)到人類(lèi)水平是我們所有人的夢(mèng)想,我們只是沒(méi)有意識(shí)到能夠這么快實(shí)現(xiàn)這一目標(biāo)?!?/p>
讓機(jī)器在這一規(guī)模上理解語(yǔ)言遠(yuǎn)比語(yǔ)音識(shí)別復(fù)雜得多。AI和語(yǔ)音識(shí)別的進(jìn)步讓語(yǔ)音助手能夠嵌入我們的智能手機(jī)之中,幫助消費(fèi)者處理日常計(jì)算任務(wù),控制智能家居設(shè)備以及用于新聞和娛樂(lè)目的。
但是要求機(jī)器對(duì)網(wǎng)頁(yè)或新聞文章進(jìn)行翻譯往往會(huì)出現(xiàn)難以理解的單詞混亂,雖然可以讓你對(duì)所說(shuō)的內(nèi)容有一個(gè)大致的了解,卻無(wú)法進(jìn)行深度的理解。
要真正理解長(zhǎng)篇文章中的內(nèi)容,你需要人的幫助。
但不同的人工翻譯會(huì)以一種稍微不同的方式來(lái)翻譯一個(gè)句子。
“機(jī)器翻譯要比單純的模式識(shí)別任務(wù)復(fù)雜得多,”微軟亞洲研究院助理總監(jiān)兼自然語(yǔ)言處理小組負(fù)責(zé)人周明說(shuō)道。“人們可以使用不同的單詞來(lái)表達(dá)相同的意思,但你無(wú)法判斷哪一種更好?!?/p>
微軟還指出,最近在AI方面取得的進(jìn)展,為研究人員實(shí)現(xiàn)這一里程碑作出了貢獻(xiàn)。
深度神經(jīng)網(wǎng)絡(luò)——一種訓(xùn)練AI系統(tǒng)的方法,允許研究人員創(chuàng)造更加流利自然的翻譯,并考慮到更廣泛的內(nèi)容背景,這一超前的方法被稱(chēng)之為統(tǒng)計(jì)機(jī)器翻譯。
微軟的研究人員還在系統(tǒng)中增加了他們自己的訓(xùn)練方法,以提高其精確度。這些方法類(lèi)似于人們?nèi)绾沃貜?fù)自己的工作時(shí)間,并再次確認(rèn)是否正確的過(guò)程。
研究人員表示,他們使用的方法包括雙重學(xué)習(xí)的事實(shí)檢查翻譯;審議網(wǎng)絡(luò),進(jìn)行重復(fù)翻譯和改進(jìn);聯(lián)合訓(xùn)練等新技術(shù),以迭代促進(jìn)英到中和中到英翻譯系統(tǒng);以及協(xié)議正規(guī)化,即通過(guò)左到右和右到左閱讀語(yǔ)句來(lái)生成翻譯。
周明表示,用于實(shí)現(xiàn)這一里程碑的技術(shù)不會(huì)局限于機(jī)器翻譯。“這是機(jī)器翻譯研究可以應(yīng)用于人工智能研究全部領(lǐng)域的領(lǐng)域,”周明表示。
此外,它可以在未來(lái)讓其他語(yǔ)言的翻譯更加準(zhǔn)確和自然。研究人員表示,這一系統(tǒng)尚未在實(shí)時(shí)新聞報(bào)道中測(cè)試過(guò),在該技術(shù)被商業(yè)化到微軟產(chǎn)品前還有其他的挑戰(zhàn)需要解決。
但是你可以在微軟的網(wǎng)站上使用這一新的翻譯系統(tǒng):https://translator.microsoft.com/neural。
系統(tǒng)將顯示一個(gè)中文(簡(jiǎn)體)句子,然后以?xún)煞N方式進(jìn)行翻譯,右邊的翻譯會(huì)更加完善以表明這一技術(shù)的先進(jìn)性。
機(jī)器翻譯是谷歌的研究人員一直致力于研究的內(nèi)容,包括使用谷歌的機(jī)器學(xué)習(xí)技術(shù)進(jìn)行中英文查詢(xún)。這些進(jìn)展已經(jīng)付諸實(shí)施,以改進(jìn)谷歌面向消費(fèi)者的產(chǎn)品,比如谷歌翻譯應(yīng)用,以及谷歌搜索的整合。