導(dǎo)讀:近日上海小學(xué)教材將“外婆”改成“姥姥”一事,引發(fā)了全國網(wǎng)友對于“方言保護(hù)”的爭論熱潮。新加坡《聯(lián)合早報》稱,此事反映出方言在全國范圍內(nèi)的式微趨勢,許多歷史文化遺產(chǎn)面臨失傳的厄運。盡管國內(nèi)外都啟動了多種語言的保護(hù)工程,但接受《環(huán)球時報》記者采訪的專家表示,大多數(shù)語言消亡的趨勢幾乎是不可避免的,但通過人工智能技術(shù),至少我們有望把這些語言保存下來,從而記錄下它們所承載的文化。
近日上海小學(xué)教材將“外婆”改成“姥姥”一事,引發(fā)了全國網(wǎng)友對于“方言保護(hù)”的爭論熱潮。新加坡《聯(lián)合早報》稱,此事反映出方言在全國范圍內(nèi)的式微趨勢,許多歷史文化遺產(chǎn)面臨失傳的厄運。盡管國內(nèi)外都啟動了多種語言的保護(hù)工程,但接受《環(huán)球時報》記者采訪的專家表示,大多數(shù)語言消亡的趨勢幾乎是不可避免的,但通過人工智能技術(shù),至少我們有望把這些語言保存下來,從而記錄下它們所承載的文化。
方言作為地方文化的一種,是民族文化的有機(jī)組成部分,這些“南腔北調(diào)”傳承著不同地區(qū)的文化和歷史。那些生活中積累下來的生動傳神、接地氣的特有音調(diào)和詞匯,構(gòu)成了方言妙趣的音韻。對于流動性越來越大的現(xiàn)代社會而言,方言更寄托著很多游子的思鄉(xiāng)之情,聽起來特別有親切感,那些與生俱來的記憶,隨著鄉(xiāng)音歷歷在目。
但現(xiàn)實情況是,在全球化和信息高速傳遞的現(xiàn)代社會,無論是國際還是國內(nèi),包括方言在內(nèi)的大多數(shù)語言都受到強(qiáng)勢主流語言的侵蝕甚至是飛速消亡。聯(lián)合國2017年的相關(guān)報告顯示,全球現(xiàn)有約6000種語言,預(yù)計到本世紀(jì)末將有90%的語言可能消亡。其中近500種語言的傳承者甚至少于10人,很可能會迅速滅亡。而其他語言,則由于學(xué)校、商業(yè)和電視上那些主流語言的壓倒性優(yōu)勢排擠,也會逐漸消失滅絕。
同樣的情況也出現(xiàn)在中國。由于大量人口背井離鄉(xiāng),使方言使用的場合和頻次大大降低,生存的空間不斷被擠壓。根據(jù)2015年啟動的中國語言資源保護(hù)工程提供的數(shù)據(jù),在中國的130多種語言中,有68種使用人口在萬人以下,有48種使用人口在5000人以下,其中有25種使用人口不足千人,滿語、赫哲語、蘇龍語等使用人數(shù)不足百人。你還記得你的家鄉(xiāng)話怎么說嗎?很多受訪者表示已經(jīng)不會用地道的家鄉(xiāng)話來表達(dá)了。
致力于少數(shù)民族語言和方言保護(hù)近十年的科大訊飛多語種高級研究員祖漪清告訴《環(huán)球時報》記者,從整體趨勢而言,包括方言在內(nèi)的大多數(shù)語言走向消亡是不可避免的。在全球化趨勢日益明顯的當(dāng)代,語言作為交流工具,本身就在不斷向主流強(qiáng)勢語種靠攏。尤其是主流語言往往背靠更強(qiáng)大的經(jīng)濟(jì)和文化實力,不但不斷侵蝕弱勢語言的“地盤”,而且創(chuàng)造新詞的功能更活躍。她舉例說,在科大訊飛的全國方言保護(hù)項目中發(fā)現(xiàn),不僅是滿語這類瀕臨消亡的小語種存在困境,就連很多使用人群較多的方言同樣受到明顯侵蝕。例如由于北京方言和普通話很接近,要找出能說一口地道北京話的年輕人變得很難,很多北京方言的特有詞匯其實已經(jīng)被普通話取代。
在信息化時代,文化交流的速度空前加快,也加速了強(qiáng)勢語言對其他語言或方言的入侵。祖漪清表示,即便是具有強(qiáng)大造詞能力的強(qiáng)勢語種的漢語,如今也會直接在各種中文交流場合使用NBA、Ipad等外來詞匯。
她惋惜地說,糟糕的是,由于很多少數(shù)民族語言和方言的使用人群只使用口語交流,極少使用文字,很多南方方言沒有合適漢字進(jìn)行描寫。而口語采集比朗讀采集困難大很多。一旦相關(guān)語言消亡,它承載的那些獨特文化也就消失在歷史長河中。
為挽救這些瀕臨消亡的語言,各國都在爭分奪秒。澳大利亞政府上世紀(jì)70年代便規(guī)定在全國實現(xiàn)多語教育制;美國也出臺專門保護(hù)原著民語言的相關(guān)法案,支持原著民語言的項目。中國也先后出版了漢語方言地圖集、音檔及系列詞典,《中國的語言》及少數(shù)民族語言的詞典和參考語法等。中國語言資源保護(hù)工程更是規(guī)模宏大,計劃為每種語言記錄1000-3000個常用詞、數(shù)量有限句子和400分鐘的文化典藏。
祖漪清介紹說,正確利用人工智能技術(shù),對于保存這些瀕臨滅亡的語言是十分必要的??拼笥嶏w的人工智能技術(shù)不但可以分析方言的孤立音節(jié)和孤立詞匯,還可對連續(xù)話語進(jìn)行建模?;谡Z音合成、語音識別、翻譯技術(shù)經(jīng)過人機(jī)協(xié)同分析,實現(xiàn)對一個語言的完整“復(fù)制”。對于沒有文字的語言,美國科學(xué)家進(jìn)行的“語音羅塞塔”項目的思路也值得借鑒,即盡最大可能獲得被記錄語言的語音和主流語言文字的平行數(shù)據(jù),并實現(xiàn)兩者之間的“翻譯”。
不過她也表示,由于現(xiàn)有的人工智能技術(shù)需要海量數(shù)據(jù)作為機(jī)器學(xué)習(xí)的內(nèi)容支撐,但一些瀕危方言和語言的使用者中,真正能標(biāo)準(zhǔn)朗讀的人已經(jīng)很少,甚至只有個位數(shù),而且大都年年事已高,這使得語音的采集工作極為艱難且迫切。另一方面,中國方言,尤其是南方方言種類繁多,結(jié)構(gòu)復(fù)雜,甚至存在“十里不同音”的情況。若想要保存這樣種類繁多的方言,還必須依靠全社會的支持。日前,科大訊飛對外啟動了“方言發(fā)音人”招募公益行動,邀請全民參與共建“中國方言庫”,用自己的聲音留下中華語言文化遺產(chǎn),傳承優(yōu)秀傳統(tǒng)文化。