導讀:將自然語言處理(NLP)技術(shù)引入BI系統(tǒng),帶來的不僅是人機交互方式的變革,更是數(shù)據(jù)分析質(zhì)量與效率的躍升。
將自然語言處理(NLP)技術(shù)引入BI系統(tǒng),帶來的不僅是人機交互方式的變革,更是數(shù)據(jù)分析質(zhì)量與效率的躍升。
數(shù)字經(jīng)濟時代,數(shù)據(jù)成為提高生產(chǎn)力、發(fā)展生產(chǎn)力的關(guān)鍵要素,蘊含著巨大的使用價值與潛能。因此,對當今企業(yè)而言,對數(shù)據(jù)的挖掘與利用均被放到了非常重要的戰(zhàn)略位置,與此同時,企業(yè)也紛紛采用BI商業(yè)智能系統(tǒng)作為實現(xiàn)數(shù)據(jù)價值的有力工具,用以整合企業(yè)內(nèi)外部海量數(shù)據(jù),提高數(shù)據(jù)分析質(zhì)量與效率,為具體業(yè)務(wù)進行賦能,為企業(yè)決策提供支撐。而將自然語言處理(NLP)技術(shù)引入BI系統(tǒng),帶來的不僅是人機交互方式的變革,更是數(shù)據(jù)分析質(zhì)量與效率的躍升。
什么是NLP?
NLP全稱Nature Language Processing,即自然語言處理,它是與自然語言的計算機處理有關(guān)的技術(shù)統(tǒng)稱。為了便于理解,其實可以分開來看,“自然語言”是指人與人之間書面或口語交流的形式;“處理”則是指利用計算機對數(shù)據(jù)進行理解和分析。因此,自然語言處理實際上就是指讓計算機理解人類語言,并進行相應(yīng)的分析;其目標是讓計算機/機器在理解語言上像人類一樣智能,進而彌補人類交流(自然語言)和計算機理解(機器語言)之間的差距。
自然語言處理讓機器善解人意
NLP,是人工智能領(lǐng)域中的重要方向之一,被譽為人工智能皇冠上的“明珠”。雖然它聽起來似乎很高深,但實際上早已與我們的生活息息相關(guān)。比如,我們所熟知的蘋果Siri、微軟Cortana (中文名:微軟小娜)、谷歌Assistant、亞馬遜Alexa等智能語音助手,以及公共場所里對答如流的智能服務(wù)機器人等,就是自然語言處理的典型應(yīng)用。正是有了自然處理技術(shù)的加持,它們不僅能夠理解我們所說的話,還能夠針對性地做出反饋。
不過,自然語言處理技術(shù)的應(yīng)用場景卻絕非僅限于我們所熟知的語音識別領(lǐng)域,在信息檢索、數(shù)據(jù)整合等領(lǐng)域也同樣擁有廣泛的應(yīng)用場景。比如,在信息檢索領(lǐng)域,自然語言處理能夠大大提高檢索的精準度,而且能夠促使檢索引擎更加精準地理解用戶的需求、更加智能化。比如,當你在搜索引擎中搜索 “今天冷嗎?”,百度、360等主流的中文搜索引擎不僅會在結(jié)果頁顯示與搜索關(guān)鍵詞相關(guān)的網(wǎng)頁信息,更會在顯要位置以圖表形式直觀地展示當前所處城市的實時及未來的天氣情況,而這背后實際上就有自然語言處理技術(shù)的身影,這也使得信息檢索與獲取變得更加方便快捷。在數(shù)據(jù)整合領(lǐng)域,自然語言處理技術(shù)則能提高數(shù)據(jù)處理的質(zhì)量、優(yōu)化輸出指令等;也正因如此,自然語言處理技術(shù)之于實現(xiàn)數(shù)據(jù)價值的有力工具——BI而言,也變得越來越重要。
為什么NLP技術(shù)對BI而言越來越重要?
在研究咨詢機構(gòu)Gartner發(fā)布的2020年和2021年現(xiàn)代分析與商業(yè)智能平臺應(yīng)具備的關(guān)鍵功能中,自然語言查詢(Natural Language Query,NLQ)和自然語言生成(Natural Language Generation,NLG)連續(xù)兩年被納入其中。自然語言查詢,即允許用戶在搜索框中鍵入或說出字詞來提問,查詢數(shù)據(jù)和分析內(nèi)容。自然語言生成,即自動創(chuàng)建對數(shù)據(jù)中發(fā)現(xiàn)的見解的豐富語言描述;在分析上下文中,當用戶與數(shù)據(jù)交互時,描述會動態(tài)變化,以解釋關(guān)鍵發(fā)現(xiàn)、圖表、儀表盤的含義。這也意味著,在現(xiàn)代分析與商業(yè)智能平臺中,NLP技術(shù)被放在了很重要的位置。
2020年和2021年現(xiàn)代分析與BI平臺應(yīng)具備的關(guān)鍵功能(來源:Gartner)
與此同時,一些市場主流的BI廠商也已經(jīng)發(fā)現(xiàn)了NLP這項技術(shù)的好處,并將NLP技術(shù)與功能添加到其BI產(chǎn)品中,以改善用戶體驗。
那么,為什么NLP技術(shù)對BI而言越來越重要呢?在筆者看來,一方面在于自然語言處理技術(shù)所帶來的人機交互方式的變革,進而帶來更低的使用門檻;另一方面也在于自然語言處理技術(shù)所帶來的更加高效的數(shù)據(jù)分析。
在NLP技術(shù)應(yīng)用于BI系統(tǒng)之前,在人機交互方式是“人適應(yīng)機器/計算機”,也就是BI用戶需要通過編程、建模等方式,用機器懂的語言來進行數(shù)據(jù)的探索和分析,這就帶來了很高的使用門檻,也正是如此,BI常常被調(diào)侃為IT專業(yè)人員、數(shù)據(jù)分析師以及數(shù)據(jù)科學家的數(shù)據(jù)分析工具。雖然此后為了降低使用門檻,BI也朝著“低代碼”的方向發(fā)展,但低代碼并非無代碼,一旦涉及到編程仍需IT專業(yè)人員的協(xié)助,在交互方式上也依然是“人適應(yīng)機器”。而在NLP技術(shù)應(yīng)用于BI系統(tǒng)之后,在交互方式上則是“機器/計算機適應(yīng)人”,大大降低了使用門檻,用戶無需學習機器的語言,只需使用自己所熟悉的語言即可進行數(shù)據(jù)的探索與分析,從而實現(xiàn)“數(shù)據(jù)民主化”,BI也由此轉(zhuǎn)變?yōu)椤叭巳丝捎玫臄?shù)據(jù)分析工具”。
此外,將NLP技術(shù)與功能添加到BI產(chǎn)品之中,也相當于增加了一個智能私人數(shù)據(jù)助手,其實現(xiàn)的界面與我們所熟知的智能語音助手或服務(wù)型聊天機器人類似,能提高數(shù)據(jù)分析的效率與質(zhì)量,使BI更具洞察力。它能驅(qū)動各種應(yīng)用,結(jié)合商業(yè)智能分析滲入業(yè)務(wù)的方方面面,任意時刻都能提供數(shù)據(jù)驅(qū)動的處理,使得基于數(shù)據(jù)提出問題并得到答案,如求助萬能的朋友圈一樣簡單。
想象一下,你只需在BI系統(tǒng)中,與聊天機器人對話般向BI系統(tǒng)提出問題,如“XX產(chǎn)品近三個月的銷售額如何?”XX分公司過去一年的銷售目標達成率如何?”,無需多年的數(shù)據(jù)分析經(jīng)驗,無需熟悉BI系統(tǒng)的操作方式,也無需擔心提出的問題機器是否能理解,BI系統(tǒng)即能根據(jù)所提出的問題自動創(chuàng)建和生成圖表,并添加豐富的自然語義描述,對數(shù)據(jù)的探索、分析與洞察將變得何其簡單!而實際上,正是有了自然語言處理技術(shù)與功能的加入,以上所描述的場景正在變成現(xiàn)實。
“觀哥”全中文NLP數(shù)據(jù)分析智能助手,自由探索數(shù)據(jù)價值
正是看到了自然語言處理技術(shù)在BI系統(tǒng)中的應(yīng)用價值,上海亦策軟件在其新一代增強智能協(xié)同BI平臺——觀數(shù)臺中,已融入了自然語言處理技術(shù)與功能,并推出了觀數(shù)臺機器人“觀哥”。
觀數(shù)臺機器人——觀哥Data Buddy
觀數(shù)臺是亦策軟件擁有自主知識產(chǎn)權(quán),專為中國企業(yè)量身定制的本土化、輕量級、可嵌入的商業(yè)智能(BI)平臺,具有數(shù)據(jù)自動化、增強智能和無處不在的嵌入式分析的特點,為用戶提供了相關(guān)的洞察分析和可視化,供用戶進一步考慮和探索。而觀數(shù)臺機器人——“觀哥”則是亦策軟件推出的全中文NLP數(shù)據(jù)分析智能助手,其作為觀數(shù)臺平臺的主要組件之一,可提供中文自然語言理解、意圖識別的人機交互應(yīng)用場景,支持上下文關(guān)聯(lián)查詢,幫助用戶自由探索數(shù)據(jù)價值。有了“觀哥”的協(xié)助,數(shù)據(jù)可智能呈現(xiàn),想到即看到;同時也不再提前固化用戶的數(shù)據(jù)關(guān)系和查詢思維,用戶可隨心所欲隨查隨看。觀數(shù)臺機器人“觀哥”具有以下特點與功能:
全面支持中文自然語言:“觀哥”可以接受中文命令提示,實現(xiàn)自由中文對話,并提供中文幫助文檔。在查詢過程中,“觀哥”的中文提示可幫助用戶更精確地分析數(shù)據(jù)。在自由對話的中文場景中,“觀哥”提供預(yù)測、上下文關(guān)聯(lián)和郵件推送等功能,用戶在與“觀哥”進行對話時,無需選擇應(yīng)用,直接輸入對話,“觀哥”即可預(yù)測應(yīng)用;完成對話后,“觀哥”也能預(yù)測用戶還想查看的數(shù)據(jù);而且,“觀哥”也附帶記憶,可以記住用戶上下文所說的對話內(nèi)容,同時“觀哥”也能將圖文報告通過郵件發(fā)送給指定用戶。中文幫助文檔則可幫助企業(yè)零成本培訓員工。
觀數(shù)臺“觀哥”界面示例
完善的后臺管理:在后臺管理界面中,管理員可進行一鍵數(shù)據(jù)訓練和一鍵NLP發(fā)布,應(yīng)用數(shù)據(jù)級的安全配置,設(shè)置個性化維度及度量,添加常用交互反饋(如“方言化”交互),并可與社交通訊工具集成。
個性化助手:“觀哥”可提供預(yù)警提醒、可客制化即時報告模板、PDF報告分發(fā)以及其它開放API等。
開放性平臺:“觀哥”不僅支持企業(yè)內(nèi)部應(yīng)用系統(tǒng)(如BI/CRM/OA等)、企業(yè)APP(手機客戶端需支持API接口)、社交軟件(如微信/釘釘?shù)龋┑蓉S富的API接口,而且支持Python/.Net Core源碼級別二次開發(fā),從而可進行引擎優(yōu)化、功能模塊開發(fā)(如加入語音識別功能模塊等) 、私有化SMS/內(nèi)部消息開發(fā)等。
全平臺部署模式:“觀哥”既支持云端部署,也支持企業(yè)私有化部署。在云端部署方面,既支持基于AMS云安全模式;也支持與觀數(shù)臺數(shù)據(jù)分析集成,提供一站式體驗。在企業(yè)私有化部署方面,“觀哥”可運行在Windows Server、Cent OS、Fedora、Debian、Ubuntu、Linux Mint、OpenSUSE、SUSE Linux Enterprise Server(SLES)、Alpine Linux等多種操作系統(tǒng)環(huán)境中。
總的來說,依托于亦策軟件專業(yè)的開發(fā)團隊、大數(shù)據(jù)科學家團隊和AI科學家團隊,專業(yè)的數(shù)據(jù)分析與知識,深厚的數(shù)據(jù)分析項目經(jīng)驗,以及龐大的客戶群體,觀數(shù)臺機器人“觀哥作為全中文NLP數(shù)據(jù)分析智能助手,具有中文理解準確,響應(yīng)速度高;行業(yè)經(jīng)驗充足,語料庫完善;推薦關(guān)注精準,自帶行業(yè)性;數(shù)據(jù)訓練技術(shù)成熟;能與主流數(shù)據(jù)分析產(chǎn)品深入集成等諸多優(yōu)勢。
如今,觀數(shù)臺作為新一代增強智能協(xié)同BI平臺,已經(jīng)在制造、零售、醫(yī)藥、教育、金融、航空與物流等眾多行業(yè)與領(lǐng)域得到廣泛應(yīng)用,而觀數(shù)臺機器人“觀哥”作為觀數(shù)臺的主要組件之一,不僅大大改善了人機交互方式,降低了使用門檻,而且也顯著提高了數(shù)據(jù)分析效率與質(zhì)量,進而賦能各行業(yè)客戶自由探索數(shù)據(jù)價值,為其帶去更加精準的分析建議與決策。