應(yīng)用

技術(shù)

物聯(lián)網(wǎng)世界 >> 物聯(lián)網(wǎng)新聞 >> 物聯(lián)網(wǎng)熱點(diǎn)新聞
企業(yè)注冊(cè)個(gè)人注冊(cè)登錄

深度 | AI 建模實(shí)際應(yīng)用場(chǎng)景及效益

2020-04-23 11:00 媒體投稿

導(dǎo)讀:隨著AI 科技的發(fā)展,過去很多無法應(yīng)用計(jì)算機(jī)算法分析的場(chǎng)景現(xiàn)在已經(jīng)成為可能,并且能經(jīng)由 AI 的算法帶來實(shí)際的業(yè)務(wù)效益,提升營收。本文將以普強(qiáng)的 AI 建模、語義理解、語音識(shí)別等相關(guān)技術(shù)為核心所建立的一套優(yōu)化商業(yè)場(chǎng)景機(jī)制,在行業(yè)中的實(shí)際應(yīng)用所產(chǎn)生的效益做詳細(xì)闡述。

隨著AI 科技的發(fā)展,過去很多無法應(yīng)用計(jì)算機(jī)算法分析的場(chǎng)景現(xiàn)在已經(jīng)成為可能,并且能經(jīng)由 AI 的算法帶來實(shí)際的業(yè)務(wù)效益,提升營收。本文將以普強(qiáng)的 AI 建模、語義理解、語音識(shí)別等相關(guān)技術(shù)為核心所建立的一套優(yōu)化商業(yè)場(chǎng)景機(jī)制,在行業(yè)中的實(shí)際應(yīng)用所產(chǎn)生的效益做詳細(xì)闡述。

國內(nèi)一名列世界500 強(qiáng)的保險(xiǎn)公司(以下簡(jiǎn)稱“A 保險(xiǎn)公司”),擁有龐大的電銷團(tuán)隊(duì),雇傭了上萬名電銷人員,每月電銷電話撥打量達(dá)到千萬通。由于客戶名單基本為白名單,即沒有客戶的信息,傳統(tǒng)的格式化維度分析無法應(yīng)用,所以A保險(xiǎn)公司在沒有客戶信息的情況下,實(shí)行全量撥打,這樣的撥打效果成交率在千分之一以下。另一方面,全量撥打的電銷電話也給客戶帶來不良的印象,對(duì)客戶造成不必要的干擾。近年來,監(jiān)管力度逐年上升,對(duì)電銷電話管控嚴(yán)度加大。為能有效運(yùn)營電銷就需要有特定對(duì)象,向有購買保險(xiǎn)意愿的客戶精準(zhǔn)的撥打。

隨著AI 科技的進(jìn)步,普強(qiáng) AI 建模產(chǎn)品的核心運(yùn)用了最新的 AI 語音轉(zhuǎn)譯和語義理解技術(shù),為這樣的場(chǎng)景提供了一個(gè)極佳的解決方案,能夠讓 A 保險(xiǎn)公司和有類似業(yè)務(wù)場(chǎng)景公司的電銷人員將資源集中在有潛在購買意愿的客戶。一方面,避免撥打全量的電話,減少人力資源和電信話費(fèi),另一方面,能有效減少對(duì)沒有購買意愿客戶的干擾。當(dāng)客戶有意愿和需求購買保險(xiǎn)時(shí),電銷的外呼電話不被認(rèn)為是干擾;相反,對(duì)沒有購買意愿或能力的人,這樣的電話即成為客戶的干擾。

事實(shí)上,經(jīng)過AI 建模的分析,在數(shù)百萬的客戶名單中,有購買意愿的大約在 15% 左右,因此 80% 以上的電話都是不必要撥打的。這樣的應(yīng)用給 A 保險(xiǎn)公司和有類似應(yīng)用場(chǎng)景的公司省下巨大的成本。接下來,將會(huì)對(duì)此做詳盡的描述。

一、語音語義理解可獲取有價(jià)值的客戶特征

雖然沒有客戶的固定維度信息,但是有許多已撥打過的錄音,A 保險(xiǎn)公司擁有海量的客戶通話錄音,錄音內(nèi)含有寶貴的客戶信息、客戶特征等。這些數(shù)據(jù)都可以作為篩選客戶的依據(jù),例如在電銷的過程中可以得知:

l買過保險(xiǎn):“謝謝,我已經(jīng)有保險(xiǎn)了”。

l可能有車:“對(duì)不起,我正在開車,不方便講話”。

l有房人士:“我目前房貸壓力大,沒有閑錢買保險(xiǎn)”。

還有許多類似的特征都可以從電銷人員和客戶的通話中獲取,做成客戶畫像。普強(qiáng)過去積累了許多成功案例,其中就包含大量這樣有價(jià)值的客戶特征。從各樣的案例中,電銷人員重點(diǎn)關(guān)注擁有這些特征的客戶,撥打給這類有較高意愿的客戶并提高銷售力度,增加撥打次數(shù)和跟進(jìn),從而提升銷售成交率。因此,若能將這些寶貴的客戶信息特征挖掘出來,也就能更進(jìn)一步找出潛在客戶,從而將電銷團(tuán)隊(duì)的大量資源(人力、時(shí)間、電話費(fèi)用……)做最有效的運(yùn)用,達(dá)到最大收益。

二、AI語音轉(zhuǎn)譯和語義理解

自從2010 年蘋果電腦、手機(jī)發(fā)布 Siri 應(yīng)用后,語音識(shí)別技術(shù)不斷的更新、突破。其主要是源于一種計(jì)算機(jī)算法架構(gòu)的技術(shù)突破:深度神經(jīng)網(wǎng)絡(luò)。使用神經(jīng)網(wǎng)絡(luò)的技術(shù),研究人員不斷推進(jìn)許多人工智能以前不能突破的障礙,例如語音識(shí)別、圖像識(shí)別、語義理解等三大領(lǐng)域。借助神經(jīng)網(wǎng)絡(luò)架構(gòu),這些領(lǐng)域里的問題都大大提升了應(yīng)用上的效果。這樣的突破主要由以下幾個(gè)因素造成:

l數(shù)據(jù)量徒增:借著互聯(lián)網(wǎng)的發(fā)展,大量的用戶將語音、圖像、照片、文字上傳到大型的數(shù)據(jù)中心。

l大型云計(jì)算中心超級(jí)的運(yùn)算能力:能儲(chǔ)存、處理、分析這些海量的數(shù)據(jù)。

l算法突破:借助前兩項(xiàng),算法得以不斷的被驗(yàn)證、優(yōu)化、迭代更新,創(chuàng)新的神經(jīng)網(wǎng)絡(luò)架構(gòu)不斷的被提出并被驗(yàn)證。

在語音識(shí)別方面,2017 年微軟研究院的技術(shù)達(dá)到了與人翻譯的結(jié)果相同的里程碑。在電話對(duì)話的數(shù)據(jù)集(Switchboard),微軟的研究員們使用了多個(gè)神經(jīng)網(wǎng)絡(luò)模型來翻譯使結(jié)果達(dá)到最優(yōu),翻譯的字錯(cuò)誤率與4位專業(yè)翻譯人士共同翻譯的錯(cuò)誤率基本相同。2018 年谷歌的 DeepMind 使用了大型的 CNN-RNN-CTC 神經(jīng)網(wǎng)絡(luò)架構(gòu),翻譯結(jié)果比翻譯專家好六倍。同時(shí)在圖像識(shí)別方面,也同樣有重大突破,使得自動(dòng)駕駛這樣復(fù)雜的工作,變得可實(shí)現(xiàn)。

語音、圖像識(shí)別持續(xù)突破,在語義理解方面,使用神經(jīng)網(wǎng)絡(luò)架構(gòu)的算法也突破了人的水平。著名的史丹佛大學(xué)語義理解競(jìng)賽的文本問答數(shù)據(jù)集,內(nèi)有10 萬條問答,都是從維基百科摘選的文章片段,然后對(duì)每一片段由真人提出問題,并在文章片段內(nèi)找出答案的位置。準(zhǔn)確率由 2017 年前的 60% 迅速攀升到最新的 90% 以上,遠(yuǎn)遠(yuǎn)超過人的水平,人的水平為 86.8%,而準(zhǔn)確率最高的神經(jīng)網(wǎng)絡(luò)是 94.6%。它所使用的神經(jīng)網(wǎng)絡(luò)架構(gòu)為一種稱為 Transformer 的網(wǎng)絡(luò),疊加 24 次,形成一個(gè)深度大型的網(wǎng)絡(luò)(BERT),并使用了兆級(jí)數(shù)量的詞匯做訓(xùn)練。在其它常用的語義任務(wù)上,神經(jīng)網(wǎng)絡(luò)也都極大的提升了準(zhǔn)確率,例如命名實(shí)體識(shí)別(NER)、關(guān)系識(shí)別、文本蘊(yùn)含(text entailment)等。

這些人工智能的科技突破,讓許多以往計(jì)算機(jī)不能應(yīng)用到的場(chǎng)景成為新的應(yīng)用。在語音方面,企業(yè)存儲(chǔ)的海量錄音,以往是黑盒子,無法進(jìn)行分析整理。不像結(jié)構(gòu)化的數(shù)據(jù),使用大型的數(shù)據(jù)庫,可以做查詢、統(tǒng)計(jì)、分析、圖表化等工作。如今,可以經(jīng)由語音識(shí)別成為文字,然后再經(jīng)由語義理解做分析,產(chǎn)生實(shí)際的應(yīng)用效益。接下來將對(duì)最新的語音、語義技術(shù)在人工智能科技的應(yīng)用作案例分析。

三、語音語義分析現(xiàn)行科技狀況

語音識(shí)別相對(duì)比較容易理解和定義,其任務(wù)就是將聲音轉(zhuǎn)成文字,而轉(zhuǎn)化的效果可以簡(jiǎn)易的用字錯(cuò)誤率來界定。但是識(shí)別的準(zhǔn)確率與諸多因素相關(guān),可以用人的體驗(yàn)來做比喻,因?yàn)槿斯ぶ悄芑揪褪悄7氯说闹悄埽?/p>

l專業(yè)領(lǐng)域:如果在一個(gè)不同的專業(yè)領(lǐng)域,例如醫(yī)學(xué),許多的用語不是一般常用的,一個(gè)非醫(yī)學(xué)專業(yè)的人士不容易理解這些醫(yī)學(xué)的用語,做文字轉(zhuǎn)化的也會(huì)出錯(cuò)。

l口音/方言:嚴(yán)重的方言口音或是方言。

l傳播媒介:如電話信道。

l背景聲音:如吵雜的環(huán)境。

這些都會(huì)影響識(shí)別的結(jié)果,就像人需要時(shí)間適應(yīng)后才能聽懂一個(gè)新環(huán)境里的對(duì)話交流。所以要降低語音轉(zhuǎn)譯的錯(cuò)誤率,必須要能對(duì)專業(yè)或應(yīng)用領(lǐng)域有足夠的認(rèn)識(shí),熟悉地域的口音、方言等。

普強(qiáng)的語音轉(zhuǎn)譯專注于固定領(lǐng)域來積累領(lǐng)域的專業(yè)話語,也同時(shí)積累了大量的語音覆蓋了口音、方言、傳播媒介特性、背景聲音等因素,來優(yōu)化語音轉(zhuǎn)譯的正確率。

另一方面,語義理解任務(wù)相對(duì)的就比較不容易定義和理解,有一組學(xué)術(shù)界定義的語義理解相關(guān)的問題(GLUE):

lCoLA:?jiǎn)尉涞亩诸悊栴}, 判斷一個(gè)英文句子在語法上是不是可接受的。

lSST-2:?jiǎn)尉涞亩诸悊栴}, 句子的來源于人們對(duì)一部電影的評(píng)價(jià), 判斷這個(gè)句子的情感。

lMRPC:句子對(duì)來源于對(duì)同一條新聞的評(píng)論,判斷這一對(duì)句子在語義上是否相同。

lSTS-B:這是一個(gè)類似回歸的問題,給出一對(duì)句子,使用 1~5 的評(píng)分評(píng)價(jià)兩者在語義上的相似程度。

lQQP:這是一個(gè)二分類數(shù)據(jù)集,目的是判斷兩個(gè)來自于 Quora 的問題句子在語義上是否是等價(jià)的。

lMNLI-m:語型內(nèi)匹配。推斷兩個(gè)句子是意思相近, 矛盾,還是無關(guān)的。

lMNLI-mm:跨語型匹配。推斷兩個(gè)句子是意思相近,矛盾,還是無關(guān)的。

lQNLI:也是一個(gè)二分類問題,兩個(gè)句子是一個(gè)(question,answer)對(duì),正樣本為 answer 是對(duì)應(yīng)question的答案,負(fù)樣本則相反。

lRTE:是一個(gè)二分類問題,類似于 MNLI, 但是數(shù)據(jù)量少很多。

lWNLI:推斷兩個(gè)句子是意思相近,矛盾,還是無關(guān)的。

lAX:QA型圖像數(shù)據(jù)庫。

這些任務(wù)都有許多應(yīng)用場(chǎng)景,但是語義理解的應(yīng)用范疇也有很多不能直接應(yīng)用這些任務(wù),例如從一段對(duì)話文本中來判斷一個(gè)人是否結(jié)婚,如下面的對(duì)話:

A:您好,我想跟您談下我們公司最近的一個(gè)產(chǎn)品的活動(dòng),這個(gè)產(chǎn)品能夠......

B:嗯,謝謝,不過我需要和我老婆商量商量....

明顯的從這段對(duì)話里,可以判定B是已經(jīng)結(jié)過婚的人。再例如,服務(wù)業(yè)里常有禁忌的用語如:

A-先聽我說or A-是誰說or A-怎么知道or A-誰告訴你or A-有沒有搞錯(cuò)or A-你弄錯(cuò)了or A-說重點(diǎn)or A-你必須or A-本來應(yīng)該or A-這個(gè)部門很差勁or A-這個(gè)部門差勁or A-到底需要不需要or A-你不要跟我喊or A-你明白了嗎or A-那您覺得呢or A-我說的很清楚了or A-剛才不是對(duì)你說了

這樣的語義理解應(yīng)用均不是GLUE 里面的任務(wù)能夠直接應(yīng)用的,并且在 GLUE 里表現(xiàn)良好的神經(jīng)網(wǎng)絡(luò)架構(gòu)也不能保證在真實(shí)應(yīng)用的場(chǎng)景里達(dá)到產(chǎn)生業(yè)務(wù)價(jià)值的效果。

2018 年底,谷歌發(fā)布了一種神經(jīng)網(wǎng)絡(luò)架構(gòu) BERT,一種基于 Transformer 架構(gòu)的多層疊加的神經(jīng)網(wǎng)絡(luò),BERT 提出兩種版本,基本版(BASE)和大型版(LARGE),參數(shù)如下:

BERTBASE: L=12, H=768, A=12, Total Parameters=110M

BERTLARGE: L=24, H=1024, A=16, Total Parameters=34

使用了3.3Giga 的詞匯作預(yù)訓(xùn)練,然后再按任務(wù)作微調(diào)訓(xùn)練,硬件使用了谷歌 TPU V2.0 的處理器,BERT 的基礎(chǔ)版(BASE)需要 16 個(gè) TPU 芯片,BERT 的 LARGE 版使用了 64 個(gè) TPU 芯片,預(yù)訓(xùn)練需要 4 天。

在GLUE 的許多任務(wù)上均優(yōu)于此前的神經(jīng)網(wǎng)絡(luò)架構(gòu)(如上表所列)。BERT 在語音識(shí)別和圖像識(shí)別突破后帶來了語義理解的突破。此后在 BERT 的基礎(chǔ)上,在語義理解的許多應(yīng)用上都帶來了突破。然而由于 BERT 和后續(xù)的神經(jīng)網(wǎng)絡(luò)都需要龐大的計(jì)算資源和時(shí)間,給私有化部署的應(yīng)用帶來高昂的成本,除非能夠使用云端共享的 BERT 計(jì)算資源。由于數(shù)據(jù)保密的要求,許多應(yīng)用的數(shù)據(jù)無法上傳到云端,例如金融業(yè)的客戶數(shù)據(jù)等。

如前所述,這樣的科技還需要經(jīng)過再創(chuàng)新才能應(yīng)用在實(shí)際的商業(yè)場(chǎng)景里。普強(qiáng)在這個(gè)方面做了十年的科研投入,不斷的將最新的科技應(yīng)用在實(shí)際的商業(yè)場(chǎng)景上。

四、普強(qiáng)語音語義框架

當(dāng)前人工智能算法均屬在高維度的空間中尋找線性/非線性復(fù)合函數(shù)的最優(yōu)值點(diǎn),其最核心的架構(gòu)設(shè)計(jì)實(shí)為設(shè)計(jì)此高維度空間里的數(shù)學(xué)復(fù)合函數(shù),許多的復(fù)合函數(shù)/神經(jīng)網(wǎng)絡(luò)框架都在不同的任務(wù)中被驗(yàn)證有應(yīng)用的效益,下面列舉了幾個(gè)重要的類別:

全聯(lián)多層的神經(jīng)網(wǎng)絡(luò):每層的神經(jīng)元均與下一層的所有神經(jīng)元相連,邏輯回歸等算法均使用此種網(wǎng)絡(luò)。

l卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Networks, CNN):是一類包含卷積計(jì)算且具有深度結(jié)構(gòu)的前饋神經(jīng)網(wǎng)絡(luò)(Feedforward Neural Networks),是深度學(xué)習(xí)(deep learning)的代表算法之一。卷積神經(jīng)網(wǎng)絡(luò)具有表征學(xué)習(xí)(representation learning)能力,能夠按其階層結(jié)構(gòu)對(duì)輸入信息進(jìn)行平移不變分類(shift-invariant classification),因此也被稱為“平移不變?nèi)斯ど窠?jīng)網(wǎng)絡(luò)(Shift-InvariantArtificial Neural Networks, SIANN)。卷積神經(jīng)網(wǎng)絡(luò)架構(gòu)在視覺辨識(shí)里達(dá)到了極優(yōu)的效果。

l循環(huán)神經(jīng)網(wǎng)絡(luò)(Recurrent Neural Network, RNN):是一類以序列(sequence)數(shù)據(jù)為輸入,在序列的演進(jìn)方向進(jìn)行遞歸(recursion)且所有節(jié)點(diǎn)(循環(huán)單元)按鏈?zhǔn)竭B接的遞歸神經(jīng)網(wǎng)絡(luò)(recursive neural network)。循環(huán)神經(jīng)網(wǎng)絡(luò)的研究始于二十世紀(jì) 80-90 年代,并在二十一世紀(jì)初發(fā)展為深度學(xué)習(xí)(deep learning)算法之一,其中雙向循環(huán)神經(jīng)網(wǎng)絡(luò)(Bidirectional RNN, Bi-RNN)和長(zhǎng)短期記憶網(wǎng)絡(luò)(LongShort-Term Memory networks,LSTM)是常見的的循環(huán)神經(jīng)網(wǎng)絡(luò)。循環(huán)神經(jīng)網(wǎng)絡(luò)具有記憶性、參數(shù)共享并且圖靈完備(Turing completeness),因此在對(duì)序列的非線性特征進(jìn)行學(xué)習(xí)時(shí)具有一定優(yōu)勢(shì)。循環(huán)神經(jīng)網(wǎng)絡(luò)在自然語言處理(Natural Language Processing, NLP),例如語音識(shí)別、語言建模、機(jī)器翻譯等領(lǐng)域有應(yīng)用,也被用于各類時(shí)間序列預(yù)報(bào)。引入了卷積神經(jīng)網(wǎng)絡(luò)(Convoutional Neural Network,CNN)構(gòu)筑的循環(huán)神經(jīng)網(wǎng)絡(luò)可以處理包含序列輸入的計(jì)算機(jī)視覺問題。

lTransformer神經(jīng)網(wǎng)絡(luò):拋棄了傳統(tǒng)的 CNN 和 RNN,整個(gè)網(wǎng)絡(luò)結(jié)構(gòu)完全是由 Attention 機(jī)制組成。更準(zhǔn)確地講,Transformer 由且僅由 Self-Attenion 和 Feed Forward NeuralNetwork 組成。一個(gè)基于 Transformer 的可訓(xùn)練的神經(jīng)網(wǎng)絡(luò)可以通過堆疊 Transformer 的形式進(jìn)行搭建,作者的實(shí)驗(yàn)是通過搭建編碼器和解碼器各6層,總共12層的 Encoder-Decoder,并在機(jī)器翻譯中取得了 BLEU 值得新高。

lCTC(Connectionis ttemporal classification):傳統(tǒng)的語音識(shí)別的聲學(xué)模型訓(xùn)練,對(duì)于每一幀的數(shù)據(jù),需要知道對(duì)應(yīng)的 label 才能進(jìn)行有效的訓(xùn)練,在訓(xùn)練數(shù)據(jù)之前需要做語音對(duì)齊的預(yù)處理。而語音對(duì)齊的過程本身就需要進(jìn)行反復(fù)多次的迭代,來確保對(duì)齊更準(zhǔn)確,這本身就是一個(gè)比較耗時(shí)的工作。與傳統(tǒng)的聲學(xué)模型訓(xùn)練相比,采用 CTC 作為損失函數(shù)的聲學(xué)模型訓(xùn)練,是一種完全端到端的聲學(xué)模型訓(xùn)練,不需要預(yù)先對(duì)數(shù)據(jù)做對(duì)齊,只需要一個(gè)輸入序列和一個(gè)輸出序列即可以訓(xùn)練。這樣就不需要對(duì)數(shù)據(jù)對(duì)齊和一一標(biāo)注,并且CTC 直接輸出序列預(yù)測(cè)的概率,不需要外部的后處理。

以上僅就目前人工智能應(yīng)用領(lǐng)域里經(jīng)常使用并產(chǎn)生實(shí)際應(yīng)用效益的網(wǎng)絡(luò)做了簡(jiǎn)介,當(dāng)應(yīng)用到各個(gè)實(shí)際場(chǎng)景里時(shí),還有基于上述網(wǎng)絡(luò)衍生的眾多版本和彼此之間的結(jié)合版,不能一一詳述。

深度學(xué)習(xí)里的神經(jīng)網(wǎng)絡(luò)架構(gòu)及其參數(shù)和超參數(shù)均需按實(shí)際場(chǎng)景和數(shù)據(jù)的情況作調(diào)試優(yōu)化,方能達(dá)到理想的效果以產(chǎn)生實(shí)際應(yīng)用價(jià)值。然而實(shí)際的場(chǎng)景雖然都有相似之處,但也有諸多不同的細(xì)節(jié),為能滿足每一應(yīng)用場(chǎng)景的應(yīng)用效益要求,以過往往需要由資深的算法工程師做深度的調(diào)試,此種模式耗時(shí)且效率低,常常不能滿足客戶快速的迭代需求。

大型人工智能科技公司提倡將大量的數(shù)據(jù)存儲(chǔ)在它們的云計(jì)算平臺(tái)上,并同時(shí)按采集到的海量數(shù)據(jù)調(diào)試一個(gè)能廣泛應(yīng)用的平臺(tái)。此種商業(yè)模式,雖有可行性,但同時(shí)也面臨著一些根本的挑戰(zhàn)。例如如何能保證數(shù)據(jù)的安全,特別是金融行業(yè)和其它對(duì)數(shù)據(jù)保密要求高的行業(yè),同時(shí)這些大型的人工智能公司現(xiàn)今也不斷的擴(kuò)張他們的業(yè)務(wù)領(lǐng)域,將數(shù)據(jù)提供給此類的云平臺(tái),也加速了他們的競(jìng)爭(zhēng)力來切入不同的商業(yè)領(lǐng)域,這樣的擔(dān)憂也是使得這樣的方法無法獲得更多商業(yè)應(yīng)用的數(shù)據(jù),從而不能提供一個(gè)通用的應(yīng)用人工智能系統(tǒng)。

據(jù)此普強(qiáng)提出發(fā)展一種可重復(fù)復(fù)用的機(jī)制,將這個(gè)機(jī)制靈活的應(yīng)用到每一個(gè)客戶業(yè)務(wù)場(chǎng)景上,當(dāng)這個(gè)機(jī)制應(yīng)用到特定場(chǎng)景上時(shí),會(huì)按已成功的案例,做梳理業(yè)務(wù)邏輯并同時(shí)在客戶內(nèi)的私有云上采集數(shù)據(jù),再用成功案例的深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò),機(jī)器學(xué)習(xí)算法架構(gòu)來訓(xùn)練、測(cè)試、驗(yàn)證模型,最終上線運(yùn)行業(yè)務(wù)邏輯,提升業(yè)務(wù)價(jià)值及效益。這樣的機(jī)制主要包含兩項(xiàng)重要元素,方法論和計(jì)算技術(shù)框架:

l方法論:對(duì)行業(yè)及業(yè)務(wù)場(chǎng)景整理出流程和規(guī)則,并按此流程和規(guī)則采集積累海量的數(shù)據(jù)。

l計(jì)算技術(shù)框架:按實(shí)際應(yīng)用場(chǎng)景,建立算法框架,框架是由各類已驗(yàn)證后的神經(jīng)網(wǎng)絡(luò)和機(jī)器學(xué)習(xí)算法構(gòu)成的體系,對(duì)每一應(yīng)用場(chǎng)景作全框架計(jì)算測(cè)試評(píng)估,研判出最優(yōu)的神經(jīng)網(wǎng)絡(luò)架構(gòu)和機(jī)器學(xué)習(xí)算法,并同時(shí)調(diào)試參數(shù)和配置。

普強(qiáng)在金融及相關(guān)領(lǐng)域,積累十年以上的人工智能行業(yè)落地經(jīng)驗(yàn),專注于垂直領(lǐng)域,歸納成功的案例、相關(guān)的業(yè)務(wù)流程規(guī)則和算法算力需求,建立起一套完整的機(jī)制。隨著客戶的業(yè)務(wù)需求變化和成功案例積累,不斷的擴(kuò)充加強(qiáng)優(yōu)化此機(jī)制,作快速的迭代。

五、成功案例分享

A保險(xiǎn)公司為名列世界500強(qiáng)的保險(xiǎn)公司(在本文開頭已有提及),普強(qiáng)將語義分析機(jī)制應(yīng)用在A保險(xiǎn)公司的電銷業(yè)務(wù)里,項(xiàng)目一期應(yīng)用在A保險(xiǎn)公司兩個(gè)主要的業(yè)務(wù)區(qū):BJ市和TJ市。對(duì)大約250萬的客戶電銷通話錄音(約400萬通錄音)作落地實(shí)施,其中包括了下列的步驟:

l業(yè)務(wù)梳理:與客戶業(yè)務(wù)人員交流,以對(duì)客戶的業(yè)務(wù)做深度的了解,與普強(qiáng)機(jī)制框架對(duì)接。

l分析流程建立:分析客戶業(yè)務(wù),建立流程,優(yōu)化流程。

l客戶特征篩選:基于普強(qiáng)的業(yè)務(wù)成功案例,使用大數(shù)據(jù)分析,抽取潛在具有購買意愿客戶特征。

l成交相關(guān)度計(jì)算:經(jīng)由普強(qiáng)大數(shù)據(jù)分析框架計(jì)算客戶特征與成交的相關(guān)度,排序客戶特征的優(yōu)先順序。

l模型建模/訓(xùn)練:普強(qiáng)計(jì)算技術(shù)框架對(duì)最優(yōu)最先進(jìn)的神經(jīng)網(wǎng)絡(luò)架構(gòu)和機(jī)器學(xué)習(xí)算法,作架構(gòu)和算法評(píng)估,測(cè)試不同架構(gòu)和算法的效益優(yōu)劣,及計(jì)算資源需求以及是否能達(dá)到客戶的時(shí)效要求等工作,最終推薦最優(yōu)的架構(gòu)/算法。

l測(cè)試:使用海量的數(shù)據(jù)不斷的測(cè)試,并調(diào)優(yōu)參數(shù),達(dá)到準(zhǔn)確率、召回率等測(cè)試標(biāo)準(zhǔn)的要求,并依照業(yè)務(wù)模式計(jì)算相對(duì)的業(yè)務(wù)效益。

l驗(yàn)證:實(shí)際推送普強(qiáng)業(yè)務(wù)流程算法推薦的潛在客戶,驗(yàn)證成交率。

l上線:將最終驗(yàn)證通過的整體機(jī)制上線,進(jìn)入實(shí)際業(yè)務(wù)運(yùn)行。

與使用普強(qiáng)機(jī)制前業(yè)務(wù)情況對(duì)比的成效如下:

l精準(zhǔn)的推薦占總量約15% 的潛在有購買意愿的優(yōu)質(zhì)客戶。

l推薦的15% 的客戶覆蓋了 90% 的業(yè)績(jī)。

l節(jié)省了80%+ 的電銷電話,人員時(shí)間。

l并減少了對(duì)沒有意向購買客戶的干擾。

l確定了潛在購買客戶的特征,作話術(shù)優(yōu)化的依據(jù),有定向的與客戶對(duì)話以確認(rèn)是否是有所確定的特征。

l發(fā)掘了電銷流程的缺失:發(fā)現(xiàn)高購買意向客戶的跟蹤力度不及時(shí)或遺漏的情況,建立追蹤系統(tǒng)及時(shí)找回遺漏的潛在客戶并跟進(jìn)。

六、結(jié)語

隨著計(jì)算力和云存儲(chǔ)容量的大幅提升,海量數(shù)據(jù)的收集,使得以往不能突破的人工智能問題均得到突破:如語音識(shí)別、圖像識(shí)別、語義理解等領(lǐng)域。借著這些突破,許多商業(yè)場(chǎng)景都能應(yīng)用這些最新的人工智能突破,而產(chǎn)生實(shí)際的商業(yè)效應(yīng)。

本文中敘述了語音識(shí)別和語義理解在特定的垂直領(lǐng)域中的應(yīng)用,并詳述案例和其應(yīng)用的效益。此種效應(yīng)隨著科技的進(jìn)步和突破,必能擴(kuò)及更多的場(chǎng)景和商業(yè)應(yīng)用。本文中所述的方法論和技術(shù)計(jì)算框架也必定會(huì)不斷的迭代更新和擴(kuò)充,帶給實(shí)際的業(yè)務(wù)更多的效益。