應用

技術(shù)

物聯(lián)網(wǎng)世界 >> 物聯(lián)網(wǎng)新聞 >> 物聯(lián)網(wǎng)熱點新聞
企業(yè)注冊個人注冊登錄

夸客金融郭震洲:大數(shù)據(jù)改造金融業(yè)

2017-12-22 10:44 億歐智庫

導讀:隨著大數(shù)據(jù)時代的來臨,精算也實現(xiàn)了升級。可以依托數(shù)據(jù)挖掘技術(shù)、數(shù)據(jù)存儲技術(shù),實現(xiàn)更全面的統(tǒng)計分析,不僅僅是樣本抽查,而是更大范圍的數(shù)據(jù)運算,實現(xiàn)了“大數(shù)據(jù)+精算”的精準化飛躍。

26.jpg

  圖片來自“123rf”

  在互聯(lián)網(wǎng)時代,大數(shù)據(jù)在各類產(chǎn)品、營銷方面做出了巨大貢獻。其實在金融領(lǐng)域,大數(shù)據(jù)更為密不可分。金融是數(shù)據(jù)利用極高的行業(yè),在大數(shù)據(jù)這個概念還未興起前,數(shù)據(jù)已經(jīng)深入金融的多個領(lǐng)域,以各類產(chǎn)品形式實現(xiàn)了不小的產(chǎn)出。

  大數(shù)據(jù)的外延表現(xiàn)為各種信息的積累,這些信息以結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù)進行存儲,并形成海量數(shù)據(jù),以簡單的人工分析已經(jīng)難以去覆蓋所有數(shù)據(jù);其內(nèi)在是知識,是指導商業(yè)行動有效率、有效果的能力。大數(shù)據(jù)對金融的改造觸及了方方面面。

  保險:數(shù)據(jù)是產(chǎn)品的基石

  精算理論體系是保險行業(yè)科學發(fā)展和經(jīng)營的重要基礎(chǔ)。保險產(chǎn)品大量依靠精算,進行各類數(shù)據(jù)統(tǒng)計,計算各類情況發(fā)生概率,制定產(chǎn)品費率。精算體系了解每一項產(chǎn)品的相關(guān)業(yè)務所處的環(huán)境背景以及其面臨的風險,并以此為核心進行分析,將相關(guān)的大數(shù)據(jù)利用各種統(tǒng)計方法進行分析,去監(jiān)測各種情況,包括風險可能發(fā)生的概率,并以此作為保費等費率的重要制定因素,這些風險包括理賠發(fā)生概率、理賠額度大小、騙保的可能性等。過去,這個過程非常類似于數(shù)學統(tǒng)計工作,以樣本抽查等傳統(tǒng)方式進行測算,掌握規(guī)律。

  隨著大數(shù)據(jù)時代的來臨,精算也實現(xiàn)了升級??梢砸劳袛?shù)據(jù)挖掘技術(shù)、數(shù)據(jù)存儲技術(shù),實現(xiàn)更全面的統(tǒng)計分析,不僅僅是樣本抽查,而是更大范圍的數(shù)據(jù)運算,實現(xiàn)了“大數(shù)據(jù)+精算”的精準化飛躍。

  保險產(chǎn)品也為此獲得了更細分的深入挖掘:大數(shù)據(jù)為幫助保險產(chǎn)品的定價精準化和差異化。舉例來說,阿里巴巴運費險的進化演變就是利用大數(shù)據(jù)的成果,最初是統(tǒng)計定價,通過精算定價根據(jù)歷史事件率定期更新,從而預測分析改進精度,最終以機器學習極速核賠決策,通過各種算法實現(xiàn)差異化定價。

  證券:潛移默化的大數(shù)據(jù)

  證券行業(yè)可以說是普羅大眾認知度最高的金融細分行業(yè),經(jīng)過多年的普及和推廣,大數(shù)據(jù)已經(jīng)潛移默化地深入每位股民的日常交易中。

  證券行業(yè)有極其深厚的大數(shù)據(jù)基礎(chǔ),即行情數(shù)據(jù)。不論是財經(jīng)網(wǎng)站的股票行情圖,還是大智慧、通達信等行情軟件(包括App),其背后都包含了海量的數(shù)據(jù)。市場上每一個交易者的買賣都是一個數(shù)據(jù)信號,而這行信號通過交易所后臺的處理,形成了一個個原始數(shù)據(jù)包,然后由數(shù)據(jù)服務商進行處理,形成了可視化的行情圖,這是一個非常復雜的過程。譬如每一根K線包含了最高價、最低價、開盤價、收盤價、成交量等數(shù)據(jù)。而在此基礎(chǔ)上,證監(jiān)會的信息披露條例,又增加了各種機構(gòu)持倉數(shù)據(jù)、公告數(shù)據(jù),實現(xiàn)了證券大數(shù)據(jù)的3D透視。

  基于成熟的大數(shù)據(jù),證券行業(yè)的相關(guān)產(chǎn)品不斷推陳出新,簡單舉例,在2005年前,由于長期熊市,股民數(shù)量銳減,在利潤稀薄的情況下,當時的產(chǎn)品主要是門戶網(wǎng)站的行情圖。

  2006年至2007年的大牛市中,行情一方面吸引了增量資金入市,同時以基金為代表的機構(gòu)投資者入市,培養(yǎng)了大量的基民。基于這樣的背景,東方財富、證券之星、金融界等證券門戶網(wǎng)站先后推出基金凈值估算數(shù)據(jù)。該產(chǎn)品上線后,備受好評,給門戶網(wǎng)站帶來很大比例的流量。該產(chǎn)品的成功在于:基于基金公司持倉數(shù)據(jù)+交易所的基金凈值計算公式+持倉股票當日變動+自有參數(shù)幾個關(guān)鍵要素,在盤中就能以行情圖的可視化界面,體現(xiàn)基金凈值的大致波動。這一產(chǎn)品的數(shù)據(jù)全都是公開數(shù)據(jù),只有自有參數(shù)是一個變量。該產(chǎn)品受到了股民和基民的雙重青睞,基民可以實時了解所買基金的變化(基金凈值由基金公司每日收盤后公布一次,盤中不顯示),股民則可以根據(jù)估算凈值和基金公司盤后公布的實際凈值進行對比,根據(jù)其每日的差額變化去預測基金調(diào)倉,從而成為買賣股票的一大判斷依據(jù)。

  2010年股指期貨推出后,基于大數(shù)據(jù)的投資產(chǎn)品突然爆發(fā),并一度引發(fā)金融機構(gòu)對MATLAB(MathWorks公司推出的一款軟件)程序員的招聘潮。股指期貨上線后,以“一價定律”為理論基礎(chǔ)的套利產(chǎn)品被市場熟知。機構(gòu)投資者通過量化方式,推出了各種對沖套利產(chǎn)品。這類產(chǎn)品以股指期貨為主要必選標的(一腿交易),以及相關(guān)的指數(shù)基金或者進行優(yōu)化后的加強型指數(shù)基金為另一腿標的(在某指數(shù)所統(tǒng)計的大量股票中進行優(yōu)選,選擇其中強勢股,按照指數(shù)計算的權(quán)重進行配置,力求配置組合的表現(xiàn)高于該指數(shù)),進行雙邊多空套利,賺取價差。

  此后的一段時間內(nèi),期貨獲得了金融機構(gòu)的重視,商品期貨的相關(guān)產(chǎn)品也不斷推出,并從最初簡單的跨期套利、跨產(chǎn)品套利、期限套利逐漸發(fā)展為高頻套利、高頻交易(寬客)。由于當時大部分的金融量化模型,在落地層面,都是以MATLAB撰寫,因此這一時期,MATLAB工程師成為了金融機構(gòu)的熱招人才。

  不過,在光大“烏龍指”事件后,監(jiān)管層對量化產(chǎn)品非常謹慎,因此以A股為標的的全自動量化產(chǎn)品逐漸轉(zhuǎn)變?yōu)榘胱詣影肴斯ぎa(chǎn)品(交易下單由人工進行,交易的時間價位由智能策略提供)。之后,在2015年股災后,股指期貨的持倉量、成交量、保證金比例、傭金都被限制,因此相關(guān)套利產(chǎn)品逐漸失去了生存土壤。不過隨著期權(quán)等衍生品的問世,金融基礎(chǔ)產(chǎn)品多樣化將推進大數(shù)據(jù)、金融量化在證券領(lǐng)域的步伐。

  另一方面,金融大數(shù)據(jù)的商品化也最為成熟,在A股上,投資者早已了解信息的重要性,因此愿意以金錢去購買數(shù)據(jù),正因為如此,在證券大數(shù)據(jù)領(lǐng)域,誕生了多家金融數(shù)據(jù)類上市公司。

  信貸:創(chuàng)新基礎(chǔ) 數(shù)據(jù)驅(qū)動

  在信貸領(lǐng)域,大數(shù)據(jù)呈現(xiàn)兩極分化格局。信貸領(lǐng)域的大數(shù)據(jù)主要是征信數(shù)據(jù),這一數(shù)據(jù)呈現(xiàn)兩極分化局面。一方面,針對大型企業(yè)的財報類數(shù)據(jù),央行系統(tǒng)的征信報告已經(jīng)形成了較為成熟的覆蓋,有了成熟的體系。另一方面,針對個人和小微企業(yè)的普惠領(lǐng)域,則數(shù)據(jù)缺乏,有待完善。

  大企業(yè)通過銀行信貸、公開發(fā)債等方式進行融資,對于大企業(yè)資質(zhì)等數(shù)據(jù)主要從財報數(shù)據(jù)、股東背景等進行判別,對于這些數(shù)據(jù),經(jīng)過長時間積累,央行體系有了健全的征信數(shù)據(jù)庫。同時,國內(nèi)四大評級機構(gòu)(中誠信、聯(lián)合資信、大公、上海新世紀)也有多年經(jīng)驗,并形成了健全的產(chǎn)業(yè)鏈。

  在個人和小微企業(yè)領(lǐng)域,則有較大比例的缺口。根據(jù)中國人民銀行的公開數(shù)據(jù)顯示,有信貸記錄的人群基本在4億人左右,征信中心有效覆蓋人數(shù)則達到9億人之多,也就意味著個人征信記錄覆蓋到45%上下,而美國的費埃哲公司(FICO)數(shù)據(jù)覆蓋率為95%。從這份數(shù)據(jù)上,能顯而易見地看到由征信數(shù)據(jù)嚴重不足所帶來的互聯(lián)網(wǎng)金融的信貸隱患。

  企業(yè)層面,由于小微企業(yè)大部分屬于輕資產(chǎn)企業(yè),可抵押資產(chǎn)有限,與傳統(tǒng)信貸機構(gòu)的信用審核體系匹配度有限,風險管理成本高企。而近年來創(chuàng)新、創(chuàng)業(yè)爆發(fā),這些企業(yè)多數(shù)為服務行業(yè),在初期對資金有很大的需求,因此造成了小微企業(yè)的融資痛點。據(jù)公開數(shù)據(jù),我國中小微企業(yè)已經(jīng)超過7300萬家。然而,獲得貸款能力依然較弱。

  同時,個人消費信貸的市場同樣潛力非常巨大。尤其隨著90后、00后消費崛起,年輕人生活環(huán)境的變化,導致了他們存款意識與過去不同。同時,隨著各種支付渠道的突破,他們更愿意杠桿消費、透支消費。但是由于數(shù)據(jù)的匱乏,導致了信貸運用層面,大數(shù)據(jù)發(fā)展趨緩,未來的突破將源于數(shù)據(jù)的完善和技術(shù)運用的創(chuàng)新。

  在數(shù)據(jù)完善層面,個人征信數(shù)據(jù)在2015年實現(xiàn)了質(zhì)的突破,包括芝麻信用、騰訊征信在內(nèi)的八家機構(gòu)在人民銀行政策的引導下,開始籌建個人征信業(yè)務。雖然時至今日還未正式發(fā)放征信牌照,但市場在此推動下,涌現(xiàn)出一大批數(shù)據(jù)公司,進行數(shù)據(jù)采集,為個人征信提供基礎(chǔ)建設。盡管目前個人征信發(fā)展有待提速,市場也還未形成統(tǒng)一標準,但這只是行業(yè)發(fā)展之初的陣痛期,一旦相關(guān)政策細則落地,市場理清邏輯,個人征信將迸發(fā)出巨大潛力,成為信貸領(lǐng)域大數(shù)據(jù)的有利支持,促進信貸行業(yè)的多層次發(fā)展。

  在運用層面,隨著互聯(lián)網(wǎng)金融的發(fā)展,風控模型、量化技術(shù)被運用在風險管理層面,大數(shù)據(jù)在風險管理的權(quán)重會越發(fā)突出。這一層面的典型運用主要是信貸工場:信貸工場利用消費場景、大數(shù)據(jù)、反欺詐系統(tǒng)、決策引擎等金融科技手段結(jié)合專家智慧進行風險管理,通過量化系統(tǒng)和自動化操作,提高運營效率,減少人工操作,降低操作風險和運營成本。

  新技術(shù)、新方法的使用,將信貸工場打造為“決策流+工作流”的集合。信貸工場大量運用金融模型和機器學習等智能化手段,包括錄入環(huán)節(jié)引入手機App,提升用戶體驗,信審和反欺詐環(huán)節(jié)引入金融模型提高判斷效率等。

  與傳統(tǒng)風控流程相比,信貸工場更智能、更高效,大量的判斷和機械操作都由機器完成,節(jié)省了人力降低了人工操作誤差,并通過機器學習的能力,不斷優(yōu)化、提升信貸工廠的風險定價能力。同時,智能化的人機結(jié)合,也賦予了信貸工場打造優(yōu)質(zhì)普惠金融資產(chǎn)的底氣。

  金融是一個與數(shù)據(jù)息息相關(guān)的行業(yè),大數(shù)據(jù)變革金融是歷史趨勢,同時也是漸進發(fā)展的過程。目前的變革僅僅是大數(shù)據(jù)對金融改造的開始,隨著數(shù)據(jù)挖掘技術(shù)的不斷推陳出新,越來越多的概念走向商業(yè)化產(chǎn)品,大數(shù)據(jù)將對金融形成大規(guī)模的改造,未來金融已經(jīng)跟以前完全不一樣,將是一個普惠與個性化共存的多層次金融體系,實現(xiàn)更大的資產(chǎn)管理規(guī)模、更廣闊的服務覆蓋。