金融創(chuàng)新很大一部分原因在于大數據和金融之間的結合??v觀BAT、京東、小米、萬達、平安這些把觸角伸到互聯網金融領域的巨頭,無一不是在大數據層面上有所布局。大數據和金融相結合,幾乎已經成為金融領域的通用做法。
金融數據的含金量
談數據必須先談數據的完整度和價值含量。就像煤礦一樣,大數據中的價值含量、挖掘成本比數量更為重要。非結構化數據,就像是有雜質的煤礦,無法直接使用。大數據還需要進行脫敏、提純、結構化,才能變成可以被直接運用于商業(yè)層面的有價值的信息。
金融數據作為專業(yè)度要求更高的數據尤為如此。對于BAT三家而言,布局其實都比較完整。2015年年底的時候,阿里集團透露,在阿里數據平臺事業(yè)部的服務器上,攢下了超過100PB已處理過的數據。
BAT三家公司,數據體積相差不會太多, 三家?guī)缀醵加蠰BS、交易、社交等一系列不同維度數據,只是能力有所區(qū)別。
三家數據核心優(yōu)勢可以如此簡單劃分——
百度:基于搜索而誕生的公共數據、需求數據。百度的優(yōu)勢在于數據最全面,數據樣本比較復雜,數據的廣度和多樣性上比較強,擁有核心技術和數據礦山,而且是一座富礦;
阿里:基于淘寶天貓業(yè)務而誕生的電商數據、信用數據。阿里的核心業(yè)務在電子商務上,數據比較聚集,更容易做分析。這種數據類型的優(yōu)勢在于,更容易變現,挖掘出商業(yè)價值;
騰訊:基于微信、QQ誕生的社交數據、關系數據,以及游戲數據,相對較雜。不過,容易分析人們的生活和行為,從里面挖掘出商業(yè)、健康等領域的信息;
大數據領域有這樣一種說法——所有的數據都是風險數據。而拍拍貸風險副總裁顧鳴博士之前提出過一個金字塔結構圖。
在這張圖中,征信數據位于金字塔的頂端。往下走是消費數據、運營商數據、社交數據、行為數據以及其他數據。越是靠近金字塔的頂部,大數據在風控領域的應用就會越直接,獲取數據的難度隨之增加,覆蓋率當然會降低;相反,越是靠近金字塔的底部,大數據在風控方面的應用難度就越大,但是數據的數量和覆蓋率都會變大。
把BAT三家套入這個金字塔結構中就會發(fā)現。阿里的數據離變現幾乎只有一步之遙。阿里以電商-支付-信用為三級跳板,針對性很強,數據價值純度高,金融數據的集成上做的也比較完善,缺點是覆蓋面還是不夠。不過,這些年來不斷收購、入股優(yōu)酷、微博、高德等一系列企業(yè),阿里數據維度其實也在越來越豐富,也在不斷往金字塔的底層下探。
騰訊有社交、行為數據,這些數據不能直接運用,但獲取的信息會更豐富。而騰訊目前的大數據策略是先將產品補全,產品后臺數據打通,形成穩(wěn)定生態(tài)圈。本階段先利用大數據挖掘改進自己的產品。后期有成熟的模式合適的產品,則利用自家的社交及關系數據時,開展對大數據的進一步挖掘。
雖說有人認為百度和騰訊很多數據是非結構化數據,在風控上的運用難度較大,很難直接商業(yè)化。不過,這些數據恰恰是金字塔最底層的數據。在普惠金融的環(huán)境下,互聯網全域大數據帶來的價值不可忽略。
四個角度告訴你,金融大數據到底用在了哪些地方
之所以要花這么大的篇幅去談三家的數據來源,主要還是因為今天無論是金融、電商、物流、生活服務等各個領域,其實都離不開維度全面的數據。
因為數據維度越豐富,對用戶粗顆粒的畫像就會越了解。某一個畫像的用戶到底喜歡什么,都可以一清二楚地了解到。企業(yè)也能夠面對做很多有針對性的營銷。
尤其是在金融領域,企業(yè)對大數據掌握越全面,所能涉及到的業(yè)務也會越豐富。BAT數據最豐富,在金融業(yè)務領域橫亙支付、貸款、理財、保險、證券、銀行、征信、基金、眾籌等各個領域。而小米、京東、萬達等企業(yè)因為體量、數據等相對而言優(yōu)勢不大,則會在這9個領域中缺失某些領域的布局。
BAT在9個領域的布局,其實都是以大數據為核心串聯在一起的。無論是征信、風控、消費金融、財富管理都或多或少運用到了大數據。
1、大數據征信:在個人征信領域,目前是金融行業(yè)面臨的最大問題?;谟脩粼诨ヂ摼W上的消費行為、社交行為、搜索行為等產生的海量數據,其價值并未被充分挖掘,個人征信在大數據的采集和信息挖掘上面仍有很大的想象空間。阿里的芝麻信用在其中算是最會玩的。芝麻信用幾乎打通了用戶的身份特質,行為偏好,人脈關系,信用歷史,履約能力等各類信息。這恰恰是因為接入了電商、支付、社交等各類數據維度。
2、大數據風控:大數據風控目前應該是前沿技術在金融領域的最成熟應用,相對于智能投顧、區(qū)塊鏈等還在初期的金融科技應用,大數據風控目前已經在業(yè)界逐步普及。目前,美國基本上都用三大征信局的信息,最傳統(tǒng)的評分基本上都是用FICO來做的。各家平臺會嘗試著用機器學習、神經網絡等大數據處理方法。
國內市場對于大數據風控的嘗試還是比較積極。特別是大公司,可以將移動互聯網的行為和貸款申請人聯系到一起展開大數據風控。百度在風控層面上的進展還是比較突出,百度安全每天要處理數十億網民搜索請求,保護數億用戶的終端安全,保護十萬網站的安全,因此積累了大量的數據。
一個很具體的案例就是,通過海量互聯網行為數據,比如監(jiān)測相關設備ID在哪些借貸網站上進行注冊、同一設備是否下載多個借貸App,可以實時發(fā)現多頭貸款的征兆,把風險控制到最低。
3、大數據消費金融:消費金融對大數據的依賴是天然形成的。比如說消費貸、工薪貸、學生貸,這些消費型的金融貸款很依賴對用戶的了解。所以必須對用戶畫像進行分析提煉,通過相關模型展開風險評估,并根據模型及數據從多維度為用戶描繪一個立體化的畫像。
在大數據消費金融的領域中,騰訊和阿里的優(yōu)勢很大程度上是在渠道層面上的。正如前文所說的,阿里以電商-支付-信用為三級跳板,針對性很強支付寶接入消費金融產品之后會有較強的渠道作用。而在去年12月,騰訊的“微粒貸”已經接入到了微信支付當中。在消費金融的發(fā)展速度上,騰訊速度也不差。
4、大數據財富管理:財富管理是近些年來在我國金融服務業(yè)中出現的一個新業(yè)務。主要為客戶提供長期的投顧服務,實現客戶資產的優(yōu)化配置。這方面業(yè)務在傳統(tǒng)金融機構中存在的比較多。不過因為技術能力不足,大數據財富管理在傳統(tǒng)金融機構中相對弱勢。
財富管理在互聯網公司的業(yè)務中也非常流行。螞蟻金服一開始最為簡單的財富管理方式就是余額寶,后來逐漸演進成經過大數據計算智能推薦給用戶的各種標準化的“寶寶”理財產品。百度金融是依托“百度大腦”通過互聯網人工智能、大數據分析等手段,精準識別和刻畫用戶,提供專業(yè)的“千人千面”的定制化財富管理服務。
金融大數據的孿生兄弟金融云是地基,未來更具看點
大數據和云計算永遠都是相伴相隨的一對孿生兄弟。金融大數據核心工作包括三方面,即獲取數據、創(chuàng)建模型、模型在實踐中優(yōu)化、迭代。而對于金融大數據而言,金融云才是它的地基。
打個不恰當的比方,前文中說大數據是煤礦,而金融云其實就是礦井。礦井的安全行、可靠性決定了挖煤的效率和結果。
金融云把底層技術很多問題都解決了。大量金融模型都是金融云所引入的,如客戶模型、產品模型、賬務模型等。同時金融云關注金融本身的嚴謹性和周密性、安全性的考慮。
2016年7月,“騰訊云+未來”峰會上,騰訊云和騰訊金融云都已成為最重點部署的業(yè)務。同年9月,百度世界大會金融科技分論壇上,百度金融云正式向業(yè)界開放。10月,阿里云棲大會上,阿里金融云負責人則是提出將會和生態(tài)合作伙伴、服務聯盟為金融行業(yè)量身定制推出云增強服務。
大數據必須要跑在云端,而金融大數據更需要和業(yè)內其他企業(yè)展開數據、支付、業(yè)務等一系列的合作。金融云對可用性、安全性的要求嚴格,比如說對一個高度可控可信的云安全體系而言,基礎環(huán)境安全、風控與審計、數據安全三者缺一不可。而金融云在未來的競爭中將發(fā)揮越來越重要的作用。