百度金融 “般若”打造風控整體解決方案
人工智能時代到來,作為AI最重要的商業變現場景,金融業的競爭更加集中為流量、大數據的競爭。在數據為王的AI時代,金融業也更加回歸“經營風險”的本質,風控成為智能金融競賽的核心單元。近日,百度集人工智能和大數據技術優勢,針對金融行業的痛點,推出大數據風控平台——“般若”,加快業務探索和佈局。
智慧搜索數據 支撐“般若”平台
“般若”一詞,是梵語Prajna的音譯,意為“終極智慧”、“辨識智慧”,專指如實認知一切事物和萬物本源的智慧。在紛繁複雜的現象中辨識萬物的本源,這是般若的本意,也是百度金融大數據風控平台的寓意:在紛繁的世界中,幫助更多金融機構和合作夥伴,共同建立一個持續共贏的成長生態。百度金融“般若”大數據風控平台的辨識能力首先來自於百度的“智慧”數據。
通常來説,電商數據主要包括銷售數據、用户購買行為數據、商品數據、客户諮詢數據、售後服務數據、推廣投放數據、營銷活動數據,以及網站整體運營數據等,其優點是便於商品運營、用户運營和產品運營,相較搜索大數據來説,維度少,數據特徵相對集中。社交數據則擁有羣體性、關係性特徵,擁有整體社交用户的90%,日均集納流量超過160億,優點是可以對羣體動態具有較為準確的預測性等,社交數據的缺陷在於存在一定的風險和漏洞,如容易被人為操作,數據單一維度的造假容易,代價低。
BAT的數據各具特色,相比阿里巴巴在消費領域具有較強數據,騰訊在社交領域佔據優勢,百度具有海量的搜索數據。由於百度擁有中國互聯網領先的流量資源,百度搜索大數據的特徵是高維、稀疏的,數據涵蓋人口屬性、興趣關注、消費場景、常駐位置、信用評分、APP行為等,擁有豐富的維度可以做更精準的用户畫像。
智慧服務 提供場景化一體化解決方案
在AI時代,金融業的痛點包括獲客難、技術升級快、風控成本高等。在基礎數據上,金融領域普遍面臨樣本集羣不大導致的數據高維、稀疏、小樣本的難題。
從行業面臨的痛點和挑戰上看,“般若”平台通過百度獨有的數據特徵和算法,提出了整體解決方法:百度的“般若”風控平台,可一一破解難題:百度的梯度增強決策樹可以聚合大數據高維特徵,可以實現高維數據降維、增加風險區分度;百度的深度學習,將特徵嵌入,利用關聯挖掘等解決數據稀疏問題。“從3000+降維至400維,可將行為的風險區分度有效提升5%+”,而基於百度數億級用户數據,通過圖計算,可將信用標籤傳遞,豐富信貸樣本。
通過AI技術,百度金融對大數據進行處理、歸類,梳理除很多數據特徵。例如,通過Boosting算法,對大量的數據觀測後進行學習,通過函數表達,在這些高維的數據中可以總結出一些特徵。有了這些特徵,就基本可以定義一個用户,無需把數據全部都集中在一起了。在數學上,這樣的表達也可以描述為,這些數據都被分類在各個分類器裏面,只要掌握了分類器的函數表達,每一個分類器裏面的數據差異就可以忽略了。
百度金融技術負責人許冬亮在2017年百度世界智能金融分論壇上展示了”般若”的成績單:在信用領域,央行徵信數據加百度數據可以將客羣的風險區分度提升13%;在反欺詐領域,百度已擁有百億節點、五百億邊的關聯網絡,可以提升識別騙貸團伙的成功率。

同時,百度金融所提供的解決方案是場景化、一體化的。百度“般若”系統實現覆蓋信貸全業務流程,包括貸前(智能獲客)、貸中(審批授信)、貸後(監控催收)。貸中包括身份的核驗,針對黑產的欺詐識別,以及信用風險度量等多種技術手段的運用。貸後對貸款進行監控、催收、復聯等。
許冬亮表示,百度智能金融的目標是成為一家真正意義的金融科技公司,在實現初心的道路上,“般若”通過釋放百度金融的科技的能力,不斷實踐,讓它有能力逐步涉足到傳統金融機構受制於風控水平而無法涉足的領域,擴寬金融服務邊界,讓更多人享受到更優質、安全、高效的金融服務。