大數據風控很好,但過度的吹,就變成了黑_風聞
镭射财经-立足数字化思维,深挖新商业故事。2020-07-04 17:56

來源 | 雲上言 作者 | 劉波
1
凡事過猶不及,當整個市場都在談論大數據風控,都在吹捧機器學習時,危機已經悄然而至。
不僅是金融科技公司在談,互聯網巨頭在談,整個銀行圈也在談。
城商行、農商行覺得這是彎道超車的機會,國有大行害怕錯失新技術的窗口,金融科技公司對誰都在鼓吹。
尤其在疫情發生後,金融業的無接觸服務從之前的可選項一下子變成了必選項,出門不談點大數據,都不好意思見人。
疫情期間,我在線聽了不少金融科技公司專家的論壇發言,不少人有真才實學,讓我和自己的從業經驗交相印證,獲益良多。但更多人的觀點和方法論讓我越聽越心驚,而這些發言者中,很多已經是金融科技上市公司的高管,他們服務的銀行非常多,這讓我不禁深深的擔憂。
銀行部分業務朝線上化轉型當然是方向,科學的數據化決策當然是很好的路徑,但販賣焦慮,甚至神話大數據風控,大可不必。
我的職業生涯,在阿里參與了中國第一家互聯網小貸的建設,在螞蟻第一次籌建互聯網銀行並管理它的主要業務,到新網銀行第二次籌建互聯網銀行並分管所有資產業務、賬户和存款理財,我的整個職業生涯都與互聯網、大數據、金融這幾個關鍵詞相伴。
我當然不排斥大數據風控,從我的從業經歷可以看出,我是它最早的嘗試者和推動者之一。
我一直在行業一線,細數一下,這些年從我直接管理部門發放的全在線小微貸款超過了1萬億元(不含聯合貸),消費信貸超過了4000億元(含聯合貸)。但今天,我發現自己已經聽不懂這個市場上的某些專家在説些什麼。
2
金融業務的風險決策,是一個數學問題,但絕不僅僅是一個數學問題。決策樹、樸素貝葉斯分類、支持向量機、邏輯迴歸、線性迴歸、隨機森林……這些算法是工具,是方法,但不能也不應該是決策的全部。
我看到很多的風控團隊,有些甚至是國內一線公司的風控團隊,清一色數學、統計學高學歷技術專家,基本就是在電腦前研究算法,研究數據。他們給出的每一個判斷,都有詳細的數據支撐,他們每一次調整,都貌似接近當下最優解。
你很難挑戰他們,因為他們掌握數據,你個人的經驗又怎麼能挑戰動輒幾百萬的數據樣本呢?
但很多人不瞭解,同樣的數據,解讀是具備多角度的。由於數據本身具備複雜關聯性,數據呈現的背後又有更多的原因,數據本身就會“騙人”。
看似對,有時候要比明顯的錯危害大得多。
科學的決策,不但需要適合的工具,還需要深刻了解你的業務場景,深刻了解你的客户,算法是為了決策服務,而不應該成為決策本身。
3
這麼説太抽象,舉一些例子吧。
主流銀行(我不喜歡用傳統銀行這個詞,主流銀行更為準確)信貸風險控制,最看重兩點:一是貸前審批控制違約概率(PD),二是貸後處置降低違約損失率(LGD)。
為了控制違約概率,必然要求客户提供多項資料去證明有能力有意願歸還貸款,銀行流水、收入證明、社保公積金、房產證、車輛行駛證都是為了證明這件事——我不一定讓你抵押,但你需要證明你有哪些。
公務員、企事業單位、銀行從業人員、知名企業的員工更容易獲得貸款,無它,認為你收入穩定,違約成本高,違約概率低。
降低違約損失率的方法也很簡單,就是尋找優質抵押品,由於中國的房價在去年以前穩定的上漲了二十年,在過去二十年裏,房產抵押是最為吃香及穩妥的抵押物,其次就是汽車。這二十年裏,銀行做零售貸款很粗放但很有效,房屋按揭貸款幾乎是銀行零售貸款的全部。
我並不覺得複雜模型算法比這些簡單直接的方法更高明,控制風險更有效。
簡單説,要是能方便的獲取到這些核心信息,很多時候沒有必要獲取客户各種行為數據,做複雜的風險相關性分析。
數據是有成本的,數據的獲取是需要客户授權的。如果一個客户幾十K核心數據就能決策,幹嘛非要分析上百兆的數據呢?
單户上百兆數據,為了節省成本,還得研製複雜的數據路由規則,讓單户數據成本可控。
這麼多數據標籤要進入模型,得考慮缺失度容忍問題,否則模型運轉不起來,運轉起來效果可能也不好,這就需要一套複雜算法。
另外,還要考慮數據源的可替代性,否則一旦某個關鍵數據源出現問題,就是大癱瘓,這又是一整套複雜工程。
所以説,複雜並不代表先進,簡單並不代表不好,關鍵是匹配你的業務,匹配你能掌握的資源。
大數據風控很好,但過度的吹,就變成了黑。
4
談了主流銀行,也要談談我心目中比較適配的大數據風控是什麼樣的。真正好的大數據風控,應該是充分利用你所匹配的資源,有一條清晰的風控邏輯主線。
不來虛的,直接上乾貨。
花唄產品設計之初,它的風控充分利用阿里巴巴、螞蟻的海量交易數據,它的底層邏輯是馬斯洛需求理論:生理的需要,安全的需要,情感的需要,尊重的需要,自我實現的需要。
在這套理論下,你買同樣金額的柴米油鹽和你買魚竿、單反獲得的模型評價是不一樣的,而且監測的不是你的單次購買行為,而是你的消費習慣,這是花唄起步時風控的邏輯主線。
淘寶貸款的風控,表面上看是純信用貸款,但由於阿里巴巴強大的生態圈,可以從交易、資金、物流多方面監測商家。所以淘寶、天貓的商家不必提供任何資料,甚至不必查詢徵信,就可以直接評估信貸額度和利率。
淘寶貸款的授信,只看我給商家帶來了多少銷量和利潤,保證你的信貸額度小於違約成本就能保證貸款安全——我能幫你賺10萬元,給你8萬元貸款,你若不還,10萬元利潤就沒了,而且店都沒了,你到底還不是不還?
更何況,你的所有銷售額都在支付寶上,你的所有客户都在淘寶、天貓上。
淘寶、天貓貸款風控邏輯的本質是店鋪質押貸款。
微粒貸最初的白名單客户,來自於騰訊以及已識別優質企業員工的關係鏈,騰訊最強大的數據源是可以清晰的通過關係鏈定義出你整個的人生軌跡和社交圈。
你上哪個小學,你上哪個中學,你上哪個大學,你在哪家企業工作,你在哪個圈層,可以通過你的同學、朋友、同事清晰的定位。正是因為此,微粒貸才可以在你未申請貸款前,就把你貸款的額度利率算好,直接呈現在你面前。
關係鏈,是微粒貸發展初期的風控邏輯主線。
新網銀行本身不掌握任何場景和數據,但它的平台化戰略可以通過合作,梳理出清晰的風控邏輯主線。
做網貸存管,不是像其他銀行一樣為了存款,而是為了從源頭摸清非銀互金機構的多頭借貸數據,這些是珍貴的第一手也是獨家的數據源。
和工行、銀聯、移動、以及眾多國民APP的互聯網巨頭合作,也不僅僅是為了獲客,更重要的是充分利用雙方優勢建模。
沒有什麼一蹴而就的妙招,需要的是戰略上的堅持和戰術上的勤奮。
談了這麼多,舉了這麼多例子。無非向大家表達,數據是中性的,算法本身只是工具,可以推崇但不要過分神化。你的風控體系如何設計,需要的不僅僅是大數據專家,更重要的是充分理解和分析機構本身所處市場,瞭解清楚你的優勢是什麼?你的潛在客户在哪裏?
沒有絕對好的方法論,只有適合的。