36氪專訪人人貸顧崇倫(下):為什么說互聯(lián)網(wǎng)信貸的大數(shù)據(jù)夢,離現(xiàn)實還很遙遠(yuǎn)?
在對人人貸COO顧崇倫的上一篇專訪中,我們著重討論了該公司的模式選擇問題。站在我個人角度,之前對于人人貸的一些困惑——包括“暗箱”與透明,線上還是線下等問題——多多少少得到了解答。今天這篇專訪是對上一篇的承接,關(guān)注焦點由人人貸放大到P2P行業(yè),目標(biāo)仍然是為外界解答我們此前對于這個行業(yè)的一些疑惑和誤解,比如關(guān)于國內(nèi)外P2P的本質(zhì)差別,以及技術(shù)的能力界限等。
以下進入正文,詞句有所修改:
一、互聯(lián)網(wǎng)信貸不“互聯(lián)網(wǎng)”,源于外部數(shù)據(jù)電子化和整合程度不夠高
這個其實已經(jīng)是業(yè)界共識,中國的征信體系欠發(fā)達(dá),而且開放程度有限(比如只有銀行和當(dāng)事人才能調(diào)用征信報告),導(dǎo)致一些P2P要么模式比較重,要么干脆是輕審核的狀態(tài)。雖然國家層面有一些數(shù)據(jù)庫(包括央行和其他機關(guān)),政府也在推動信用數(shù)據(jù)的整合和開放,但沒走到這一步的時候,基本只能依靠企業(yè)自主整合來實現(xiàn)。
站在企業(yè)自主整合的角度,目前可以有學(xué)歷、工商、第三方征信等開放數(shù)據(jù),在用戶授權(quán)下,也可以拿到電商、社交等私密數(shù)據(jù)。比較理想情況下,借款用戶只需提交一個身份屬性,平臺即可以獲取完整的數(shù)據(jù)拼圖。而當(dāng)你做不到的時候,只能讓用戶自己填寫上傳資料,此時會涉及到一個數(shù)據(jù)校驗的問題。
目前國內(nèi)做P2P的邏輯是這樣:先考慮用戶的數(shù)據(jù)拼圖里需要哪些資料,能夠電子化獲取的就電子化,不能做到的,就讓用戶自主上傳,然后通過其他線上或線下手段驗證——P2P的互聯(lián)網(wǎng)化,會是一個逐步演進的過程。
二、征信是P2P的核心,大的玩家都會往這個方向走
很多P2P企業(yè),包括人人貸和陸金所,其實都想往征信的這個方向去走。大家想做征信,很大程度上也是因為自己鏈條里缺失這一環(huán)。如果國家先做了,民間當(dāng)然不用自己做,但就現(xiàn)狀而言,更多還需要民間去推動這一進程。
一般來說,真正的互聯(lián)網(wǎng)信貸需要先搜集數(shù)據(jù),然后做數(shù)據(jù)驗證,之后再根據(jù)歷史壞賬、交易記錄做審核模型。這個模型,簡單說有一些評分法,復(fù)雜一點的會做數(shù)據(jù)挖掘。 目前包括人人貸在內(nèi),各家在這一點上做得其實并沒那么好。 在數(shù)據(jù)獲取都比較困難的前提下,各種模型也只能不斷嘗試和研究。但即便如此,一些公司和機構(gòu)的在數(shù)據(jù)整合上還是會走得很快。民間走得快,國家也會跟進得快一些。國家想要將民間的一些動作規(guī)范起來,這就要求國家在數(shù)據(jù)整合和開放上的行動更加迅速。隨著P2P的受監(jiān)管地位被明確下來,相信得到認(rèn)證的P2P非常有可能拿到央行征信接口。
三、國外P2P和國內(nèi)P2P,關(guān)鍵差異在于是否提供保障機制
在顧崇倫看來,國外的P2P模式其實跟國內(nèi)不那么可比。 但是否提供保障機制,是兩者的一個關(guān)鍵差異。
Lending Club在對借款人評級的時候,能拿出一個相對公允的評級標(biāo)準(zhǔn)(FICO),這是公眾比較認(rèn)同的。國外公眾長期受到信用教育,明白不同信用數(shù)值的意義,認(rèn)同不同信用得分借不同金錢的觀念。這樣用戶可以自擔(dān)風(fēng)險,平臺審核工作可以變得很輕,這才能做成比較純粹的交易所模式。
但國內(nèi)情況是缺少這么一套公認(rèn)的評級標(biāo)準(zhǔn)。平臺自己去做評級,用戶不知道你給出的信用等級是什么意思,因此才衍生出了本息保障一類的東西,這是歷史演變的結(jié)果。理論上,本息保障、承諾收益都是不應(yīng)該存在的,整個金融行業(yè)都不能做收益承諾。但現(xiàn)實來看,中國幾乎沒有一家P2P不提供某種形式的擔(dān)保。即便是一些聲稱不參與風(fēng)險的類Lending Club模式的P2P,也在用戶投資標(biāo)的分散的前提下提供“有限保障”。
平臺不提供保障,用戶不知道憑什么做出投資決策。而且如果平臺只盯著交易量,不管風(fēng)控,也會衍生出道德風(fēng)險。 風(fēng)險誰來管,保障就由誰來做,風(fēng)控者的身份應(yīng)該和保障者合一 ——不管是自己擔(dān)保,還是由第三方做保險擔(dān)保的模式,其實都是這個邏輯。
【重點】四、互聯(lián)網(wǎng)信貸,最核心的還是結(jié)構(gòu)化數(shù)據(jù),大數(shù)據(jù)的作用十分有限
在人人貸看來,非結(jié)構(gòu)化數(shù)據(jù)對互聯(lián)網(wǎng)信貸更多的起到輔助作用,這一點長期可能也不會變。顧崇倫表示,國外的信用評估模型發(fā)展了這么多年,至今還是主要依靠借款人的收入、借款歷史、聯(lián)系方式和居住地穩(wěn)定性等傳統(tǒng)金融數(shù)據(jù)做評估,恰恰說明了這些結(jié)構(gòu)化數(shù)據(jù)的核心地位。
而對于一些非結(jié)構(gòu)化數(shù)據(jù),比如社交大數(shù)據(jù),因為其缺少明確定義、不規(guī)整的特性,只能去做一些主動性的挖掘和探索。 如果你做的是結(jié)構(gòu)化數(shù)據(jù),比如10個變量對應(yīng)1個結(jié)果,可以通過一些數(shù)據(jù)挖掘算法找到不同變量對結(jié)果的影響權(quán)重及其是否顯著有效等,結(jié)構(gòu)化數(shù)據(jù)是可挖掘的。但如果是非結(jié)構(gòu)化的數(shù)據(jù),比如社交應(yīng)用中的文字,你很難直接使用并且找到它對結(jié)果的影響,這樣的數(shù)據(jù)價值就比較低。
面對這些大數(shù)據(jù),挖掘者不知道什么東西對自己有用,只能去猜測條件和結(jié)果之間的關(guān)聯(lián),驗證關(guān)聯(lián)性后,才能把它當(dāng)做一條規(guī)則來用。比如針對借款人,雖然你可以在他的搜索行為(比如有無檢索過“信用卡套現(xiàn)”這類關(guān)鍵詞)和逾期率之間做挖掘,但事實上,這里對數(shù)據(jù)的運用還是基于人的思考。人先想到,再用數(shù)據(jù)驗證,然后才成為實施方案——這樣的東西是很難反向挖掘的。
[ 36氪 原創(chuàng)文章,作者: 沈超]