搜狐首页 财经 法医秦明

手机搜狐

SOHU.COM

现在的大数据风控还只是个宝宝

我们希望和这个时代并肩前行,不嘲笑马车,更不会拒绝汽车的拥抱!

我们会尽力为亲们屏蔽过多过乱的信息噪音,力争做一个好的观察者!

现在搞金融行业,开口闭口不谈大数据,简直就像是出门没穿衣服一样丢人。老猫虽然碍于情面,有时也不免对大数据高谈阔论,不过静下心来,却还是觉得现在的大数据风控有诸多不足之处,套用网络俗语来看,还只是个宝宝。

我们没有经历过一个完整的信贷周期

美国的征信行业从创始至今已经走过了超过100年的时间,涉及到资本市场信用机构有Standard and Poor’s(标准普尔)、Moody’s(穆迪)、Fitch(惠誉),普通企业信用机构有DunBradstreet(邓白氏),个人征信方面则有Experian(益博睿)、Equifax(艾可菲)、Trans Union(全联)。可以看出美国的征信机构业务集中且覆盖市场的方方面面,其中的数据更是长达了几代人的时间,经历过数次遍及全球的金融危机,这样的数据是经得起市场和时间的检验的,个人信用记录涉及到的每个人美国人生活的方方面面。

而中国人民银行的个人信用信息基础数据库建设最早始于1999年,2005年8月底才完成与联网运行,算到2017年,可能其中大部分人连商品房的房贷都没有还完,更不必说小额消费贷款这样最近几年伴随着网购才在中国发展起来的新生事物,不少新近成立的消费金融公司的种子客户都还在第一轮的还款当中。而且个人征信还远未到影响到我们生活的地步,很多人对此不重视也造成了信用记录的缺失。在数据本身都存疑的情况下,与之相匹配的评分标准、贷款额度、逾期率等都没有经过检验,这是目前大数据风控所被人诟病的最主要的方面。

不要忘了中国到目前为止始终处于一个上升的经济周期内,倘若未来处于经济下行阶段,目前积累的数据和模型还是否有效,是一个很大的未知数。

积累的样本离“大”数据还差得很远

我们老说大数据大数据,但对于什么样的数据可以称之为“大”,恐怕很少有人能得出概念。一个经营的很好的P2P平台有着几万到几十万用户的投资数据,而一些搞征信企业拥有百万级的用户数据就可以称自己是“大数据”了,即使是央行,也仅仅拥有3.8亿人的信贷记录。

这样的数据规模,应用到拥有十三亿人国家的市场中,可以说远远的不够。中国的贫富差距之大,地区和地区间发展的极不均衡,让单一的数据模型很难适用于每个消费群体。而且不少企业都把自己积累的消费数据作为企业的“秘密”,生怕竞争对手获取到这些信息,这更加剧了信息之间的不流通,使得数据样本与实际产生偏差,恶意套现的组织也利用这一漏洞,用同样的资料在不同平台之间进行套现。现在许多消费金融公司组建起了生态联盟,在联盟内共享黑名单,就是希望依靠联盟来扩充数据容量以增强数据的准确性。

精选