王莹
长期以来,中国征信体系以及信用数据收集一直是掣肘互联网金融发展的重要因素。在P2P网贷系统,征信数据的“正规军”和“野战军”在市场中以各自的方式立足,如何才能将双方信息统合,形成合力助力P2P网贷行业健康发展是行业极为关注的话题。
9月23日,由上海市经信委、上海市金融办指导,上海市信息服务行业协会牵头编纂的《2014上海网络信贷服务业白皮书》(下称“白皮书”)发布。书中对于该问题作出诸多探讨,在发布会上,多位业内人士也表示,目前中国征信体系尚未发生根本性变化,但征信体系对于P2P行业的重要性获得了一致的认可。
央行征信数据
不能满足P2P需求
“目前来看国内征信体系还未发生变化,亟待完善,P2P平台想要获得借款人的央行征信数据仍然要去陆家嘴拉取。”诺诺镑客董事长黄大容表示。
当前数据端发生变化是通过互联网获得的数据,例如,从淘宝数据中获取相关消费行为习惯,进而形成整体风险导向,获得决策信息。“这是将有关征信的碎片化信息长尾聚合起来,形成更好的判断。”黄大容说。
白皮书显示,目前央行征信中心针对拥有信用记录公民收集的信息共包含两类。一类是个人基本信息,另一类是信用卡消费及还款记录。但P2P网贷行业判断借款人信用评价的数据包含手机清单、个人收入证明、社保信息、家属身份信息、驾照信息等多达34个信息类别。“央行个人征信数据太简单,我本人去拉取过,就两张信用卡的记录。”大成律师事务所商建刚说。
一位业内人士表示,P2P网贷行业风控层面最大的挑战是确认投融资双方信息的真实性,目前央行征信中心的数据层次显然不能满足其风险判断需求,这需要网贷平台对接民间第三方征信机构或者自建征信体系,到企业现场做尽调。而这也构成了P2P平台运营的最大成本。“希望未来银行的数据能够向P2P倾斜,降低P2P行业的信息获取成本。”该业内人士告诉《第一财经日报》记者。
公开数据显示,央行征信中心的数据覆盖人口达到8亿人,但是其中真正有信贷记录的仅为2.9亿人,5亿人没有任何信贷记录。
对于央行征信数据没有对P2P机构开放和多数借款人没有完整征信记录的现实境况,信而富CEO王征宇表示,通过网络手段获取的数据并不能直接指向还款能力,其中数据间的弱相关关系就需要不同于传统技术手段评分模型的大数据手段来解决。“大数据的内涵涉及机器学习、弱相关关系分析、社交网络数据和图像关系识别四个方面。”王征宇说。
王征宇表示,在信贷风险管理业务环节上,数据的基本问题包含三方面。第一方面是业务决策问题,在信贷从开始到结束的周期中将面临一系列的业务决策,这些决策可以通过数据来完成。第二是基本数据问题。衡量一个人还款意愿的重要参数可以归纳为5C1S,即character、capacity、capital、collateral、condition、stability。第三是大数据运用的基本手段,数据积累、确定数据的服务方向并通过数据优化决策点。
大量数据沉淀
对于未来征信体系的发展,王建章表示,理想的征信社会应该包含三方面。第一,人人有信任。“从历史行为中找出你做了哪些事情,并且这些事情是可以评价的。”第二,信任有价值;第三,信任可定价。
“只有上行数据而没有下行数据就会有操作风险。我们呼吁未来央行数据可以上传下行,同时也呼吁央行拉动长尾客户数据。”黄大容表示,如果央行这两方面的“步子”没有那么快,则希望能够建立一个云征信,让行业逾期数据得到共享。
“在传统金融业态下,银行在风控方面具有绝对的优势,但是随着互联网金融的发展,金融业态也将随之改变。届时,银行的风控优势将逐步丧失。”复旦大学国家示范性软件学院副院长刘钢表示,三年或五年之后,金融应用场景的革命才是未来金融业态更革命性的变革,当电子商务成为主要业态的时候,数据获取方式就会发生变化。
“数据显示,目前中国网贷行业投资人约为50万,但是中国有13亿人口,有大量的数据沉淀在各种IT系统中,我将这部分数据称为‘沉睡的大数据’。”刘钢称,互联网金融将面临两大竞争,第一是低边际成本获取海量客户资源;第二是低边际成本掌握海量信息。