芝麻开门 大数据征信体系揭秘

1月28日,蚂蚁金融服务集团(下称“蚂蚁金服”)旗下的芝麻信用首次测试个人征信系统,这也是1月5日央行发布允许8家机构进行个人征信业务准备工作通知后,首家推出该系统的公司。据21世纪经济报道记者了解,在1月5日央行发布通知后,蚂蚁金服便迅速注册公司,组建团队。其骨干成员大部分为数据科学 家,同时开始大规模招聘相关人员。芝麻信用总经理则从招商银行“挖”来胡滔担任。据悉,这8家机构目前均处于准备阶段,既无行政许可,也无牌照。按照通知 要求,准备期为6个月。

芝麻信用采取和支付宝钱包合作的方式,用户在支付宝钱包8.5版本“财富”栏中可看到这一功能。但目前只有参与测试的用户才能看到信用分数。相比传统意义上的央行征信报告,芝麻信用采用的形式更加简单——信用分。芝麻信用分最低350分、最高950分,分数越高代表信用程度越好,违约可能性越低。

芝麻信用测试版推出意味着市场化的个人征信在中国正式起步,未来越来越多的机构将为每个人建立起一套信用档案,它将成为每个用户的一张名片。

但就目前而言,无论对于用户,还是征信机构,都将面临一个长期的认知和构建过程。如何采集个人信息、如何形成信用分数、如何使用个人信用、个人信用对用户意味着什么等都是一个全新的挑战。

构建信用维度

芝麻信用背靠阿里巴巴,而阿里巴巴目前覆盖数亿计互联网用户,仅支付宝就拥有超过3亿用户。同时,芝麻信用拥有阿里的电商交易数据和蚂蚁金服的互联网金融数据,比纯粹的网络社交数据含金量更高,这也成为芝麻信用进入征信行业的一大独特优势。

传统的金融机构征信多采用借贷领域的数据,并且覆盖人群有限。据之前的一份统计数据显示,截止到2013年底,央行银行个人征信系统中收录有信贷记录的自然人约3.2亿,还不到总人口数的1/4,而在美国征信体系的覆盖率已经达到了85%。

“在信用领域我们更多是央行征信的补充。”蚂蚁金服信用业务拓展负责人邓一鸣曾在一次小范围沟通会上表示。这也意味着,市场化、互联网化的个人征信将大大拓展覆盖人群范围和增加个人信用评判维度。

但在实践中,如何构建一个如此庞大而又重要的体系,在国内目前并未有成熟的案例参考。阿里巴巴虽然有如此庞大的数据,形成产品仍将是一件系统性的工程。

首先是维度,蚂蚁金服公关部张道生接受21世纪经济报道记者采访时表示,芝麻信用分这一看似简单的分数,背后是芝麻信用对海量信息数据的综合处理和评估,芝麻信用建立个人信用维度方面也参照了美国著名的征信机构FICO。

蚂蚁金服首席信用数据科学家俞吴杰介绍了国外的一些经验,归纳起来可分为,一、基本信息,包括职业、收入、工作稳定性、街区、放假及居住稳定性;二、借贷信息,包括车贷、房贷、信用卡和学生贷等;三、消费信息,商场和网络消费频次、额度等;四、公共信息。法院判决、税务拖欠、地铁逃票、交通违章、亲友欠款等。这也就意味着,个人信用当中涵盖了每个人生活工作中的各个方面。他还举例称,用户的公益行为也会影响到个人信用。

据了解,在此基础上,芝麻信用则采用了五大维度:用户信用历史、行为偏好、履约能力、身份特质、人脉关系,分别对应过往信用账户还款记录及信用账户历史;在购物、缴费、转账、理财等活动中的偏好及稳定性;享用各类信用服务并确保及时履约;在使用相关服务过程中留下的足够丰富和可靠的个人基本信息;好友的身份特征以及跟好友互动程度。

数据来源和计算

阿里巴巴拥有淘宝、天猫、聚划算等电商平台以及蚂蚁金服的互联网金融平台,同时业务开始深入水电煤缴费、打车、医疗等领域,本身已积累了大量的数据。

张道生表示,和传统征信数据主要来源于借贷领域有所不同,脱胎于互联网的芝麻信用数据来源更广、种类更丰富,时效性也更强,涵盖了信用卡还款、网购、转账、理财、水电煤缴费、租房信息、住址搬迁历史、社交关系等方方面面。

互联网产生的数据最大的特征是实时,留有痕迹,容易追踪,相对于传统线下的采集和整合更加全面和准确。

就阿里巴巴的业务而言,其通过其电商、支付、互联网金融、打车、“未来医院”计划等各业务线已经积累了庞大的数据。但要实现更全面的覆盖,这样的数据量显然不够。 张道生称,芝麻信用的数据来源可以分为三部分,一部分是阿里已有的数据;一部分是和公共服务(包括部分政府部门)对接的数据;未来芝麻信用也将推出一个用户自行提交数据平台,根据这些数据打分。

但在获取外部数据时存在两大问题,首先,外部数据如何提供,免费还是付费;第二,不同机构的数据类型不尽相同。

俞吴杰以国外为例称,收费和付费模式都有,此外还有一种资源互换,比如银行,一家银行向一家征信机构调取数据了,国外有一个互惠条约,银行必须把一些违约信息反馈给征信机构,否则征信机构就

不让银行调取数据,而对银行而言,如果不用征信公司的数据,成本非常高,本身是一种交换;此外,征信机构也会自己向水电煤机构采集,也有付费的,相对来说比较便宜。

对于数据类型,则需要通过技术的方式解决。

搜集数据之后,如何通过数据模型计算出用户的信用,这是征信机构也是用户最为关心的事情。张道生解释说,并非某个行为的变化就会引起用户芝麻信用分的变化,除非出现重大的违约事件,都是通过庞大的数据来计算的,因此并非你在淘宝上消费的越多,芝麻信用分就越高。同时,用户的违约记录会有一个保留期,如果期间信用记录呈正向,信用分也会提升。

他称,蚂蚁金服在互联网金融领域已积累多年,包括之前的微贷、天猫分期购、花呗等产品,背后都是通过大数据为用户建立了个人信用档案,因此微贷才能在一分钟内就能发放贷款。目前,一些银行已经承认蚂蚁金服的数据,在一些大额贷款方面,都会参考这些数据,合作的银行已有十几家。

使用场景和安全

1月28日测试首日,很多参与的用户均在朋友圈中晒出自己的信用分,但当个人信用真正建立起来后如何使用?传统的信贷可能依然是最大的应用场景,但除此之外,芝麻信用已将其推广到酒店、租车等各个领域。邓一鸣表示,最终还是希望能够将个人信用渗透到用户的生活中去。

邓一鸣提出几种信用不足情况的方式,押金、预授权、担保。而一旦个人信用建立,在某些场景下,这些方式将被取消。据了解,目前芝麻信用已经和阿里旗下旅游品牌去啊合作,在3000家酒店使用芝麻信用分,满600分即可无需缴纳押金;同时和神州合作的租车也即将上线,只要芝麻信用分达到一定级别,将无需动用预授权。

他还以出国签证和招聘为例,出国做过签证,银行需要冻结一部分资金,但如果个人信用建立起来后,根据信用就可办理;招聘中,很多公司会做背调,本质上就是一个信用中介的概念,而个人信用也可以做这种中介化的事情。邓一鸣认为,未来最有意思的一个应用是分享经济,包括PP租车(拼车)、PP租房、人人快递等。

值得注意的是,个人信用档案一旦建立,也意味着每个用户的数据将集中到一起,如何保障数据安全可能是未来最大的挑战。俞吴杰表示,有了数据,有了计算方法,但个人征信重中之重还是安全,因为个人征信涉及到的是每个个体,所以隐私保护、数据安全成了最重要的。

他称,在阿里同样的数据是留在不同地方的,一个地方出现任何问题,另一个城市的机器可以重启。物理安全是门禁,两道门禁,两路通电,保证业务完整。还有自己的网络服务,防止黑客攻击。而对于信息本身,也是有分级的,从信息安全自身角度考虑,分了很多层,第一,银行卡信息相关的,绝对是最顶端的,最重要;第二;消费信息;还有脱敏的数据,不指向任何一个人,就是群体信息。在信息传输和保存方面都是经过完整的加密技术,针对于信用相关的,必须有专项保护,怎么样才能授权,让哪些人看,这个是很重要的。

市场化的大规模个人征信已经起步,但对于征信机构而言,如何系统性的搭建起如此庞大的模型,输出产品,依然需要时间;而对于用户,接受和使用个人信用也将面临一个长期的普及过程。

(责任编辑:mengyishan)

时间: 2024-09-21 11:50:25

芝麻开门 大数据征信体系揭秘的相关文章

大数据征信六大难题待解

随着消费金融.网络借贷等互联网消费模式快速增长,以及大数据技术突飞猛进,大数据征信服务机构开始大量涌现.但多元化.多层次征信市场体系建设面临一系列挑战,有很多难题尚未破解. 一是数据的质量.权威性问题.相比于央行征信系统的权威性.数据质量的高可靠性,大数据征信机构虽然数据来源更加宽泛.品种更加丰富,但数据质量.权威性受到质疑.美国国家消费者法律中心2014年3月对主要的大数据征信公司进行调查后并发表了题为<大数据,个人信用评分的大失望>的调查报告,报告称,大数据征信公司的信息错误率高于50%.

大数据征信成撬动消费金融的支点?

文章讲的是大数据征信成撬动消费金融的支点, [IT168资讯]如果要说近日整个互联网金融领域什么最火,相信必然非消费金融莫属.但是消费金融更多建立的是一种信用消费,而这个核心和根本就在于个人征信.但是看看目前国内整体的互联网金融个人征信,却仍然存在许多不足之处. 1.目前整个国内的央行征信系统虽然覆盖到了8亿人,但是真正和银行有信贷关系的只有3亿人.尤其是央行的征信目前尚没有介入到任何非银行类机构,客户的信用分析也不能仅仅依靠央行的征信报告就能够完全判断准确.对于大部分的传统机构来说,他们掌握的

大数据征信:央行开了“半扇门”

在1月5日,中国人民银行官网发布消息称,人民银行已印发<关于做好个人征信业务准备工作的通知>,要求芝麻信用管理有限公司等八家机构做好个人征信业务的准备工作,准备时间为六个月. 这是2013年3月15日中国征信领域首部法规<征信业管理条例>开始施行之后,央行第一次通知企业做个人征信的准备工作,多位受访专家认为,这无疑在征信市场化方面向前推进了一步.中国企业在征信业的探索始于上世纪90年代初,由于国内征信行业此前一直没有专门法规,其运行一直处于灰色地带. 这同时意味着,今后中国人个人信

什么才是真正的大数据征信?

随着国家推动社会信用体系建设的步伐不断加快,大数据征信的概念得到广泛传播,已被越来越多的公众所认知.大数据征信代表着未来征信业的发展方向,将深刻改变商业交易模式,成为支撑市场经济健康快速发展的基础性产业. 大数据征信前景广阔,在资本市场.商务合作和终端消费市场,征信产品的需求已经显现出来,金融机构.企业和消费者对通过第三方大数据征信机构在经济活动中考察合作和交易对方的信用状况抱有很大的期待. 目前国内注册成立的征信机构无一例外将发展目标锁定在了大数据征信上.大数据征信首要的工作就是信用信息数据库

从大数据征信看银行风控创新

数据将是未来银行的核心竞争力之一,这已成为银行业界的共识.在大数据时代,银行所面临的竞争不仅仅来自于同行业内部,外部的挑战也日益严峻,互联网.电子商务等新兴企业在产品创新能力.市场敏感度和大数据处理经验等方面都拥有明显的优势.在此形势下,利用大数据征信创新和提高银行的风险把控也逐渐成为业界关注与探讨的重要话题. 银行业在风险控制中的不足之处 普华永道发布的<2015年中国金融及银行业展望>指出,截至2014年第三季度末中国的商业银行不良贷款总额上升36%,达到7670亿元人民币,是四年来的高点

ZestFinance:大数据征信应用与启示

近期,美国互联网金融公司ZestFinance受到国内互联网金融专业人士的热捧,其基于大数据的信用评估模型也越来越受到关注和效仿.本文结合美国的金融环境,对ZestFinance进行简要介绍,分析大数据征信产生的背景,剖析大数据征信技术,并全面客观地阐述了大数据征信技术对于中国互联网金融和征信业未来发展的借鉴意义. ZestFinance简介 ZestFinance,原名ZestCash,是美国一家新兴的互联网金融公司,2009年9月成立于洛杉矶,由互联网巨头谷歌(Google)的前信息总监道格

大数据征信面临的挑战与对策

随着征信市场化步伐加快,大数据征信成为热门话题,受到互联网金融和资本市场的追捧.征信与大数据有着基因层面的密切关系,一方面,征信数据是天然的大数据,理论上与消费者和企业相关的数据都可以用来作征信:另一方面,征信其实就是将分散在不同信贷机构.碎片化的局部信息,加工融合成为具有完整视觉效果的全局信息,从中挖掘出风险信息,破解交易过程中信息不对称问题.而大数据技术的优势就在于能够更好地利用IT先进技术,将支离破碎的数据整合起来,形成真正有用的信息.所以,大数据对传统征信业务模式的影响将是变革性的,甚至

大数据征信 是伪命题?还是金融行业的救世主?

2016年,互金圈遭遇冰火两重天:一边是P2P的倒闭潮,一边是,新模式的全面崛起. 进入涅槃期的P2P,为新崛起的互金圈,上了最为昂贵的一课:风控之痛,恐怕是扼住互金咽喉的那只手. 没有征信体系的中国,互金的发展,就如沙漠中迷途的旅人,饥渴难耐,却又茫然无措. 政府也意识到这个问题, 在万众期待中,八家征信机构拿着央行的"介绍信",开始蹒跚学步. 不管是阿里的"芝麻信用",还是腾讯的社交数据,这些所谓的"大数据征信",真的能成为中国互金的救世主吗

大数据征信的发展背景及与传统征信的比较

传统征信在方便个人信贷.辅助金融授信决策.防范信用风险和提升金融获得性等方面发挥着关键作用,但其在互联网金融领域的局限性也不容忽视.一是全国还有5亿左右人口没有在持牌金融机构的信用活动,从而不被其所覆盖.二是随着"互联网+"的发展,互联网上产生.沉淀了大量与个人征信相关的数据,目前还难以被其采用[1].大数据征信的出现有助于解决上述问题,并在一定程度上取得了快速发展.据我们研究,大数据征信得以发展的基本条件有以下三点:一是我国政策扶持和部署所释放的良好信号:二是以"金融线上化