专访陈磊:拍拍信与金融数据AI

陈磊:
拍拍信(PPCredit)数据科学副总裁, 上海交通大学EE硕士,曾任职eBay分析经理,Opera Solutions分析总监。作为数据行业老兵,拥有超过十年的数据管理和统计挖掘经验,为电信、零售、金融等行业客户提供端到端数据分析和产品解决方案,在数据+技术驱动业务领域有丰富的积累。

大纲:
普惠金融的发展遇到移动化的浪潮,使得消费信贷迎来了高速攀升期,同时也给风控带来了巨大的挑战,即在额度区间广、借贷频次高、客群下沉情况下,如何实现风险可控、差异化定价、快速审批。幸而大数据和AI技术使得这一切变为可能,拍拍信一直在做这方面的探索,旨在整合数据资源、充分发掘数据潜在价值,帮助金融机构伙伴搭建和优化风控系统,我们将在会上分享相关的实践经验和落地案例

ArchData技术峰会将于9月9日上海徐汇COCOSPACE开幕,在大会之前,中生代技术特邀专家记者王公仆对陈磊总做了会前访谈

陈总您好,首先感谢您花费宝贵的时间来参加ArchData峰会,给大家分享拍拍信业务中的AI技术话题,正式会议前,我这里有一些问题想请教您

王公仆:之前在杭州地铁上看到过拍拍贷的广告,能简单介绍下拍拍信公司,目标客户和主营业务吗?
陈磊:拍拍信数据服务(上海)有限公司成立于2016年3月8日,始终秉承着“专注,服务,创新”的态度,以“数据定义未来,信用改变中国”的理念,致力于帮助客户解决数据应用和风险控制问题,并不断优化迭代我们的技术与服务,为客户带来更好体验。目前客户主要分布于金融行业,如互联网金融平台和消费金融持牌机构,主营业务包含但不限于信贷评分、定制化模型、信贷全流程解决方案和系统、反欺诈知识图谱。

王公仆:请您简单介绍下在拍拍信内部,AI技术被用在了哪些产品或业务中,效果如何?

陈磊:目前AI技术主要被用于以下几个方面:
信贷模型:基于深度学习的特征提取,相对于传统的专家经验提高了自动化和可扩展性,同时使得高阶特征的提取成为可能,最终模型性能有大幅提升;
图像识别:身份证信息提取和银行卡识别,帮助客户实现风控流程的自动化;
知识图谱:复杂网络的识别和挖掘,已被应用于欺诈团伙的识别。

王公仆:作为金融行业的信贷公司,请问你们是怎样进行信用建模的呢,原始数据从哪里获取呢?

陈磊:我们目前的定位是有深厚金融业积累的数据服务公司:
拍拍信可以提供客户标准化的信贷评分,也可以根据客户的需求来定制化信贷评分;
整个的模型周期基本包含数据收集, 数据清洗, 特征工程, 模型训练, 模型验证与迭代,模型上线后的自学习也是我们的一大特色;
数据来源主要包含:
a.自有积累数据
b.合作方的授权数据
c.有定制化需求客户提供的脱敏数据

王公仆:在金融信贷领域,风险控制需要做哪些工作呢?

陈磊:风控覆盖用户的整个生命周期贷前/贷中/贷后:
贷前的审核和授信;
贷中的异常监控;
贷后可能的催收。

王公仆:在线上的信贷业务,会遇到哪些信贷方面的挑战和业务机遇?

陈磊:
风险相对于线下增大,线下信贷客户真实性可控;
数据维度更多,但稀疏;
用户体验需求高,进件规模大,对自动化的要求高。

王公仆:在金融特别是风控的数据建模/数据研发方面贵公司是如何利用机器学习和大数据进行创新的呢?

陈磊:
先进算法的应用,如Boosting、Deep Learning;
大数据平台的建设,Spark集群,打通数据流和工作流。

王公仆:在大数据方面,贵公司拥有的数据量级是多大呢,一般是用哪种技术存储和计算的呢?

陈磊:目前数据在百亿级,约100T。用HDFS/Hbase存储,及Hive/Impala/Spark进行计算。

王公仆:在数据可视化方面,贵公司是如何做技术选型的呢?

陈磊:前端以E-chart为主考虑到公司处于创业初期,所以选择开源技术,再加上一部分自主研发。

比如报表系统我们使用Pentaho,多维分析使用Kylin+Saiku,然后自主研发的数据门户网站等。

王公仆:最后请问在数据安全领域,贵公司是如何保障客户数据隐私安全的呢?

陈磊:会从多个层面来保证数据安全,比如系统隔离、数据加密及脱敏。

王公仆:最后感谢您接受采访,谢谢。

时间: 2024-09-11 20:32:10

专访陈磊:拍拍信与金融数据AI的相关文章

陈磊-大数据风控:拍拍信的AI视角

 普惠金融的发展遇到移动化的浪潮,使得消费信贷迎来了高速攀升期,同时也给风控带来了巨大的挑战,即在额度区间广.借贷频次高.客群下沉情况下,如    何实现风险可控.差异化定价.快速审批.幸而大数据和AI技术使得这一切变为可能,拍拍信一直在做这方面的探索,旨在整合数据资源.充分发掘数据潜在  价值,帮助金融机构伙伴搭建和优化风控系统,本次陈磊将分享相关的实践经验和落地案例. 当前消费金融规模持续增长,风险控制的挑战也与日俱增. 陈磊老师现场分享 请参见一个风控系统的雏形框架,涵盖了用户贷前和贷后的

专访Peter ku:金融数据背后的商业价值

本文讲的是专访Peter ku:金融数据背后的商业价值,一个大规模生产.分享.应用大数据的时代正在开启,作为数据密集型行业,手机银行.电子支付.社交网络.云计算都让金融企业数据资源的"储量"越来越丰富,数据也越来越成为金融服务企业最有价值的资产之一.但问题随之而来,金融企业能否充分利用这些数据的价值来驱动业务.比如,传统的交易数据虽然可提供有关客户状况的重要视图,但这一视图并不完整;金融机构纷纷开通企业的微博和博客,在交互过程中希望倾听到不同客户对业务的需求或建议,从而开发新业务,发掘

“大数据+征信”:金融科技下一风口

时下,依托于互联网.大数据.云计算技术的金融科技正盛行一时.大数据技术的突飞猛进,使得海量数据的采集与挖掘成为可能,促使国内开始涌现大量的大数据征信服务机构,成为推动我国征信领域新业态生成发展的新生力量. 日前,中国人民银行金融研究所互联网金融研究中心副主任兼秘书长伍旭川在2016年中国小额信贷国际峰会上表示,未来金融科技的发展可能存在的领域之一就是大数据在个人和企业征信中的广泛应用. 毋庸置疑,将大数据技术应用到征信领域,将对征信行业产生深刻的影响,也将成为引领金融科技发展的下一个风口. 打通

表格存储在互联网风控和金融数据服务上的应用实践

引言 当前,第三方支付.P2P网贷.宝宝类理财.众筹等金融产品层出不穷,随着金融知识的普及,全民参与又进一步促进了互联网的发展.海量交易数据,实时在线访问,业务快速的迭代变化都对传统金融解决方案提出了更高的要求,而互联网金融本身的开放性,低门槛,征信信息的缺乏,又容易发生各类风险问题,这有给传统金融解决方案带来的新的挑战.借助云计算.大数据.搜索引擎等新一代高新技术,给互联网金融带来了新的机会. 新兴的互联网金融数据主要有以下几个特点: 海量数据 由于参与的人数众多且活跃度较高,日交易单数通常能

积木盒子选择先从金融数据入手,再正式切入P2P

摘要: 导读:积木盒子是国内P2P热潮里涌现的其中一家.和其他P2P不同的是,积木盒子选择了先从金融数据入手,在积累了一定数据后再正式切入P2P. 从数据入手 金融行业出身的董骏在创立 导读:积木盒子是国内P2P热潮里涌现的其中一家.和其他P2P不同的是,积木盒子选择了先从金融数据入手,在积累了一定数据后再正式切入P2P. 从数据入手 金融行业出身的董骏在创立"积木盒子"前,曾在美国纽约做了5年的债券交易和结构性投资产品.2005年,董骏回到了自己的家乡云南,创立了"云南中铭

拉卡拉考拉征信:用大数据体现信用价值

近年来,各行业不断发展和完善社会信用体系建设,随着京津冀信用建设的示范作用及征信机构的积极推动,中国诚信社会建设取得快速发展.拉卡拉考拉征信作为中国诚信社会建设推动者和践行者,始终致力于为各行业提供全方位的信用服务,为完善社会信用体系做出了重大贡献. 拉卡拉考拉征信:用大数据体现信用价值 据了解,拉卡拉考拉征信主要面向政务.商务.社会.法务.个人提供全方位的信用服务,通过运用大数据及云计算技术客观呈现机构和个人的信用状况,通过连接各种服务,让社会机构和个人都能体验信用所带来的价值.拉卡拉十年的支

2015国内征信机构大数据整合能力对比

自2001年起,大陆地区现代企业征信业进入在竞争中发展的阶段,信用问题开始得到社会各界的广泛关注,许多政府和民间投资的企业征信机构携带大量资本如雨后春笋般出现. 随着企业征信行业环境不断改善,信息透明度低的问题日益凸显.大量与企业信用状况和历史有关的信用信息,如企业基本财务信息.法院诉讼记录.房地产及其抵押记录.银行还贷记录等,仍然停留在各个国家机关和政府部门,不能为征信机构所获取,未能发挥其应有的价值. 与此同时,随着中国企业征信市场规模的不断扩大,企业征信机构的业务集中度越来越高.不完善的信

2013新年阿里“平台金融数据”三极突破

2012年阿里确立未来十年"平台金融数据"三大战略 2012年9月9日,在杭州第九届全球网商大会上闭幕式上,阿里集团董事局主席马云再次站上了网商大会的舞台,发表主题演讲.马云表示,从明年1月1日开始,整个阿里集团将会转型,从自己直接面对消费者变成支持网商面对消费者.阿里集团的下一个十年,将开启"平台.金融.数据"三大战略. 平台战略即建立平台经济,将包括淘宝.一淘.天猫.聚划算.阿里国际业务.阿里小企业业务和阿里云等七大业务:金融战略即用互联网的思想和技术支撑社会未

海云数据AI战略发布会首提“能力服务” 人工智能赋能端客户

8月15日,海云数据在北京举办AI战略发布会.海云数据创始人.CEO冯一村在会上发布了AI战略和以"能力服务"."智慧城市AI产业路由器"为主要内容的全新商业模式,正式宣布完成B轮1亿元融资,并推出"双亿元AI扶持计划". 据悉,此次发布会以"感知无法看见的数据,赋能无法计算的智慧"为主题.海云数据今后将专注利用人工智能与可视分析技术,赋予用户在灵活科学地分析数据中形成更加智慧的业务决策能力,真正帮助用户实现在业务场景中的效率