零售银行如何玩转大数据

本文主要涵盖以下内容:

  1. 为现有顾客提供私人订制产品
  2. 欺诈情况的早期侦测以及欺诈风险的转移
  3. 针对产品取消与客户流失的预测
  4. ATM机和银行网点中现金分配的最优解决方案
  5. 昂贵银行渠道使用的最小化
  6. 评估债务产品的客户

我们可以从备用数据库里收集有关联的数组和数据,并使用Hadoop进行分析。或者我们可以通过机器学习技术现有数据中隐藏的关联关系。

普通数据组的介绍

针对所有客户每月收入和支出的分类分析数组是一直存在的。这类数组是因为客户银行账户借记、贷记等各种日常操作而产生的。每一笔交易的产生通常都伴随着一个电子号码,比如电费话费单、商户类别码等等。此外,我们还可以通过商户名称、描述以及留言来对交易进行区分。

我们可以识别出很多消费类别,比如房产类消费(租金或者按揭)、能源类消费(加油或者电费)、食品及家居类消费、教育类、汽车消费、餐饮、大额项目(购买电视、家具)、税费、娱乐、信用卡和贷款支付、奢侈品等等。

同样,收入分类有工资、分红、退税交易、社会福利收入、房租收入、销售等等。通过简单的回归分析可以得到针对每个客户的收入支出情况的整体趋势,以及每个细分类别的趋势。

机器学习和预测

我们可以使用各种机器学习算法和模型来做预测。这里我们介绍两种算法:监督学习以及非监督学习。

监督学习算法通过分析和验证历史数据来得到模型,这个模型可以通过输入数据之间的联系得到确定的结果。样本数据可以随意选取,但是最好提前进行分组处理以得到更准备的结果。通常可以将客户数组数据按照年龄、收入、地域、教育背影以及储蓄量进行分类。每一类还会继续细分,比如年龄可以分成5个20的层级。我们能直接看到每一层级中客户的数量,从而我们可以从每一层级里抽取5%的样本数据来进行分析。这类样本数据能够让我们最直接地看出哪个类别对最后结果的影响最大。比如我们可以很明显地看出教育背影对投资产品的影响最大。

非监督机器学习算法则会从现有的数据中寻找未知的关联模型。我们可以通过那些非正常的客户行为模式中来找到欺诈信息的蛛丝马迹。

1产品的私人订制
银行可以把钱省下来去做那些昂贵的市场推广活动来宣传银行产品。产品应该最大程度地提供给那些有可能需要并接受它们的人,所以应该针对客户推荐与其最相关的产品。这些就需要好好研究客户之前都爱使用哪些产品。

客户所使用的银行产品和服务的历史数据都可以拿来做分析,并生成独立的模型。我们筛选并验证出最好的学习算法,然后用它们计算哪些类别和变量能产生最大的效果。

2金融欺诈的早期侦测以及减少欺诈损失
这项内容包括识别身份造假、信用卡欺诈、电信欺诈、洗钱以及对网上银行和移动银行的攻击。不断出现的新型欺诈手段需要灵活、迅速的检测算法。过去,银行只使用基于统计学和规则的算法去识别可疑行为。这些算法有很大的局限性,因为它们只能识别已知的欺诈手段,维护成本高,计算中无法覆盖每个用户的全部历史数据,并且经常误报。

我们使用了包含已知欺诈案件的数据集。这些欺诈案件被分为几类储存,如盗取身份透支欺诈,信用卡盗窃,消费信贷欺诈,伪造支票偿还信用卡,盗窃支票,盗录磁条复制卡片,使用窃取的客户凭证或安全设备攻击网上银行,流氓电商运用信用卡诈骗等等。我们使用了利用反向传播进行训练的神经网络和决策树两种算法。这些算法对已有数据进行处理,从而识别新型诈骗的出现。

3预测客户流失和取消服务
银行对客户流失和取消服务的预测有很强的时间敏感性,因为在客户不可挽回地决定取消某项服务或转投竞争对手之前,留给银行的时间仅有几天而已。银行必须及早识别那些有可能流失的客户并联系他们,为他们提供其它可选择的服务或是解决他们的问题。留存能带来高利润的活跃客户的成本比起流失他们之后再吸引回来的成本要低得多。

我们预测时使用的原始数据包括账户流动情况,借记卡和信用卡流动情况,CRM中记录的客户数据,服务订购数据,服务中心和分支机构的访问交易数据以及登录信息等。常用的收入和支出数据也被纳入其中。

我们还建立关键事件的时间序列,诸如注销借记卡,从其它银行转入的工资、分红、租金等收入,客户主动联系服务中心或是访问分支机构,注销信用卡等等。

我们还建立了另外一组客户集,他们符合年龄、收入、存款和地理位置分布等画像但仍然是银行的存留客户。

基于以上,我们建立了有效的模型以预测客户在不可挽回地转投竞争对手之前的一系列行为。我们已经使用了一些监督学习算法,例如支撑向量机进行二类分类以及利用用反向传播的神经网络。在使用主成分分析对输入数据进行降维后,我们使用非监督学习算法中的K聚类算法和KCm算法来降低输入数据的维度。

我们在最近的数据中识别出了数百名符合模式的活跃用户,在他们转投竞争对手之前,相关分行应当及早进行联络。

4ATM机和银行网点中现金分配的最优解决方案
对于ATM机和银行网点而言,一年之中不同时段的现金需求量是在不断变化的。这种变化可能由天气、突发事件、假期及旅游等各种因素引发。准确预测出ATM机和银行网点的现金需求量非常重要。无论是频繁地往ATM机里放现金,还是ATM机因缺少现金而停止使用,成本都很高。另一方面,我们又不希望出现ATM机和网点长期持有冗余现金的情况,因为这既不是最优的现金分配方法,同时也会加大引发犯罪的可能。

我们会使用多个维度的数据进行分析,包括:ATM机的服务日志,ATM机和银行网点的地理位置信息,每台ATM机的提款数据,ATM机和银行网点当地的天气预报,赛事安排,每个地区的文化活动、重要事件以及节假日安排。此外,信用卡和借记卡的流动情况也是重要的数据源,可以判断不同地区在每年不同时间的现金需求量。我们使用普通数据组来确定不同地区客户的工资、社会福利和其它收入的到账时间。

我们提取并分析了这样一些数据,包括:所有ATM机在一年中每一天取现数量的中位数,所有ATM机一天中每小时取现数量的中位数。这一数据集被用来计算天气、重要事件、星期几及节假日对某一具体地区的现金需求量的影响。我们还将过去4年间的重要文化、体育及其它事件与其发生的地理坐标数据结合加以处理,计算出了每项事件对其辐射范围100米以内的ATM机的现金需求量的影响。根据影响程度的不同,我们对这些事件进行了分类。这一数据组可以预测以后类似事件的影响。

同时,我们计算了天气与当地每台ATM机现金需求量的相关性,过程中涉及到的天气相关的参数包括降水量、温度和风力等。

另外,我们还建立数组分析了不同地区收入(包括工资、社会福利等)到账日和现金需求量的相关性。

基于以上数据集,我们建立了预测每台ATM机和网点一年中任意一天现金需求量的模型。这些模型考虑了历史天气预报数据和重要事件安排,也用到了很多高级算法如波尔兹曼机、感知机和高斯判别分析等。

5昂贵银行渠道使用的最小化
在昂贵的银行渠道比如柜台服务或光顾支行或电话客服的使用率最小化上我们做出了巨大的投入。

使用率的最小化可以由优化网上银行或手机银行应用、帮助页、帮助软件以及优化网站界面实现。另一个方法鼓励正在犹豫的客人转而使用更便宜的方式是目标更加明确的推广活动。

可分析数据最主要的来源是来源于网上银行以及手机银行应用的网页记录。我们曾用过带银行账号的使用记录,客服中心交易记录数据组,用户信息的CRM数据组,或分行交易记录的数据组。

另一个重要的数据组是客服中心、支行的投诉以及咨询的来电、邮件、来信。我们将数据以网络帮助页的咨询点的相关兴趣点分类。这能帮助找出解释不清晰、造成误解的以及不必要咨询电话的帮助页面。这还能帮助管理网上银行那些复杂的造成投诉的操作。它发现了许多领域比如关于帮助页面没有涵盖的信用卡支付汇率,这反而常常在电话或分行咨询中常常被提到。网上银行的产品据此修改,提供自助咨询、搜索优化、网上银行管理、以及手机银行应用等服务,以减少客服中心以及分行的使用率。

我们分析了以转化客户到网上银行、手机银行以及自助柜员机的市场营销活动的结果数据。根据相关性分析,许多大范围的营销活动并不十分有效。我们也分析了最近将大部分业务转移到网上的银行客户的规律。这帮助我们找出更有可能转移到网上的客户。对这些客户我们应该使用更有针对性的个性化的营销策略,根据各个分行的特点进行活动。

6评估债务产品的客户
为了可靠地评估风险,对现有客户批准借记产品,不仅需要考虑现有的信用状况、可支配收入状况,还需要客户的全部历史和社交记录。这样以减少银行承担的风险并增加来自有价值客户的收入。

我们使用通用收入支出数据库分析,客户全部的信用卡、借贷、透支或其他金融产品的交易记录以及CRM信息。

使用Markov Chain随机分析评估与客户行为相关的借贷支付可能。此类模型在盈利性借贷、信用卡以及其他金融产品的历史数据中得到验证。我们注意到信用记录的可靠性得到增加,并能够据此为被拒绝的客户提供替代产品。

原文发布时间为:2015-07-23

时间: 2024-08-29 14:49:44

零售银行如何玩转大数据的相关文章

玩转大数据:需要知晓的12种工具

本文讲的是玩转大数据:需要知晓的12种工具,无论是在构建大数据的应用程序,还是仅仅只想从开发的移动应用中得到一点点启发,程序员现在比以往任何时候都需要数据分析工具.这绝对是一个好东西,所以很多公司从程序员的需求和技能出发,构建了一些数据分析工具. 在过去的几年里,Derrick看到了很多初创公司,各类项目以及开发工具等等,它们都旨在为程序员带来先进的数据分析能力.有时候,程序员们会使用简单的脚本开发出强大的显示效果,或者在开发过程中使用一种更简易的方式来实现数据的交付功能,Derrick相信这是

【大数据新手上路】“零基础”系列课程--如何通过大数据开发套件Data IDE玩转大数据

免费开通大数据服务:https://www.aliyun.com/product/odps 老板每天都要出这些业务数据(销售总额.总交易量.总点击次数.总加入购物车次数.总加入收藏夹次数...),我得想个一劳永逸的方法了- 幸好,我有数加神器大数据开发套件Data IDE,搞定业务工作流调度,每日定时自动执行任务,分分钟输出计算结果. 妈妈再也不用担心我焦头奋战了-- 本教程是一个大数据开发套件Data IDE零基础教程,通过Data IDE将多源异构的数据集导入云端MaxCompute,进行计

Facebook教你如何玩转大数据

不论"大数据"概念是不是个陷阱,我们的时代,互联网巨头坐拥海量信息是无人可以否认的事实,社区产品和社交产品赖以生存的基础就是从用户那儿来的数据. 他们都是怎样八仙过海.各显神通让你感受到大数据的?比如,去年年终的时候,你肯定看到众多好友在微信朋友圈儿分享了一张"订制"的图片,在微信产品成长历程的时间轴中标注你加入的时点:你可能在登录豆瓣电台后,才发现通过一个特别的回忆通道,豆瓣已经帮你记录了一年来的音乐足迹,从哪天注册哪天听第一首歌哪天听的很悲伤--无一遗漏:如果你

规划为道 同方数据资源体系玩转大数据

文章讲的是规划为道 同方数据资源体系玩转大数据,大数据的应用前景之大已经毋庸置疑.据Gartner发布的<大数据驱动基础架构>报告显示,2013年大数据带动的IT支出有望达到340亿美元;到2016年,全球在大数据方面的总支出将达到2320亿美元.Gartner还强调,大数据工具在2014年将被视为一种必要投资. 当前,越来越多企业将大数据的分析结果作为其判断未来发展的依据.同时,传统的商业预测逻辑正日益被新的大数据预测所取代.不过,海量数据只有在得到有效治理的前提下才能进一步发展其业务价值.

SQL Server:大企业如何玩转大数据?

文章讲的是SQL Server:大企业如何玩转大数据,"得大数据者得天下." 推崇大数据时代的变革者们对此坚信不疑. 在大数据时代,谁能有效地管理和控制数据,谁就有可能成为世界霸主.中国石油化工集团公司信息系统管理部副主任齐学忠也认同这个观点.不过,有效的管理和控制数据并非一件容易的事情,齐学忠就经常为中石化的合同管理而头疼. 营业收入超4000亿美元,全球排名领先的巨型企业--中国石化,其合同管理就是不折不扣的"大数据".中国石化集团拥有众多分子公司,总部和所有下

正确的理解,是玩转大数据的前提

眼下,无论是高校还是科研机构,以"大数据"为关键词的研讨会一拨接着一拨,云计算.物联网.智能终端--这些新概念串烧着出现,仿佛"大数据"正撬动着一个非"技术宅"免进的新世界. 到底什么是大数据的真面目?英国帝国理工学院终身教授.帝国理工数据科学研究所所长郭毅可给出的却是一个举重若轻的解释."大数据首先不是概念,而是一种现象.一种新发现的资源.就如同人类发现了新的石油一样--对大数据的发掘意味着可以创造财富,也正因此,大数据会引发一系列的

抗衡互联网冲击,购物中心要玩转大数据

大数据.云计算.互联网--这些虚拟空间的名词正在跟实体产业融合,互联网与传统行业之间的界限越来越模糊,飞凡.喵街.大众点评加上不计其数的O2O产品让实体商业变得越来越好玩,人们在虚虚实实之间享受着"互联网+"带来的方便.经济和愉悦感. 与此同时,还有一大批实体商业正在忙碌地编织着适合自己的互联网.大型的购物中心开始铺设免费Wi-Fi.导入Beacon微定位技术.建设在线商城.开展朋友圈营销--不亦乐乎地为迈进"互联网+"新时代准备着. 智慧商业,过去只存在于人们唠嗑

经验之谈:如何像Google一样玩转大数据

文章讲的是经验之谈:如何像Google一样玩转大数据,像Google一样玩转大数据到底难不难?企业能从Google身上借鉴哪些经验?本文就将进行深入的讨论. 简单来说,Google处理大数据的方式可以总结为以下几点: 1.收集原始数据,捕捉每一个网站的内容,电子邮件或者Cookie,然后抽取出关键的信息 2.为这些信息创建复杂的关联索引以及与广告相关的索引 3.将索引和相应的内容存储在分布式的服务器上 4.当用户浏览网页进行搜索,或者查看电子邮件时,Google就会将用户的请求放到一个复杂的"翻

风险管理更精准 银行也要玩转大数据

全球知名咨询公司麦肯锡在其发布的大数据报告中称:"数据,已经渗透到当今每一个行业和业务智能领域,成为重要的生产因素.人们对于海量数据的挖掘和运用,预示着新一波生产增长率和消费者盈余浪潮的到来." 大数据与各行各业的结合已经越来越紧密,拥有得天独厚大数据优势的银行也不例外.网上银行.手机银行.财富管理.信用卡平台等系统内的客户交易数据,核心系统.信贷系统.客户关系维护系统.计价系统等客户的基础信息,产生了大量的数据.这些数据可以帮助银行进行业务总结和洞察.细分客户.预见客户流失.提出增值