1.4 数据挖掘现状及应用前景
“数据海量,信息缺乏”是大多数金融企业所面对的尴尬。目前,金融业实施的大多数数据库只能实现数据的录入、查询、统计等较低层次的功能,却无法发现数据中存在的各种有用信息,例如对这些数据进行分析,发现其数据模式及特征,然后可能发现某个客户、消费群体或组织的金融和商业需求,并观察金融市场的变化趋势。
作为一门应用技术,数据挖掘可谓涵盖广泛,尤其在发达国家,数据挖掘技术的触角已经伸向了各行各业。只要企业拥有具分析价值的数据源,皆可利用数据挖掘工具进行有目的的挖掘分析。一般较常见的应用案例多发生在零售业、制造业、财务金融保险、通信业以及医疗服务等。数据挖掘的应用领域具体可以分为以下三类:
可以说,未来若干年,数据挖掘将会成为极为重要的成长领域,数据挖掘的应用也会越来越广泛。研究结果显示,企业所处理的数据每五年就会呈现倍数增长。
大部分的企业并没有数据不足的问题,而过度的数据重复与不一致才是大问题,这使得企业无论在使用、有效管理、以及将这些数据用于决策过程方面都遭遇到了问题。因此市场需要的是能够将数据转变成可靠与可用信息的系统。
不同领域的专家对数据挖掘都表现出了极大的兴趣,例如在信息服务业中出现了一些应用,在Internet数据仓储和线上服务中也给企业增加了许多生机。同时在产学合作下,又发展出了许多实用的系统,例如MDT、Coverstory and Spotlight、NichWork Visualization System、LBS、FALCON、FAIS、NYNEX、TASA等。目前已被许多研究者视为结合数据库系统和机器学习技术的重要领域。对于研究者来说,数据挖掘是个充满潜力和机遇无限的研究领域。
由于数据挖掘能分析出数据中的有用信息,给企业带来显著的经济效益,这使得数据挖掘技术越来越普及。IDC预测,2015年中国大数据市场规模或达169亿美元,数据挖掘市场规模大约为140亿美元,并对欧洲和北美62家采用了数据挖掘技术的企业进行调查分析,发现这些企业的3年平均投资回报率为401%,其中25%的企业的投资回报率超过600%。
美国Palo Alto管理集团公司对欧洲、北美和日本375家大中型企业的数据挖掘技术的采用情况进行了调查。结果显示,在金融领域,数据挖掘技术的应用水平已经达到或接近70%,在营销领域也达到50%,并且在未来的数年中,各个应用领域对该技术的采纳水平都将提高约50%。
近年来,甲骨文、IBM、微软和SAP耗费超过150亿美元收购专门从事数据挖掘的软件公司。这个产业预计有1000亿美元市场容量,并以每年10%的速度增长,是软件产业整体增速的两倍。英国电信要发布一种新的产品,通过直邮的方式向客户推荐这种产品,使用数据挖掘技术可以使直邮的回应率提高100%;GUS日用品零售商店需要准确预测未来的商品销售量,降低库存成本,使用数据挖掘技术使库存成本比原来减少了3.8%;汇丰银行需要对不断增长的客户群进行分类,针对每种产品找出最有价值的客户,使用数据挖掘技术营销费用减少了30%;美国国防财务部每年有上百万笔的军火交易,使用数据挖掘技术能够发现可能存在的欺诈交易,然后进行深入调查,这样节约了大量的调查成本。