数据挖掘工具:谁最适合CRM

自从我上次斗胆回答“如何选择数据挖掘工具”之后,已经好几年过去了。本文主要阐述以下两个核心观点:

1. 没有最好的工具,更确切地说,没有适合所有人的最好的工具。

2. 最有用的工具,是那些能够满足你所需要的绝大多数数据挖掘任务的工具。

主要的数据挖掘任务

大多数数据挖掘人员都明白,数据挖掘项目中70%到90%的工作是做数据准备。在数据挖掘工具的演进过程中,数据准备功能的开发一直被放在次要位置上。最后,你要能够对模型准确评估,才能比较多个模型,并将它们推荐给市场人员。

数据准备任务

常见的数据准备任务包括:

◆进行数据评估

以判别出:

缺失值(空字符串、空格、空值)

孤立点

共线性评估(自变量之间的相关性)

◆合并多个数据集;

◆从不同输入格式到通用分析格式的元数据(字段的名称和类型)映射;

◆将类似变量的值变换为通用格式;

◆某些算法对输入变量有特殊要求,需要将数值型变量变换为类别型(通过数据分箱和分类),或者将类别型变换为数值型;

◆将变量值切分为多个字段,或将多个字段合并为一个字段;

◆从现有变量中派生新变量。大多数数据挖掘人员发现,有些最具有预测能力的变量,正是派生出来的变量。

大多数数据挖掘工具会把这些数据挖掘功能放在次要的地位, 本文则会侧重评估常见数据挖掘工具处理这些任务的能力。

除了能支持以上的数据准备任务,一个好的数据挖掘工具还应该包含模型评估的功能,以便比较建模过程中产生的多个模型,并用于支持直效营销(direct marketing)。

时间: 2024-12-28 05:27:06

数据挖掘工具:谁最适合CRM的相关文章

合理选择数据挖掘工具

摘 要:数据挖掘作为一项从海量数据中提取知识的信息技术引起了国内外学术界和产业界的广泛关注,它在商业方面的成功应用使得软件开发商不断开发新的数据挖掘工具,改进现有的数据挖掘工具,一时之间数据挖掘工具可谓琳琅满目,于是出现了如何合理选择挖掘工具的问题.鉴于此,本文提出并讨论了五点关于合理选择数据挖掘工具的技巧. 关键词:数据挖掘:数据挖掘工具:数据仓库 随着数据库和计算机网络的广泛应用,加上先进的数据自动生成和采集工具的使用,人们拥有的数据量急剧增大.然而数据的极速增长与数据分析方法的改进并不成正

工具推荐 | 分析大数据最需要的Top 10数据挖掘工具

本文讲的是工具推荐 | 分析大数据最需要的Top 10数据挖掘工具,首先,我们要了解什么是数据挖掘?官方提供的定义如下:数据挖掘又称为资料探勘.数据采矿.它是数据库知识发现(Knowledge-Discovery in Databases,简称:KDD)中的一个步骤,一般是指从大量的数据中通过算法搜索隐藏于其中信息的过程.数据挖掘通常与计算机科学有关,并通过统计.在线分析处理.情报检索.机器学习.专家系统(依靠过去的经验法则)和模式识别等诸多方法来实现上述目标. 随着数据量的爆炸式增长,我们需要

Weka实践掌握开源数据挖掘工具的使用

为了满足这种需求,数据挖掘技术的得到了长足的发展,而分类在数据挖掘中是一项非常重要的任务,目前在商业上应用最多.本文主要侧重数据挖掘中分类算法的效果的对比,通过简单的实验(采用开源的数据挖掘工具 -Weka)来验证不同的分类算法的效果,帮助数据挖掘新手认识不同的分类算法的特点,并且掌握开源数据挖掘工具的使用. 分类算法是解决分类问题的方法,是数据挖掘.机器学习和http://www.aliyun.com/zixun/aggregation/12097.html">模式识别中一个重要的研究领

银行间债市衍生工具扩容:新版CRM落地 参与门槛降低

9月23日,中国银行间市场交易商协会(下称"交易商协会")发布修订后的<银行间市场信用风险缓释工具试点业务规则>(下称<业务规则>),以及信用风险缓释合约(CRMA, Credit Risk Mitigation Agreement).信用风险缓释凭证(CRMW, Credit Risk Mitigation Warrant).信用违约互换(CDS, Credit Default Swap)及信用联结票据(CLN, Credit Linking Note)四份产

数据挖掘工具分析北京房价 (一) 数据爬取采集

   一. 前言          房价永远是最让人头疼且激动的话题,尤其是在帝都,多少人一辈子都为了一套房子打拼.正好我也想用一个大家比较关心的话题作为案例,把目前我开发的这套软件进行一次完整的演练.从数据采集,到清洗,分析,和最终可视化和报告的呈现,实现一次完整的流程.一方面可以给大家切实的分享一些有用的信息,再者可以更好地了解这套软件的使用流程.               自然的,文章分为四部分,本节是第一部分:数据爬取和采集.      二.  准备工作           俗话说巧妇

使用Flow Solution工具简化数据挖掘建模过程

本系列文章将通过一个虚拟http://www.aliyun.com/zixun/aggregation/17385.html">电信公司的例子,介绍如何使用 InfoSphere Warehouse V10.5(下文简称 ISW Kepler)中的数据预处理工具(Data Preparation)和流解决方案(Flow Solution)解决上述问题. 本文为使用 Data Preparation 和 Flow Solution 工具简化数据挖掘过程系列文章的第二篇,主要介绍如何使用流解决

《数据挖掘:实用案例分析》——3.3 常用的建模工具

3.3 常用的建模工具 数据挖掘是一个过程,只有将数据挖掘工具提供的技术和实施经验与企业的业务逻辑和需求紧密结合,并在实施的过程中不断地磨合才能取得成功.因此我们在选择数据挖掘工具的时候,要全面考虑多方面的因素,主要包括以下几点: 下面简单介绍几种常用的数据挖掘建模工具: 1.Enterprise Miner Enterprise Miner(简称EM)是SAS推出的一个集成的数据挖掘系统,允许使用和比较不同的技术,同时还集成了复杂的数据库管理软件.它的运行方式是通过在一个工作空间(Worksp

基于多维度数据挖掘的电子渠道精准服务-营销模型研究

随着电信市场竞争越发激烈及移动互联网时代的来临,客户对业务的需求日趋多样化和差异化,对运营商服务的质量也提出了更高的要求:另一方面,运营商自身各系统中的大量数据通过精细化模型挖掘必将在分析用户行为.精确识别客户业务需求.开展精细化服务营销方面发挥巨大作用.基于以上两点,本文以客户细分理论与数据挖掘理论为基础,创新性地构建了基于客户业务与价值.客户电子渠道行为及客户基本属性等多维度数据的电子渠道精准服务营销模型,为运营商开展电子渠道精准服务营销提供了决策分析工具.   一.电子渠道精准服务-营销模

做好数据挖掘模型的9条经验总结

数据挖掘是利用业务知识从数据中发现和解释知识(或称为模式)的过程,这种知识是以自然或者人工形式创造的新知识. 当前的数据挖掘形式,是在20世纪90年代实践领域诞生的,是在集成数据挖掘算法平台发展的支撑下适合商业分析的一种形式.也许是因为数据挖掘源于实践而非 理论,在其过程的理解上不太引人注意.20世纪90年代晚期发展的CRISP-DM,逐渐成为数据挖掘过程的一种标准化过程,被越来越多的数据挖掘实践者成功运用和遵循. 虽然CRISP-DM能够指导如何实施数据挖掘,但是它不能解释数据挖掘是什么或者为