IBM SPSS Modeler Entity Analytics 实例应用分析

简介

IBM SPSS Modeler Entity Analytics (EA) 是在 IBM SPSS Modeler 14.2 预测分析的基础上添加到 IBM SPSS Modeler 15.0 的全新功能。Entity Analytics 和传统 的 Modeler 相比,对数据预测有着全新的维度。IBM SPSS Modeler 预测的重点在于根据过 去的数据预测未来的行为。而 Entity Analytics 重点在于通过解析已有的数据,在不同的 已有数据源中,解析自身的身份冲突,从而来提高当前数据的连贯性和一致性。

功能 介绍

EA 基本配置

如果我们有下面的两条数据,来自美国某银行的数据 A,和 来自另一银行的数据 B:

这第三条数据虽然只简单地包括了姓名,电话,驾驶证号码,信用卡号码这么 4 个部分,但是它强而有效的把数据 A 和数据 B 联系到了一起。数据 A 和数据 C 的姓名都 是 JOHN SMITH, 驾驶证号码都是 0001133107; 数据 B 和数据 C 的电话号码都是 555- 1212,信用卡号码都是 102291328.  因此,我们可以推断,实际上数据 A 和数据 B 其实描述的是同一个人。如果将来我们发现数据 A 里的 john smith 有诈骗嫌疑,我们就可 以迅速的推断,他也可能在花旗银行和摩根银行实施同样的行为。这早期的推断会对后期的 预防有非常重要的影响。

如果只有这样简单的一两条数据,我们可以随意的眼观就发 现数据之间的相关性。但是当你的数据成千上万,当你的数据来自几百种不同的数据来源, 当你的数据里面夹在了恶意的假数据时,人力的检测就会微不足道至完全没有用武之地。而 使用我们 IBM SPSS Modeler 15 的 Entity Analytics 新功能,我们用不同的输入节点把来 自各个数据源的数据收集到一起,然后通过 Entity Analytics 的输出接点全部插入到我们 Entity Analytics 的专属数据库中。在每次有了新数据来源的时候,我们通过 Entity Analytics 的处理节点把它和所有数据库里的已知数据进行不同设置的对比,从而判定他们 是不是有相关关系,甚至是推断有怎样的相关关系。除此以外, Entity analytics 还可以 帮助用户把信息进行有效的合并。比如之前我的数据,在合并后就会有如下这些数据:

这样,我们对用户 Jon Smith 的资料掌握就更全面了,全面的资料库会对后期的营销策略等都产生强大的积极 影响。

关于产品的详细资料我们可以通过帮助文档获取,这里就不多提了。今天,我 们重点想和大家讲讲它在商业分析中具体的应用案例。

首先来介绍一下我们的数据源 ,这个数据包括 850 行,28 列,是由我们根据美国信用卡机构的数据组件模式自行创造的 数据。在这个数据里,有很小一部分的人可以通过传统匹配来进行识别。在软件设置为传统 匹配的模式下,被判定为同一个人的数据会自动标示成同一个 EA-ID。

简单的数据预 览截屏如下:

图 1. 数据预览截屏

时间: 2024-10-28 00:44:26

IBM SPSS Modeler Entity Analytics 实例应用分析的相关文章

IBM SPSS Modeler Entity Analytics功能介绍

IBM SPSS Modeler Entity http://www.aliyun.com/zixun/aggregation/16353.html">Analytics (EA) 是在 IBM SPSS Modeler 14.2 预测分析的基础上添加到 IBM SPSS Modeler 15.0 的全新功能.Entity Analytics 和传统的 Modeler 相比,对数据预测有着全新的维度.IBM SPSS Modeler 预测的重点在于根据过去的数据预测未来的行为.而 Enti

使用IBM SPSS Modeler进行社交网络分析

社交http://www.aliyun.com/zixun/aggregation/13143.html">网络分析(SNA)是 Modeler 15 增加的一个新功能.SNA 映射和度量个人.组和其它实体(定义为节点)之间的关系.典型应用包括客户流失预警,病毒式营销等,也可以与传统数据挖掘模型结合使用以提高后者的性能.本文将介绍 Modeler 中两种 SNA 模块的算法原理 , 并通过实例讲解,使读者了解 SNA 的使用方法. 背景知识:社交网络分析.数据挖掘.IBM SPSS Mod

在UNIX环境下部署高效的IBM SPSS Modeler Server

本文通过实例介绍了三种配置部署策略,分别满足不同类型的http://www.aliyun.com/zixun/aggregation/12909.html">客户需求,使客户能顺利的应用到实际的业务流程中. Modeler Server 架构和系统特点 IBM SPSS Modeler Server 作为企业级数据挖掘工作平台,与一个或多个 IBM SPSS Modeler 安装程序一起在分布式分析模式下不间断运行.它采用三层分布式基础架构,如图 1 所示,通过网络与 Modeler 和数

IBM SPSS Modeler产品间安全通信的部署策略

本文通过实例详细介绍 IBM SPSS Modeler 产品间安全通信的部署策略,从而满足对安全性要求比较高的http://www.aliyun.com/zixun/aggregation/12909.html">客户需求,使客户能放心的应用到实际的业务流程中. 1. 前言 – 关于 IBM SPSS Modeler 产品 IBM SPSS Modeler 是一组数据挖掘工具,通过这些工具可以采用商业技术快速建立预测性模型,并将其应用于商业活动,从而改进决策过程.IBM SPSS Mode

IBM SPSS Modeler与数据库集成建模及优化(二)

了解 IBM SPSS Modeler 与数据库集成和优化 在这个由三部分组成的关于 IBM SPSS Modeler 与数据  库集成建模及优化系列的第一部分中,我们谈到了使用数据库  节点对数据库进行写入及读取数据操作.接下来,我们将介绍使用 SPSS   Modeler 应用程序在数据库中构建.评分和存储模型.通过集成,可将  SPSS Modeler 的分析功能和易用性与数据库的强大性能相结合,同时还  可运用数据库提供商提供的数据库自有算法进行建模.通过 SPSS Modeler  

IBM SPSS Modeler与数据库集成建模及优化(一)

IBM SPSS Modeler 与数据库集成和配置 作为 IBM 分析与预测解决方案的重要组成部分,IBM SPSS Modeler 是一组数据挖掘工具,通过这些工具可以采用商业技术快速建立预测性模型 ,并将其应用于商业活动,从而改进决策过程. 其可对企业级海量数据进行处理与建模,通过强大的数据库集成功能更可以直 接与企业已有的数据库集成进行数据挖掘.不仅避免了企业资金重复投入, 而且可以获取更好的数据挖掘性能. 比如某公司经过多年的积累,有非常庞大的数据且存储于数据库中  ,希望能使用 SP

如何通过IBM SPSS Modeler对数据进行处理和建模

由于目前http://www.aliyun.com/zixun/aggregation/18046.html">企业客户的业务量和数据量都在不断的提高,随着企业的发展,很多企业的数据存储都不局限于同一个数据库上,如果要对这些存储在不同数据库上的数据进行处理和建模,就需要将这些存储在不同数据库之间的数据进行有效的整合,本文将介绍通过 IBM SPSS Modeler 如何对不同数据库之间的数据进行整合,然后进行建模处理. IBM SPSS Modeler 介绍 IBM SPSS Modele

几种典型的第三方产品和IBM SPSS Modeler连接

它能和多种第三方产品连接,更好地实现数据的数据的预测.整合和分析.本文将介绍几种典型的第三方产品和 Modeler 的连接.IBM SPSS Modeler 软件已经可以和其他一些最 新的产品很好的整合在一起,形成完整的解决方案. 例如:SPSS Data Collection.Statistic.Collaboration Deployment Service.Cognos 一起就形成了对调查研究的完整解决方案.它还能够嵌入各种各样的数据源和数据文件,再将他们进行分析,深层次地挖掘.而新增与

IBM SPSS Modeler 与数据库集成建模及优化(三)

IBM SPSS Modeler 与数据库集成建模及优化 在这个由三部分组成的关于 IBM SPSS Modeler 与数据库集成建模及优化系列的前两部分中,我们谈到了与数据库相关的基本操作及集成建模,本部分将重点关注 SPSS Modeler 集成使用数据库的过程中的性能优化,包括多种功能的介绍和技巧的使用: 数据操作回送 模型回送 数据库插件 - 评分服务适配器 调用数据库函数 重新排列执行顺序 性能提升技巧总结 本文假设读者熟悉在 SPSS Modeler 中如何建立数据库连接及其他一些基