如何通过IBM SPSS Modeler对数据进行处理和建模

由于目前">企业客户的业务量和数据量都在不断的提高，随着企业的发展，很多企业的数据存储都不局限于同一个数据库上，如果要对这些存储在不同数据库上的数据进行处理和建模，就需要将这些存储在不同数据库之间的数据进行有效的整合，本文将介绍通过 IBM SPSS Modeler 如何对不同数据库之间的数据进行整合，然后进行建模处理。

IBM SPSS Modeler 介绍

IBM SPSS Modeler 是 IBM 在分析与预测领域解决方案的重要组成部分，它是一组数据挖掘工具，通过这些工具可以采用商业技术快速建立预测性模型，并将其应用于商业活动，从而改进决策过程。Modeler 的界面如图 1 所示：

图 1. IBM SPSS Modeler 界面

IBM SPSS Modeler 通过节点对数据进行处理，然后将这些节点连接起来，就形成了对数据处理的一系列过程，我们将这一过程称为数据流。也可以说 IBM SPSS Modeler 是以数据流为驱动的产品，这一系列节点代表要对数据执行的操作，而节点之间的链接指示数据的流动方向。IBM SPSS Modeler 将节点分为如下几种类型：

源：此类节点可将数据导入 IBM SPSS Modeler，如数据库、IBM SPSS Analytic Server 数据源、文本文件、SPSS
Statistics 数据文件、Excel、XML 等。记录选项：此类节点可对数据记录执行操作，如选择、排序、抽样、合并和追加等。字段选项：此类节点可对数据字段执行操作，如过滤、导出新字段和确定给定字段的测量级别等。图形：此类节点可在建模前后以图表形式显示数据。图形包括散点图、直方图、网络节点和评估图表等。建模：此类节点可使用 IBM SPSS Modeler 中提供的建模算法，如神经网络、决策树、贝叶斯网络、聚类算法、支持向量机、和数据排序等。输出：节点生成数据、图表和可在 IBM SPSS Modeler 中查看的模型等多种输出结果。导出：节点生成可在外部应用程序（如 IBM SPSS Data
Collection、数据库、XML、IBM SPSS Analytic Server 数据或 Excel）中查看的多种输出。 IBM SPSS Statistics：节点将 IBM SPSS Statistics 数据导入或导出为 SPSS Statistics 数据，以及运行 SPSS Statistics 提供的功能。

IBM SPSS SDAP 介绍

1. SDAP 的安装

IBM® SPSS® Data Access Pack（简称 SDAP）是在 Modeler 的安装盘附带的 ODBC 驱动程序，运行 setup.exe 文件以启动驱动程序安装，并选择所有相关的驱动程序即可。安装的 SDAP 必须和你使用的 Modeler Server 在同一台机器，也就是说如果你使用本地的 Modeler Server, 那么就安装在 Modeler Client 所在的机器，如果使用的 Modeler Server 和 Modeler Client 不在同一台机器，那么就需要安装在 Modeler Server 所在的机器。

图 2. SDAP 的安装

2. 创建 ODBC

这里以 Windows 7 为例，装好 SDAP 驱动后，从“开始”菜单中选择所有程序，选择管理工具，选择数据源 (ODBC)，在打开的对话框中选择系统 DSN 选项卡，然后单击添加，在打开的对话了狂选择要添加的数据库的驱动，如图 3 所示：

图 3. 选择驱动

点击完成按钮后，配置数据库的信息，对于不同的数据需要输入不同的信息，本文将以主流的 IBM DB2、Oracle 和 SQL Server 为例。如图 4 所示：

图 4. 创建 DB2 ODBC

在“ODBC DB2 Wire Protocol 驱动程序设置”对话框中需要指定如下内容：

数据源名称（指定一个 ODBC 的名字）； IP 地址，指定 DB2（Oracle，SQL Server） RDBMS 所在服务器的主机名或者 IP 地址； TCP 端口 ( 对于 DB2，默认是 50000，Oracle 是 1521，SQL Server 是 1433)；数据库的名称（指定需要连接的数据库）；

点击“测试连接”后，输入要连接数据库的用户名和密码，然后单击确定按钮。此时会显示“连接已建立！”的消息，说明配置成功。

对于 Oracle 数据库来说，如图 5 所示：

图 5. 创建 Oracle ODBC

对于 SQL Server 数据库如图所示：

图 6. 创建 SQL Server ODBC

时间： 2024-11-08 19:47:07

如何通过IBM SPSS Modeler对数据进行处理和建模的相关文章

IBM SPSS Modeler与数据库集成建模及优化（二）

了解 IBM SPSS Modeler 与数据库集成和优化在这个由三部分组成的关于 IBM SPSS Modeler 与数据库集成建模及优化系列的第一部分中,我们谈到了使用数据库节点对数据库进行写入及读取数据操作.接下来,我们将介绍使用 SPSS Modeler 应用程序在数据库中构建.评分和存储模型.通过集成,可将 SPSS Modeler 的分析功能和易用性与数据库的强大性能相结合,同时还可运用数据库提供商提供的数据库自有算法进行建模.通过 SPSS Modeler

IBM SPSS Modeler 与数据库集成建模及优化（三）

IBM SPSS Modeler 与数据库集成建模及优化在这个由三部分组成的关于 IBM SPSS Modeler 与数据库集成建模及优化系列的前两部分中,我们谈到了与数据库相关的基本操作及集成建模,本部分将重点关注 SPSS Modeler 集成使用数据库的过程中的性能优化,包括多种功能的介绍和技巧的使用: 数据操作回送模型回送数据库插件 - 评分服务适配器调用数据库函数重新排列执行顺序性能提升技巧总结本文假设读者熟悉在 SPSS Modeler 中如何建立数据库连接及其他一些基

IBM SPSS Modeler与数据库集成建模及优化(一)

IBM SPSS Modeler 与数据库集成和配置作为 IBM 分析与预测解决方案的重要组成部分,IBM SPSS Modeler 是一组数据挖掘工具,通过这些工具可以采用商业技术快速建立预测性模型 ,并将其应用于商业活动,从而改进决策过程. 其可对企业级海量数据进行处理与建模,通过强大的数据库集成功能更可以直接与企业已有的数据库集成进行数据挖掘.不仅避免了企业资金重复投入, 而且可以获取更好的数据挖掘性能. 比如某公司经过多年的积累,有非常庞大的数据且存储于数据库中 ,希望能使用 SP

IBM SPSS Modeler Entity Analytics 实例应用分析

简介 IBM SPSS Modeler Entity Analytics (EA) 是在 IBM SPSS Modeler 14.2 预测分析的基础上添加到 IBM SPSS Modeler 15.0 的全新功能.Entity Analytics 和传统的 Modeler 相比,对数据预测有着全新的维度.IBM SPSS Modeler 预测的重点在于根据过去的数据预测未来的行为.而 Entity Analytics 重点在于通过解析已有的数据,在不同的已有数据源中,解析自身的身份冲突,从

IBM SPSS Modeler 在电力负荷预测中的应用

电力负荷预测是电力系统调度.用电.计划.规划等管理部门的重要工作之一.提高负荷预测水平,有利于计划用电管理,有利于合理安排电网运行方式和机组检修计划,有利于节煤.节油和降低发电成本,有利于制定合理的电网建设规划,有利于提高电力系统的经济效益和社会效益.因此,负荷预测已成为实现电力系统管理和现代化的重要内容之一. IBM SPSS Modeler 简介 IBM SPSS Modeler 是一组数据挖掘工具,通过这些工具可以采用计算机技术快速建立预测性模型,并将其应用于商业活动,从而改进决策

使用IBM SPSS Modeler进行社交网络分析

社交http://www.aliyun.com/zixun/aggregation/13143.html">网络分析(SNA)是 Modeler 15 增加的一个新功能.SNA 映射和度量个人.组和其它实体(定义为节点)之间的关系.典型应用包括客户流失预警,病毒式营销等,也可以与传统数据挖掘模型结合使用以提高后者的性能.本文将介绍 Modeler 中两种 SNA 模块的算法原理 , 并通过实例讲解,使读者了解 SNA 的使用方法. 背景知识:社交网络分析.数据挖掘.IBM SPSS Mod

几种典型的第三方产品和IBM SPSS Modeler连接

它能和多种第三方产品连接,更好地实现数据的数据的预测.整合和分析.本文将介绍几种典型的第三方产品和 Modeler 的连接.IBM SPSS Modeler 软件已经可以和其他一些最新的产品很好的整合在一起,形成完整的解决方案. 例如:SPSS Data Collection.Statistic.Collaboration Deployment Service.Cognos 一起就形成了对调查研究的完整解决方案.它还能够嵌入各种各样的数据源和数据文件,再将他们进行分析,深层次地挖掘.而新增与

在UNIX环境下部署高效的IBM SPSS Modeler Server

本文通过实例介绍了三种配置部署策略,分别满足不同类型的http://www.aliyun.com/zixun/aggregation/12909.html">客户需求,使客户能顺利的应用到实际的业务流程中. Modeler Server 架构和系统特点 IBM SPSS Modeler Server 作为企业级数据挖掘工作平台,与一个或多个 IBM SPSS Modeler 安装程序一起在分布式分析模式下不间断运行.它采用三层分布式基础架构,如图 1 所示,通过网络与 Modeler 和数

IBM SPSS Modeler产品间安全通信的部署策略

本文通过实例详细介绍 IBM SPSS Modeler 产品间安全通信的部署策略,从而满足对安全性要求比较高的http://www.aliyun.com/zixun/aggregation/12909.html">客户需求,使客户能放心的应用到实际的业务流程中. 1. 前言 – 关于 IBM SPSS Modeler 产品 IBM SPSS Modeler 是一组数据挖掘工具,通过这些工具可以采用商业技术快速建立预测性模型,并将其应用于商业活动,从而改进决策过程.IBM SPSS Mode

猜你喜欢

Access通用-自动替换数据库中的字符串

自己可以修改myreplace函数,实现复杂的替换.呵呵,好象用处不大.主要是看看如何读取access表和字段列表 <%'#################################### ...

图片上传，包含读取图片字节大小及长宽，及Base64转换

上传|转换 <form id="PicAdd" method="post" runat="server" enctype=" ...

PHP无限级分类方法及代码

无论你要构建自己的论坛,在你的网站上发布消息还是书写自己的CMS程序,你都会遇到要在数据库中存储层次数据的情况.同时,除非你使用一种像XML的数据库,否则关系数据库中的表都不是层次结构的,他们只是一个 ...

JavaScript EE，第2部分:用Ajax调用远程JavaScript函数

在本系列的第1部分中,您学习了如何在Asynchronous JavaScript and XML(Ajax)和Java Platform, Enterprise Edition(Java EE)应用 ...

封装较完整的串口类库

串口在工业应用是极为普遍的,我用API封装了同步和异步的串口类,以及一个具有监视线程的异步串口类:使用简单高效,具有工业强度,我在BC, BCB, VC, BCBX, GCC下编译通过,相信足够应付大 ...

PPT绘制一个安卓机器人的方法

PPT绘制一个安卓机器人的方法 1.按住Shift键使用圆角矩形工具绘制一个圆角正方形,绘制好之后调节圆角的黄色手柄节点,缩小圆角的弧度,将矩形填充为绿色,轮廓设置为无轮廓. 2.绘制一个矩形,覆 ...

快速打造柔美的淡褐色非主流图片

快速打造柔美的淡褐色非主流图片减色是图片处理中最为常用的方法,不过色调要减到好处.如下面的教程,作者去除了背景部分一些杂色,主色调成了褐色,并保留画面中的绿色,效果非常清爽,柔美. 原图最终效 ...

在Word2007中快速生成指定段落数量的文字

本文我们介绍一个小技巧--在Word2007中快速生成指定段落数量的文字.大家可以用这个方法来快速生成指定段落和句子的文字,进行Word功能测试.学习等. 在Word的编辑界面中输入"=ra ...

提高U盘速度的方法

目前主流的U盘已经8G.16G了,写入速度相对显得不足,下面提供了一个方法,称可以修改一下系统就大大提升Windows7下的U盘的性能. 这个办法跟我们所知的提升SATA硬盘性能的方法差不多,也就 ...

《圣殿祭司的ASP.NET4.0专家技术手册》---- 1-6 VS 2010 SP1安装与三个扩展管理工具

1-6 VS 2010 SP1安装与三个扩展管理工具圣殿祭司的ASP.NET4.0专家技术手册 2011年3月,微软推出VS 2010 SP1软件补丁,里面包含许多新功能与问题修正,其中与Web开发 ...

子类方法返回类型必须和父类相同，抛出的异常声明可以小于或等于父类

Overload译为重载:Override译为重写或者覆盖: Overload讨论: Java中同一个类不可以有两个相同的方法(方法名.参数类型.参数个数和参数位置都相同).但可以有方法名相同, ...

python生成随机字符的问题

问题描述 python生成随机字符的问题我是想写个返回四个随机字符的代码,但是下面程序什么也不输出,也没有提示错误.下面是主要代码: chars='' for t in range(4): strr ...

源代码-win7下用Java如何编写程序自动修改host文件,

问题描述 win7下用Java如何编写程序自动修改host文件, ,即在程序运行时可输入网址,来屏蔽某些网站,急求源代码,求大神解答解决方案这个必须调用其它程序编写的动态库,比如用C++编写一个D ...

阿里邮箱发布“Mail+”战略有望与畅捷通工作圈互通互联

日前,用友畅捷通助理总裁.工作圈事业部总经理任旭东参加阿里邮箱产品发布会时首次谈及畅捷通跟阿里云深度合作后的进展,以及如何用云计算与大数据技术对企业软件进行升级. "畅捷通与阿里云合作得非常 ...

蓝代斯克助力企业决胜现代化IT

7月底,全球领先的系统生命周期管理.终端安全和IT服务管理解决方案供应商,蓝代斯克先后在北京.上海.广州召开了LANDESK2016全国客户峰会.蓝代斯克全球首席营销官Steve Morton.蓝代斯 ...

PC、iOS、Android通用的交互设计

本文作者@一大坨黄供职@微博UDChttp://www.aliyun.com/zixun/aggregation/11452.html">设计中心 .近年来,在技术方式,网页自适应的 ...

使用PowerShell找到可写的Windows服务并利用

本文讲的是使用PowerShell找到可写的Windows服务并利用,从DidierStevens的博客学到了一些技巧,本文将要对其中涉及到的技巧进行测试总结,并开源一个powershell脚本,用来 ...

C#如何获取intptr所指对象的内容？

问题描述是在Emgu里用的,我用Intptr指向了一个矩阵,而这个矩阵式通过一个方法返回的,我该怎么查看这个矩阵的值?下面是代码warp_mat=CvInvoke.cvGetPerspectiveT ...

Android ScrollView向上滑动控件顶部悬浮效果实现

本文参考了:<上滑停靠顶端的悬浮框>的代码,在此表示感谢.[上滑停靠顶端的悬浮框]里的实现方法是使用两个控件,滑动时,监听ScrollView的滚动Y值,从而通过对两个控件的显示隐藏来实现 ...

app重复升级的问题，所有配置都是没问题的

问题描述 app重复升级的问题,所有配置都是没问题的 1.我们app升级时是在登录的时候将app版本号传给后台,后台根据最新版本号,返回服务端最新的版本号以及下载地址,下载地址是固定的. 2.app判 ...

3000点之上机构多空口水仗背后：基金主动性减仓升7%

上证指数在突破3000点大关之后,并没有遭遇到市场此前预期的在整数关口面临的阻力. 7月6日,在钢铁.券商等板块带动之下,上证指数继续走强,走出了继7月1日跃上3000点之后的第四根小阳线,当日上证指 ...

Laravel框架学习笔记（二）项目实战之模型（Models）_php实例

在开发mvc项目时,models都是第一步. 下面就从建模开始. 1.实体关系图, 由于不知道php有什么好的建模工具,这里我用的vs ado.net实体模型数据建模下面开始laravel编码,编码 ...

无数据库的详细域名查询程序PHP版(5)_php基础

文件十四:wizardres.tml <p>下面结果来自域名注册向导, 这些结果从<i>[>WHOIS_SERVER<]</i>获得, 点击订购可以申请 ...

jQuery和JavaScript节点插入元素的方法对比_javascript技巧

二.插入元素: <div> <p>面朝大海,春暖花开</p> </div> (一).jQuery方法 1.在节点内部插入: 方法说明 append() ...

C++中可正确获取UTF-8字符长度的函数分享_C 语言

在C++的char*以及string中,使用的是字节流编码,即sizeof(char) == 1. 也就是说,C++是不区分字符的编码的. 而一个合法UTF8的字符长度可能为1-4位. 现在假设一串输 ...

Python 时间操作例子和时间格式化参数小结_python

1.取过去具体时间的方法: 复制代码代码如下: #!/usr/bin/python import time #取一天前的当前具体时间 time.strftime('%Y-%m-%d %T' ...

随机森林：猜糖豆游戏揭示的机器学习算法

还记得那款老的嘉年华游戏吗,大家一起猜测一个罐子里糖豆的数量?虽然准确猜出糖豆的数量需要一点运气和技巧的组合,事实证明,通过平均所有人的各种各样的猜测,平均结果出奇地接近正确答案. 这是一个被称为&q ...

北京一高新企业开发腾讯游戏外挂牟利千万

在全国同行游戏中排名前三.深圳腾讯公司引进代理的火爆网络游戏<地下城与勇士>被"盯"上了,北京一家正规公司开发"萝卜游侠"等软件外挂<地下城与 ...

汉王或推Android平板电脑深化同元太合作

2010年ChinaJOy即将在上海拉开帷幕,http://www.aliyun.com/zixun/aggregation/12821.html">汉王科技参加了本次展会.汉王科技董 ...

Buzzinate CEO：社会化分享重点在于数据挖掘

中介交易 http://www.aliyun.com/zixun/aggregation/6858.html">SEO诊断淘宝客云主机技术大厅图为Buzzinate CEO李彦 ...

热搜