IBM SPSS Modeler与数据库集成建模及优化(一)

IBM SPSS Modeler 与数据库集成和配置

作为 IBM 分析与预测解决方案的重要组成部分,IBM SPSS Modeler 是一组数据挖掘工具,通过这些工具可以采用商业技术快速建立预测性模型 ,并将其应用于商业活动,从而改进决策过程。 其可对企业级海量数据进行处理与建模,通过强大的数据库集成功能更可以直 接与企业已有的数据库集成进行数据挖掘。不仅避免了企业资金重复投入, 而且可以获取更好的数据挖掘性能。

比如某公司经过多年的积累,有非常庞大的数据且存储于数据库中  ,希望能使用 SPSS Modeler 在现有数据中进行数据挖掘以做出有利于本公司的决策。  那么公司首先将会面临一些疑问或者问题,包括:SPSS Modeler 如何与数据库沟通,  怎么取得数据进行建模,怎么存储建模结果,如何保证在大型数据上运算的性能,等等。

本系列文章将分三部分针对这些问题一一进行解答,其中第一部分介绍基本知识包括数据库配置及操作, 第二部分介绍数据库集成建模,第三部分介绍性能优化。此为第一部分。

安装驱动程序

SPSS Modeler 可通过数据库源节点使用 ODBC(开放数据库连接)从多种数据库中导入数据, 包括 DB2、Netezza、Oracle、Teradata、Microsoft SQL Server 等数十种数据库。 要读取或写入到数据库中,您必须为相关数据库安装驱动包并配置 ODBC 数据源, 并根据需要配置读取或写入权限。IBM SPSS Data Access Pack 包含一组用于此用途的 ODBC 驱动程序, 支持多种操作系统平台。

IBM SPSS Modeler 为典型的 C/S 架构产品,如果仅以本地(独立)模式运行 IBM SPSS Modeler   ,必须在本地计算机上安装驱动程序。

如果以分布模式连接远程 IBM SPSS Modeler Server 运行 SPSS Modeler,需要在安装 SPSS Modeler Server 的计算机上安装 ODBC 驱动程序

使用下列一般步骤访问数据库中的数据:

为要使用的数据库安装 ODBC 驱动程序并配置数据源。

在数据库节点对话框中,使用表模式或 SQL 查询模式连接到数据库。

从数据库中选择表。

使用数据库节点对话框中的选项卡,可以更改使用类型和过滤数据字段。

在后面的章节中将对这些步骤进行更详细地说明。这里首先进行驱动安装与配置。

Windows 平台数据库驱动安装与数据源配置

IBM SPSS Data Access Pack 发布的 Windows 版本包括 32 位与 64 位版本,我们在这里使用 32 位做演示, 请注意在实际使用时选择合适的版本安装。

其安装过程采用典型的 step-by-step 方法,我们只需要使用默认设置一步一步安装即可。 安装完成后,打开控制面板 -> 管理工具 -> 数据源 (ODBC), 在驱动程序页面可以看到已经安装好一批相应的数据库驱动。

图 1.ODBC 驱动

我们以 DB2 为例继续后面的操作,其他数据库类似。

回到 ODBC 数据库源管理器系统 DSN 页面,点击添加按钮,选择 SPSS Inc OEM 6.0 DB2 Wire Protocol 驱动程序。

图 2.ODBC 数据源管理器 - 系统 DSN

时间: 2024-12-21 04:31:14

IBM SPSS Modeler与数据库集成建模及优化(一)的相关文章

IBM SPSS Modeler 与数据库集成建模及优化(三)

IBM SPSS Modeler 与数据库集成建模及优化 在这个由三部分组成的关于 IBM SPSS Modeler 与数据库集成建模及优化系列的前两部分中,我们谈到了与数据库相关的基本操作及集成建模,本部分将重点关注 SPSS Modeler 集成使用数据库的过程中的性能优化,包括多种功能的介绍和技巧的使用: 数据操作回送 模型回送 数据库插件 - 评分服务适配器 调用数据库函数 重新排列执行顺序 性能提升技巧总结 本文假设读者熟悉在 SPSS Modeler 中如何建立数据库连接及其他一些基

IBM SPSS Modeler与数据库集成建模及优化

在这个由三部分组成的关于 IBM® SPSS® Modeler 与数据库集成建模及优化系列的前两部分中,我们谈到了与数据库相关的基本操作及集成建模,本部分将重点关注 SPSS Modeler 集成使用数据库的过程中的http://www.aliyun.com/zixun/aggregation/14109.html">性能优化,包括多种功能的介绍和技巧的使用: • 数据操作回送 • 模型回送 • 数据库插件 - 评分服务适配器 • 调用数据库函数 • 重新排列执行顺序 • 性能提升技巧总结

IBM SPSS Modeler与数据库集成建模及优化(二)

了解 IBM SPSS Modeler 与数据库集成和优化 在这个由三部分组成的关于 IBM SPSS Modeler 与数据  库集成建模及优化系列的第一部分中,我们谈到了使用数据库  节点对数据库进行写入及读取数据操作.接下来,我们将介绍使用 SPSS   Modeler 应用程序在数据库中构建.评分和存储模型.通过集成,可将  SPSS Modeler 的分析功能和易用性与数据库的强大性能相结合,同时还  可运用数据库提供商提供的数据库自有算法进行建模.通过 SPSS Modeler  

如何通过IBM SPSS Modeler对数据进行处理和建模

由于目前http://www.aliyun.com/zixun/aggregation/18046.html">企业客户的业务量和数据量都在不断的提高,随着企业的发展,很多企业的数据存储都不局限于同一个数据库上,如果要对这些存储在不同数据库上的数据进行处理和建模,就需要将这些存储在不同数据库之间的数据进行有效的整合,本文将介绍通过 IBM SPSS Modeler 如何对不同数据库之间的数据进行整合,然后进行建模处理. IBM SPSS Modeler 介绍 IBM SPSS Modele

IBM SPSS Modeler产品间安全通信的部署策略

本文通过实例详细介绍 IBM SPSS Modeler 产品间安全通信的部署策略,从而满足对安全性要求比较高的http://www.aliyun.com/zixun/aggregation/12909.html">客户需求,使客户能放心的应用到实际的业务流程中. 1. 前言 – 关于 IBM SPSS Modeler 产品 IBM SPSS Modeler 是一组数据挖掘工具,通过这些工具可以采用商业技术快速建立预测性模型,并将其应用于商业活动,从而改进决策过程.IBM SPSS Mode

IBM SPSS Modeler 在电力负荷预测中的应用

电力负荷预测是电力系统调度.用电.计划.规划等管理部门的重要工作之一.提高负荷预测水平,有利 于计划用电管理,有利于合理安排电网运行方式和机组检修计划,有利于节煤.节油和降低发电成本,有利于 制定合理的电网建设规划,有利于提高电力系统的经济效益和社会效益.因此,负荷预测已成为实现电力系统 管理和现代化的重要内容之一. IBM SPSS Modeler 简介 IBM SPSS Modeler 是一组数据挖掘工具,通过这些工具可以采用计算机技术快速建立预测性模型,并将其 应用于商业活动,从而改进决策

使用IBM SPSS Modeler进行社交网络分析

社交http://www.aliyun.com/zixun/aggregation/13143.html">网络分析(SNA)是 Modeler 15 增加的一个新功能.SNA 映射和度量个人.组和其它实体(定义为节点)之间的关系.典型应用包括客户流失预警,病毒式营销等,也可以与传统数据挖掘模型结合使用以提高后者的性能.本文将介绍 Modeler 中两种 SNA 模块的算法原理 , 并通过实例讲解,使读者了解 SNA 的使用方法. 背景知识:社交网络分析.数据挖掘.IBM SPSS Mod

几种典型的第三方产品和IBM SPSS Modeler连接

它能和多种第三方产品连接,更好地实现数据的数据的预测.整合和分析.本文将介绍几种典型的第三方产品和 Modeler 的连接.IBM SPSS Modeler 软件已经可以和其他一些最 新的产品很好的整合在一起,形成完整的解决方案. 例如:SPSS Data Collection.Statistic.Collaboration Deployment Service.Cognos 一起就形成了对调查研究的完整解决方案.它还能够嵌入各种各样的数据源和数据文件,再将他们进行分析,深层次地挖掘.而新增与

IBM SPSS Modeler在电力负荷预测行业的解决方案

电力负荷预测是电力系统调度.用电.计划.规划等管理部门的重要工作之一.提高负荷预测水平,有利于计划用电管理,有利于合理安排电网运行方式和机组检修计划,有利于节煤.节油和降低发电成本,有利于制定合理的电网建设规划,有利于提高电力系统的经济效益和社会效益.因此,负荷预测已成为实现电力系统管理和现代化的重要内容之一. IBM SPSS Modeler 简介 IBM SPSS Modeler 是一组数据挖掘工具,通过这些工具可以采用计算机技术快速建立预测性模型,并将其应用于商业活动,从而改进决策过程.