它能和多种第三方产品连接,更好地实现数据的数据的预测、整合和分析。本文将介绍几种典型的第三方产品和 Modeler 的连接。IBM SPSS Modeler 软件已经可以和其他一些最
新的产品很好的整合在一起,形成完整的解决方案。
例如:SPSS Data Collection、Statistic、Collaboration Deployment Service、Cognos 一起就形成了对调查研究的完整解决方案。它还能够嵌入各种各样的数据源和数据文件,再将他们进行分析,深层次地挖掘。而新增与 Cognos 和 SPSS 家族其他产品的整合使得 Modeler 软件本身就能够提供更为完整的分析、数据挖掘功能。下面的文章将介绍 SPSS Modeler 和其他的第三方产品的连接配置。 SPSS Modeler 介绍 数据库和 SPSS Modeler Teradata 和 Modeler 的连接 ">Netezza 和 Modeler 的连接 Cognos BI 和 SPSS Modeler SPSS Data Collection 和 SPSS Modeler SPSS Statistics 和 SPSS Modeler
SPSS Modeler 介绍
IBM SPSS Modeler 是一个数据挖掘工作台,用于帮助您快速直观地构建预测模型,而无需进行编程。其精密的数据挖掘技术使您能够对结果进行建模,了解哪些因素会对结果产生影响。它还能可提供数据挖掘相关的数据提取 、转换、分析建模、评估、部署等全过程的功能。
图 1. 数据挖据的过程
在数据方面,SPSS Modeler 提供方便、及时的数据访问,可以接入各种各样的数据源和数据文件,在数据挖据过程汇总无需考虑数据源和所在平台及其数据格式。
数据库和 SPSS Modeler
对于某些数据库,大多数 SPSS Modeler 模块采用 SQL 传输,以此方式,可在数据库内执行模型评分,避免评分之前提取数据的需求。每次传输可调用 Modeler 中的本地 SQL,也可以使用不同数据库量身定制的 SQL 评分适配器。如果评分适配器安装在相关的数据库中,SQL 就会根据选项默认会生成评分适配器 SQL,在本章节将介绍 Netezza 和 Teradata 两种评分适配器的配置连接。
Teradata 和 Modeler 的连接
通常我们使用源节点导入存储的数据,其中一种典型的方式是通过 ODBC 兼容关系型数据库。首先配置 ODBC 驱动,然后安装与 Modeler 连接的 adapter 程序。当连接成功后,设置6184.html">数据表的方式或者通过 SQL 语句传输.
(1)安装 Teradata 数据库,启动 Teradata SQL Assistant Java Edition,然后输入命令创建数据库 tddb1 和 tduser1 的用户。
create database tddb1 as perm=50000000;
create user tduser1 as perm=50000000, password=Pass1234;
grant function on tddb1 to tduser1;
(2)安装 Teradata ODBC 驱动,配置 Teradata 的数据源如下图 2,默认 Session Character Set 是 ASCII,需要特别注意的是,如果 Modeler Client 是安装在非英文的操作系统上,需要选择 UTF-8,否则 Modeler 连接 Teradata 的时候会出现图 3 的错误。
图 2. Teradata ODBC 数据源的配置
图 3. 非英文 Modeler 客户端连接 ASCII 字符集的 Teradata 数据库的错误
(3)安装 Teradata 的 SPSS ModelerServer 的评分适配器程序,这个程序可以在 Modeler 的安装包中找到,它必须和 Teradata 的数据库安装在同一系统上。安装成功后,启动 Modeler 客户端,插入源->数据库对象,选择 Teradata 数据库,输入用户名密码,然后连接,如图 4。可以通过查询对相应表和视图进行操作,如图 5。同时还可以选择 Teradata 作为评分适配模式,如图 6。
图 4. Teradata 数据库的连接
图 5. 选择 Teradata 数据库的表/视图
图 6. Teradata 预设评分模式
Netezza 和 Modeler 的连接
Netezza 是专门为数据仓库设计的一体机。它将存储、处理、数据库和分析融入到一个高性能数据仓库设备中,该设备专为使大数据库高级分析更简单、更迅捷和更易用而设计。由于 Netezza 特有的结构形式,软件与硬件是不可分离的紧密结合体,与普通的数据仓库软件不同,所以我们使用 Netezza 模拟器来连接 Modeler。
(1)安装 Netezza 模拟器,会在你的机器部署已经装有 Netezza 的虚机,配置如下图。
图 7. Netezza 模拟器 配置首选项
在虚机正常运行之后,使用 nz 用户名和 nz 密码登录到系统,接着需要创建 Netezza 的数据库,启动 nzsql utility 命令行通过输入 nasql。
创建一个 nzdb 的数据库。
CREATE USER nz WITH PASSWORD 'nz1234';
GRANT ALL PRIVILEGES on nzdb TO nz;
GRANT ALL ADMIN to nz;
退出 nzsql 通过输入 sql 命名 "\q"。