使用IBM SPSS Modeler进行社交网络分析

社交">网络分析(SNA)是 Modeler 15 增加的一个新功能。SNA 映射和度量个人、组和其它实体(定义为节点)之间的关系。典型应用包括客户流失预警,病毒式营销等,也可以与传统数据挖掘模型结合使用以提高后者的性能。本文将介绍 Modeler 中两种 SNA 模块的算法原理 , 并通过实例讲解,使读者了解 SNA 的使用方法。

背景知识:社交网络分析、数据挖掘、IBM SPSS Modeler

社交网络分析是人、组织、计算机或者其他信息或知识处理实体之间的关系和流动信息的映射和测量。图 1 是社交网络的一个示意图,其中的节点表示人、组织、计算机或者其他信息或知识处理实体;连线表示节点之间的关系或信息流动。信息流动的方式有很多,比如邮件,电话,短信,博客,等等。假设 A 经常与 B 和 C 通电话,通过分析 A 的电话 ID 记录,可以构筑出图 1 中的简单社交网络。从此图中我们可以看出 A, B, C, 三人 中,A 具有较强的影响力。如果 A 获得了正面或者负面的消息,这消息会很快传递给 B 和 C。而 B 与 C 之间的影响力是间接的,只能通过 A 来传播。

图 1. 社交网络示意图

随着节点和连线的增加,社交网络的复杂程度迅速提升。图 2 展示了一个较为典型的社交网络。大型和超大型的社交网络的处理是手工分析方式无法完成的。在过去的二十年中,社交网络分析领域的快速发展,很大程度得益于计算机计算能力的提升和各种数据挖掘方法的发展。

图 2. 一个典型的社交网络

数据挖掘 (data mining) 是从大量的、不完全的、有噪声的、模糊的、随机的数据中提取隐含在其中的、人们事先不知道的、但又是潜在有用的信息和知识的过程。从商业角度去定义,数据挖掘是一种新的商业信息处理技术,其主要特点是对商业数据库中的大量业务数据进行抽取、转换、分析和其他模型化处理,从中提取辅助商业决策的关键性数据。在技术上可以根据它的工作过程分为:数据的抽取、数据的存储和管理、数据的展现等关键技术。

图 3. 数据挖掘

被誉为第一数据挖掘工具的 IBM SPSS Modeler( 原名 Clementine) 是 IBM SPSS 的核心挖掘产品,它拥有直观的操作界面,自动化的数据准备,和成熟的预测分析模型。使用它,企业可以将数据分析和建模技术与特定的商业问题结合起来,找出其他传统数据挖掘工具可能找不出的答案。

图 4. IBM SPSS Modeler 的操作界面

时间: 2024-11-05 19:33:04

使用IBM SPSS Modeler进行社交网络分析的相关文章

IBM SPSS Modeler 与数据库集成建模及优化(三)

IBM SPSS Modeler 与数据库集成建模及优化 在这个由三部分组成的关于 IBM SPSS Modeler 与数据库集成建模及优化系列的前两部分中,我们谈到了与数据库相关的基本操作及集成建模,本部分将重点关注 SPSS Modeler 集成使用数据库的过程中的性能优化,包括多种功能的介绍和技巧的使用: 数据操作回送 模型回送 数据库插件 - 评分服务适配器 调用数据库函数 重新排列执行顺序 性能提升技巧总结 本文假设读者熟悉在 SPSS Modeler 中如何建立数据库连接及其他一些基

IBM SPSS Modeler与数据库集成建模及优化(二)

了解 IBM SPSS Modeler 与数据库集成和优化 在这个由三部分组成的关于 IBM SPSS Modeler 与数据  库集成建模及优化系列的第一部分中,我们谈到了使用数据库  节点对数据库进行写入及读取数据操作.接下来,我们将介绍使用 SPSS   Modeler 应用程序在数据库中构建.评分和存储模型.通过集成,可将  SPSS Modeler 的分析功能和易用性与数据库的强大性能相结合,同时还  可运用数据库提供商提供的数据库自有算法进行建模.通过 SPSS Modeler  

IBM SPSS Modeler与数据库集成建模及优化(一)

IBM SPSS Modeler 与数据库集成和配置 作为 IBM 分析与预测解决方案的重要组成部分,IBM SPSS Modeler 是一组数据挖掘工具,通过这些工具可以采用商业技术快速建立预测性模型 ,并将其应用于商业活动,从而改进决策过程. 其可对企业级海量数据进行处理与建模,通过强大的数据库集成功能更可以直 接与企业已有的数据库集成进行数据挖掘.不仅避免了企业资金重复投入, 而且可以获取更好的数据挖掘性能. 比如某公司经过多年的积累,有非常庞大的数据且存储于数据库中  ,希望能使用 SP

IBM SPSS Modeler Entity Analytics 实例应用分析

简介 IBM SPSS Modeler Entity Analytics (EA) 是在 IBM SPSS Modeler 14.2 预测分析的基础上添加到 IBM SPSS Modeler 15.0 的全新功能.Entity Analytics 和传统 的 Modeler 相比,对数据预测有着全新的维度.IBM SPSS Modeler 预测的重点在于根据过 去的数据预测未来的行为.而 Entity Analytics 重点在于通过解析已有的数据,在不同的 已有数据源中,解析自身的身份冲突,从

IBM SPSS Modeler 在电力负荷预测中的应用

电力负荷预测是电力系统调度.用电.计划.规划等管理部门的重要工作之一.提高负荷预测水平,有利 于计划用电管理,有利于合理安排电网运行方式和机组检修计划,有利于节煤.节油和降低发电成本,有利于 制定合理的电网建设规划,有利于提高电力系统的经济效益和社会效益.因此,负荷预测已成为实现电力系统 管理和现代化的重要内容之一. IBM SPSS Modeler 简介 IBM SPSS Modeler 是一组数据挖掘工具,通过这些工具可以采用计算机技术快速建立预测性模型,并将其 应用于商业活动,从而改进决策

如何通过IBM SPSS Modeler对数据进行处理和建模

由于目前http://www.aliyun.com/zixun/aggregation/18046.html">企业客户的业务量和数据量都在不断的提高,随着企业的发展,很多企业的数据存储都不局限于同一个数据库上,如果要对这些存储在不同数据库上的数据进行处理和建模,就需要将这些存储在不同数据库之间的数据进行有效的整合,本文将介绍通过 IBM SPSS Modeler 如何对不同数据库之间的数据进行整合,然后进行建模处理. IBM SPSS Modeler 介绍 IBM SPSS Modele

几种典型的第三方产品和IBM SPSS Modeler连接

它能和多种第三方产品连接,更好地实现数据的数据的预测.整合和分析.本文将介绍几种典型的第三方产品和 Modeler 的连接.IBM SPSS Modeler 软件已经可以和其他一些最 新的产品很好的整合在一起,形成完整的解决方案. 例如:SPSS Data Collection.Statistic.Collaboration Deployment Service.Cognos 一起就形成了对调查研究的完整解决方案.它还能够嵌入各种各样的数据源和数据文件,再将他们进行分析,深层次地挖掘.而新增与

在UNIX环境下部署高效的IBM SPSS Modeler Server

本文通过实例介绍了三种配置部署策略,分别满足不同类型的http://www.aliyun.com/zixun/aggregation/12909.html">客户需求,使客户能顺利的应用到实际的业务流程中. Modeler Server 架构和系统特点 IBM SPSS Modeler Server 作为企业级数据挖掘工作平台,与一个或多个 IBM SPSS Modeler 安装程序一起在分布式分析模式下不间断运行.它采用三层分布式基础架构,如图 1 所示,通过网络与 Modeler 和数

IBM SPSS Modeler产品间安全通信的部署策略

本文通过实例详细介绍 IBM SPSS Modeler 产品间安全通信的部署策略,从而满足对安全性要求比较高的http://www.aliyun.com/zixun/aggregation/12909.html">客户需求,使客户能放心的应用到实际的业务流程中. 1. 前言 – 关于 IBM SPSS Modeler 产品 IBM SPSS Modeler 是一组数据挖掘工具,通过这些工具可以采用商业技术快速建立预测性模型,并将其应用于商业活动,从而改进决策过程.IBM SPSS Mode