这个由两部分组成的文章系列将演示有助于从数据中提取有业务价值的信息的可视化技术 ,本文是这个系列的第一部分。您将看到如何使用可缩放矢量图形 (SVG) 和开源 D3 JavaScript 库创建可通过浏览器查看的可视化表示,通过形状和颜 色来传达信息。我将通过一些可视化浏览指标(与社交媒体使用相关)的示例来演示这些技 术。第 1 部分概述 了 SVG 和 D3 如何协同工作,还提供了 一些基本示例。第 2 部分 将会更深入地剖析这个强大的开放 标准技术组合的可视化功能。
分析社交媒体指标
社交媒体大数据挑战
社交媒体站点(比如 Twitter、Facebook 和 YouTube)提供了全面的 Web 服务接口来公开它们的功能。例如,YouTube Data API 支持应用程序将视频上传到 YouTube,或播放一个网站上现 有的 YouTube 视频。现在这些站点也在开发分析 API。举例而言,YouTube Analytics API 向编程客户端提供了查看次数和喜欢次数(number of likes)等统计数据。结果,更多的业务应用程序 可通过可视和编程接口与社交媒体互动。对所有规模的公司而言,下一个挑战是通过大数据 分析将大量社交数据最有效地应用到业务中。数据可视化(整个分析场景中的一个组成部分 )是这个文章系列的关注重点。您可了解 IBM 大数据 平台的 IBM InfoSphere Streams和 IBM InfoSphere BigInsights产品全面的分析功 能。
公司理解客户行为的一种创造性方式是,通过社交媒体提出想法,并让 潜在客户参与到交互式讨论中。社交媒体上的互动反映了双向的人际互动:要理解人们的好 恶,您必须聆听他们在说什么,就像您希望与积极主动的人互动一样。
以一家家庭装 饰公司为假设场景,该公司以博客、视频、Facebook 页面和论坛形式发布公开内容。这些内 容通过社交媒体资源展示了公司的想法,并尝试发起讨论和其他形式的用户互动。这些内容 迎合各个客户的口味和偏好,帮助他们从一个社交资源导航到另一个。为了判断不断变化的 客户趋势并提出新方法和新设计,公司希望从三个方面分析浏览数据:
流行度,由每个社交资源的 查看次数表示
参与该资源上的 互动的用户数量
用户从一个资源 导航到另一个资源的方向
表 1、2和 3 分别显示了三周内用户查看、用户互动和导 航次数。请注意,这些表使用了彩色名称来表示公司使用的社交媒体资源类型(比如博客和 Facebook 页面)。
表 1 显示了每个资源的用户查看次数:
从 表 3可以看到 ,在第 1 周有 3,057 名用户在访问蓝色资源后导航到了金 色资源,而且红色资源收到了来自蓝色资源的最多观众。
浏览数据的 可视化
可视内容提供了一种比数字表格更容易、更快捷的方式来解释大数据量。可 通过多种方式以图形方式表示表 1、2和 3中的数据。例如,图 1 就是一种显示 表 1中的第 1 周数据的简单方式:
图 1. 用圆圈 表示的每种社交资源在第 1 周的查看次数
图 1 将每种资源的查看次数表示为一个圆圈。圆圈的相对大小与它们表示 的次数成正比,所以查看最多的资源(金色)由最大的圆圈表示。每个圆圈还显示了每种资 源第 1 周获得的实际查看次数。