随着人类社会从IT时代进入到DT时代,现在越来越多的企业开始重视数据的价值,但是并不是所有的企业都能够去挖掘出数据的价值。因此,企业需要通过使用大数据相关的技术对数据进行分析,并通过数据可视化技术将分析结果展现出来,这样才能够让企业负责人快速了解企业自身发展的情况。
以我们的一个客户为例,来看一下如何快速地实现企业数据化运营。我们有一个客户,他们的网站系统部署在阿里云上,其系统架构如下所示:
随着业务的发展,公司管理层希望了解网站访问的情况,并进行针对性的推广活动。但是,公司的技术人员并不知道如何把数据的结果很直观地展示给管理、运营和市场推广等人员。因此,其决定通过大数据的可视化技术将企业的业务数据化地展示出来。随后,该公司的技术人员对现有可视化技术深入地了解后,得出了以下的结论:
- 自建系统:搭建周期长,需要雇佣专业的技术人员,同时部署、运维和研发的成本高;
- 购买成熟的产品:成本比较高且部署比较耗时, 需要专门的技术人员对系统进行维护
- 第三方数据分析服务:搭建周期短,成本低且不需要对系统本身进行运维
由于企业的网站部署在阿里云上,并且数据是存储在阿里云的数据库服务RDS中,在尝试了自建Hadoop集群和MongoDB数据库之后,最后决定使用阿里云的MaxCompute对数据进行分析,并使用QuickBI来实现数据可视化展示。
该企业网站现有的数据存储在RDS的数据库中,通过阿里云数据管理服务DMS查看到的数据如下所示:
为了对业务数据进行分析,需要将数据从RDS导入MaxCompute中,通过大数据开发套件DataIDE可以很容易的实现MaxCompute的数据同步和任务开发。在阿里云官网上进入DataIDE的管理控制台,使用DataIDE对MaxCompute进行管理。在数据集成的模块中,把企业使用的RDS数据库作为数据源添加进来。
然后在数据开发的模块中,通过脚本在MaxCompute中创建和RDS相同的数据表,并通过拖拽的方式实现数据分析的任务开发。
开发完成后,提交并运行任务,从而实现使用MaxCompute对业务数据分析的目的。为了把分析的结果通过图表的形式展现出来,登录到QuickBI的管理控制台,通过“导入数据源”将MaxCompute使用的项目空间创建为新的数据源。
为了展示网站的访问情况和用户信息,分别根据customers、user_measures和refer_info三个表创建数据集:
然后在“仪表板”页面中,分别对三个数据集中的数据进行展示,目前“仪表板”提供了多种图表格式供用户选择使用:
首先,使用饼图展示数据集customers中用户性别比例的分布(0表示性别没有输入,1表示男性,2表示女性):
接着,再分别使用柱状图和饼图展示访问网页的PV/UV和页面访问来源的情况。最终实现的报表如下所示:
为了报表展示的美观性,还可以通过拖拽的方式对图表位置进行排版:
最后对设计的仪表板进行保存,并将仪表板的链接发给管理层、市场推广等相关人员去查看分析的结果。这样,公司管理层可以很容易地根据数据分析报表做出正确的决策,从而实现数据化的运营。