2.2 数据对象 R拥有许多用于存储数据的对象类型,包括向量.矩阵.数组.数据框和列表.它们在存储数据的类型.创建方式.结构复杂度,以及用于定位和访问其中个别元素的标记等方面均有所不同.多样化的数据对象赋予了R灵活处理数据的能力. R中有许多数据类型用来存储各种各样的数据,包括数值型(numeric).逻辑型(logical).日期型(date).字符型(character).复数型(complex).原味型(二进制形式保存数据raw).此外,也可能是缺省值(NA)和空值(NULL).其中最经常
前 言 为什么要写这本书 随着大数据的概念越来越流行,越来越多的企业开始重视数据,期待从数据中寻找有价值的结论,以指导公司管理层决策,最终创造更大的价值.但是在游戏行业,数据分析的发展相对缓慢,很多游戏公司是在发现人口红利消失后才逐渐重视数据,希望利用数据驱动产品.而在各种数据分析技术中,R语言作为一个可进行交互式数据分析和探索的强大平台,拥有举足轻重的作用.R语言的免费开源使得很多公司用它来处理数据.展示数据.分析数据.完成模型. 使用R语言可以进行游戏数据分析系统的搭建,可以对累积的海量游戏
2.1 开发环境准备和快速入门 2.1.1 R语言简介 R语言的前身是S语言,S语言是由AT &T Bell实验室的Rick Becker.John Chambers和Allan Wilks开发的一种用来进行数据探索.统计分析.作图的解释型语言.最初S语言的实现版本主要是S-PLUS.S-PLUS是一个商业软件,它基于S语言,并由MathSoft公司的统计科学部进一步完善.而R语言最初由来自新西兰大学的Ross Ihaka和Robert Gentleman开发(由于他们的名字都以R开头,所以该软
1.2 游戏数据分析的流程 游戏数据分析.数据挖掘的价值一定要落实到具体的业务应用中才可以得到检验和实现,所以需要流程和制度来有效保障最终的业务实践效果.这些流程一方面可以促使各相关方在数据分析业务实践的不同阶段落实各自的角色.分工和价值,维护整个业务流的畅通和效率:另一方面可以有效达成数据分析项目中各环节的阶段性目标. 游戏数据分析整体流程可以参考跨行业的数据挖掘标准流程CRISP-DM方法论,它是一种业界认可的用于指导数据挖掘工作的方法.按照CRISP-DM方法论,一个游戏数据分析的完整流程
1.1 为什么要对游戏进行分析 伴随着游戏互联网的快速发展和智能终端的普及,移动游戏进入了全民时代.越来越多的玩家利用碎片化时间进行游戏,使得游戏数据呈现井喷式增长,同时也对数据存储技术.计算能力.数据分析手段提出了更高的要求.海量数据的存储是必须面对的第一个挑战,随着分布式技术的逐渐成熟,越来越多的互联网企业采用分布式的服务器集群+分布式存储的海量存储器进行数据的存储和计算,从而解决数据存储和计算能力不足的问题.如何在海量的.复杂高维的游戏数据中发掘出有价值的知识,将是很多公司下一步亟待解决的
3.1 常用图形参数 R是一个功能强大的图形构建平台,可以逐条输入语句构建图形元素(颜色.点.线.文本等),逐渐完善图形,直至得到想要的结果. 更改图形参数有两种方式,一种是直接在绘图函数中设置参数,这种方式只影响当前的绘图函数:另一种是通过par()函数设置,这种方式会影响当前绘图设备上的所有图形. 3.1.1 颜色元素 R语言可以设置绘图参数col,改变图像.坐标轴.文字.点.线等的颜色.例如,对数据集women绘制红色散点图,只需将col参数设置为"red",如图3-1所示. &
1.4 小结 本章介绍了游戏数据分析的目的和打造数据化运营团队的重要性.一位出色的游戏数据分析师不仅仅要具备统计技能.数据库知识.数据挖掘技能,还需要具有很好的业务理解能力和快速学习能力,能通过自身的专业知识满足不同业务的数据需求,并推动模型落地.
2.4 小结 本章首先介绍了R.RStudio和Rattle工具的安装和界面,以及R语言的一些基本知识,让读者对R语言有了大概的认识.然后介绍了几种常用数据对象的创建及相关操作.最后介绍了将外部数据源导入R的常用方法,包括导入文本文件.导入Excel文件.利用R对数据库进行管理和简单的R爬虫技术.
第3章 R语言绘图重要技术R语言除了拥有良好的数据处理和分析能力外,对于展现数据也有极其灵活和强大的应用.由于用图形表达分析结果往往更直观和简单,所以对于优秀的分析报告而言,将数据结果以适当的图形方式展示后,其沟通效果和说服力会更佳.本章将介绍如何向一幅简单的图形中添加元素,以得到更有用和更吸引人的图形,以及绘制各种类型图形的函数.