现如今,ggplot特别火,这是因为:它是一个特别容易上手的R制图功能包。尽管如此,有时候我还是想用一些比ggplot更简洁的方法。这时候,我会选择用R里基本的绘图功能。基本款的图没有那么精致而且编程起来也有点奇怪,但是用基本绘图功能画图特别快,而且适用于各种类型的数据,很多专业人士都会经常用。这样看来,其实跟UNIX工具包比较像,比如,grep, sed, 和 awk.
来,放松一下,我们要开始玩转R的基本绘图功能了!
◆ ◆ ◆
数据源
我们将会用到iris数据集。这是一组可靠的经典数据集,虽然不是这个世界上最令人激动的数据,但这是R自带的(所以你不需要下载)并且很容易理解。
另外一个数据集我们会用到的是USAccDeaths数据集,它记录了美国从1973年到1978年(每个月)意外死亡的人数。这组数据也是R自带的并且是一组非常有代表性的时间序列数据集。这将让我们有机会展示一些R在处理时间序列数据方面很便利的内置功能。
◆ ◆ ◆
就用plot
好,重要的事情先做:绘图的命令是¼¼ 你猜对了, 就是plot。 更多的好消息是: R里几乎所有的数据结构都是可以画出来的。这并不是说数据将会看起来好看或者更有意义,但是你总是可以尝试并且找出答案。
你可以通过给col参数赋值来给你的数据点添加颜色。
◆ ◆ ◆
少一些$
如果你已经厌倦了每次都要使用$调用iris数据帧,你可以“attach(附上)”数据,这意味着从这里往下所有的操作都是对所附上的数据集做的。当你完成操作,别忘了 “detach(解除附上)”。
因此就像这个例子,假设我们想在x轴和y轴绘制特定的值,我们将用attach命令代替iris$放在我们的变量的前面。
◆ ◆ ◆
时间序列
用R绘制时间序列图特别简单。因为R本身就有时间序列的数据类型,所以绘图工作是轻而易举的事。下面的例子中,我会把USAccDeaths数据集传递给plot函数。
你能看到我们可以用xlab 和 ylab来给x轴和y轴添加标签。
在图上加上数据点也特别容易,用points和lines 函数就可以实现
你可能注意到上图的点标记有些奇怪,圈圈内有个十字。其实你可以用 pch参数选择不同的点标记。而且不同的点标记可以用来表示一个变量的不同分类(或者在R里面的“层次(level)”)
◆ ◆ ◆
直方图
在R里面我的最爱之一:直方图!当我从Excel换到R的时候,我已经听说了最让人激动的是在R里面只需要一行代码就能代替Excel里面的catalogs of frequency tables (频数表)。
直方图特别好用!首先特别简单而且能够快速直观地展示出你的数据集的样子。所以直方图是我起初学习R的时候最先学习的东西之一,也是我最常用的。
◆ ◆ ◆
密度函数图和图例
如果你要在同一个图里画出不同变量的分布图,我建议用密度分布图。用density函数可以画出概率分布函数(PDF)的估计图。密度图用一个基本的,连续的线来展现你的数据。我们可以用lines 函数为每一个分布加上不同的颜色。
原文发布时间为:2016-04-25