《数据驱动的网络分析》——第6章 R安全分析简介

第6章 R安全分析简介

R是一个开源统计分析软件包,最初由奥克兰大学的Ross Ihaka和Robert Gentleman开发。R的设计者主要是统计学家和数据分析人员,与商业统计软件包(如S和SPSS)关联。R是用于探索性数据分析的工具包,它提供了统计建模和数据操纵能力、可视化和一个全功能的编程语言。

R可以满足多种分析需求。分析工作需要某些工具来创建和操纵汇总原始数据的小型临时数据库。例如,从特定主机采集、按照服务分解的每小时流量汇总。这些数据表比原始数据更复杂,但是其目的不是为了最后发布——它们仍然需要进行更多的分析。历史上,Microsoft Excel曾经是这类分析的主力应用程序,它提供了数值分析、图表和简单的列式数据视图,可以进行过滤、分类和排序。我曾经看到分析人员将Excel文件当作便条一样传递。

我从Excel切换到R,是因为我发现它是适合于大规模数值分析的优秀产品。Excel的图形化特性使其在处理大规模的数据集时很笨拙。我发现,R的表格操纵能力非常出色,以可存储和可共享工作区的形式提供数据来源,可视化能力很强大,全功能脚本语言的出现实现了快速自动化。本章讨论的大部分工作都可以在Excel中完成,但是如果你能够在R的学习上投入时间,我相信你将会发现这是值得的。

本章的前半部分主要关注使用R编程环境访问和操纵数据。下半部分关注使用R进行统计测试的过程。

6.1 安装与设置

数据驱动的网络分析
R是一个维护得很好的开放源码项目。综合R档案网络网站维护最新的Windows、Mac OS X和Linux版本的二进制文件,R软件包存储库以及大量文档。

安装R的最简单方法是获取对应的二进制文件(在首页的顶部),也可以通过各种主流的软件包管理器获得R。在本章余下的部分中,我假定你使用R的图形界面。

根据你熟悉的工具和环境,还有一些其他与R配合使用的工具。RStudio是一个集成开发环境,以更为传统的IDE框架提供数据、项目和任务管理工具。对于Emacs用户,Emacs Speaks Statistics提供了一个交互式的环境。

时间: 2024-08-22 06:46:22

《数据驱动的网络分析》——第6章 R安全分析简介的相关文章

《数据驱动的网络分析》——导读

内容提要传统的入侵检测和日志文件分析已经不再足以保护当今的复杂网络,本书讲解了多种网络流量数据集的采集和分析技术及工具,借助这些工具,可以迅速定位网络中的问题,并采取相应的行动,保障网络的运行安全. 本书分为3部分,共15章,内容包括数据采集的常规过程,用于采集网络流量的传感器,基于特定系统的传感器,数据存储和分析,使用互联网层次知识系统(SiLK)分析NetFlow数据,用于安全分析的R语言简介.入侵检测系统的工作机制以及实施,确定实施攻击的幕后真凶,探索性数据分析以及数据可视化,检查通信流量

《R语言初学指南》一第2章 R脚本

第2章 R脚本 R语言初学指南 如果只是进行一项小的计算任务,也必须在控制台窗口中输入许多行代码,则会令人感到心烦.一旦出现错误,就要将某行,甚至更多行全部重新输入.例如,在第1章曾使用三个R命令绘图: >moose.density=c(.17,.23,.23,.26,.37,.42,.66,.80,1.11,1.30,1.37, + 1.41,1.73,2.49) >kill.rate=c(.37,.47,1.90,2.04,1.12,1.74,2.78,1.85,1.88,1.96, +

《R的极客理想——高级开发篇 A》一一第2章 R语言的算法实现

第2章 R语言的算法实现 本章用R语言实现了4个算法案例,包括协同过滤算法.PageRank算法.均线模型算法和遗传算法,希望这些案例可以帮助读者理解R语言在实际业务中的应用.

《R的极客理想——高级开发篇 A》一一第1章 R语言知识体系和数学函数

第1章 R语言知识体系和数学函数 本章为全书开篇,主要介绍了R语言知识体系结构及学习资料.利用R语言实现数学计算和统计计算以及连续型分布函数的可视化,可帮助读者全面理解R语言,并利用R语言快速地处理基础学科的计算问题.

《R的极客理想—工具篇》—— 第1章 R语言基础包

第1章 R语言基础包 本章主要介绍了为什么要学习R语言,R语言软件的安装,R语言的开发工具,以及R语言中常用的几个软件包,以帮助读者快速了解R语言的工具包,激发读者对R语言的学习兴趣.

《R语言数据分析与挖掘实战》——第2章 R语言简介 2.1 R安装

第2章 R语言简介 R语言是一种为统计计算和图形显示而设计的语言环境,是贝尔实验室(Bell Laboratory)的Rick Becker.John Chambers和Allan Wilks开发的S语言的一种实现,提供了一系列统计和图形显示工具.它是一套开源的数据分析解决方案,由一个庞大且活跃的全球性研究型社区维护.它具有下列优势: 1)作为一个免费的统计软件,R可运行于多种平台之上,包括Windows.UNIX.MacOS和Linux. 2)R可以轻松地从各种类型的数据源导入数据,包括文本文

《R语言游戏数据分析与挖掘》一第3章 R语言绘图重要技术

第3章 R语言绘图重要技术R语言除了拥有良好的数据处理和分析能力外,对于展现数据也有极其灵活和强大的应用.由于用图形表达分析结果往往更直观和简单,所以对于优秀的分析报告而言,将数据结果以适当的图形方式展示后,其沟通效果和说服力会更佳.本章将介绍如何向一幅简单的图形中添加元素,以得到更有用和更吸引人的图形,以及绘制各种类型图形的函数.

《数据科学:R语言实现》—— 第1章 R中的函数 1.1 引言

第1章 R中的函数 1.1 引言 R语言是数据科学家的主流编程语言.基于著名的数据分析网站KDnuggets的民意测验,3项(2012年到2014年)的调查显示,R语言在数据分析.数据挖掘和数据科学领域中是最受欢迎的语言.对许多数据科学家来说,R语言不仅是一门编程语言,而且相关软件还提供了交互式的开发环境,支持运行各种数据分析任务. R语言在数据操作和分析方面有许多优势.下面是3个最显著的优势. 这些优势使得复杂的数据分析变得更加简单易行.对此,R语言用户都深信不疑.而且,R语言尤其适合基础用户

《数据科学:R语言实现》——第1章 R中的函数

第1章 R中的函数1.1 引言R语言是数据科学家的主流编程语言.基于著名的数据分析网站KDnuggets的民意测验,3项(2012年到2014年)的调查显示,R语言在数据分析.数据挖掘和数据科学领域中是最受欢迎的语言.对许多数据科学家来说,R语言不仅是一门编程语言,而且相关软件还提供了交互式的开发环境,支持运行各种数据分析任务.R语言在数据操作和分析方面有许多优势.下面是3个最显著的优势.开源并且免费:用户使用SAS或者SPSS需要购买使用许可.而用户使用R语言是免费的,并且可以方便地学习如何实