《Flume日志收集与MapReduce模式》一2.2　Flume配置文件概览

2.2　Flume配置文件概览

既然已经下载好了Flume，下面来花点时间看看如何配置代理。
Flume代理的默认配置提供者使用了一个简单的键值对的Java属性文件，你需要在启动时向代理传递一个参数。由于可以在单个文件中配置多个代理，因此还需要额外传递一个代理标识符（叫作名字），这样它就知道该使用哪个代理了。在给出的示例中，我只指定了一个代理，使用agent这个名字。
每个代理的配置都以下面这3个参数开始：

每个源、通道与接收器在该代理的上下文中也有一个唯一的名字。比如，如果不打算传递Apache访问日志，我就可以定义一个名为access的通道。该通道的配置都以前缀agent.channels.access开头。每个配置项都有一个type属性，告诉Flume是哪种源、通道还是接收器。在该示例中，我们使用一个内存通道，其类型为memory。名为agent的代理中的名为access的通道的完整配置如下所示：

为源、通道与接收器指定的任何参数都会使用相同的前缀以额外属性的方式添加进来。memory通道有一个capacity参数，标识它能持有的最大的Flume事件数量。假如我们不想使用100这个默认值，那么配置文件将会如下所示：

最后，我们需要将access通道名添加到agent.channels属性中，这样代理就会加载它了：

下面来看看使用标准“Hello World”的完整示例。

时间： 2024-10-25 11:28:07

《Flume日志收集与MapReduce模式》一2.2　Flume配置文件概览的相关文章

《Flume日志收集与MapReduce模式》一第1章概览与架构

第1章概览与架构如果在阅读本书,那就说明你正在数据的海洋中遨游.创建大量的数据是非常简单的事情,这要归功于Facebook.Twitter.Amazon.数码相机与相机照片.YouTube.Google,以及你能想得到的能够连接到互联网上的任何东西.作为网站的提供者,10年前的应用日志只是用来帮助你解决网站的问题.时至今日,如果你知道如何从大量的数据中浪里淘金,那么相同的数据就会提供关于业务与客户的有价值的信息. 此外,既然在阅读本书,那么你肯定知道创建Hadoop的目的在一定程度上就是为了

《Flume日志收集与MapReduce模式》一1.1　Flume 0.9

1.1 Flume 0.9 Flume是在2011年被首次引入到Cloudera的CDH3分发中的.它由一套工作守护进程(代理)构成,这些守护进程是通过Zookeeper(一个配置与协调系统)根据一个或多个集中的Master配置而成的.在Master上,你可以在Web UI中查看代理状态,也可以以集中的方式在UI或是通过命令行Shell的方式取出配置(这两种方式都是通过Zookeeper与工作代理进行通信的).可以通过3种模式发送数据,分别叫作Best Effort(BE).Disk Failo

《Flume日志收集与MapReduce模式》一2.1　下载Flume

2.1 下载Flume 请从http://flume.apache.org/下载Flume.在侧边导航栏找到下载链接,你会看到有两个压缩的tar归档,此外还有校验和与gpg签名文件,它们用于验证归档文件.网站上已经提供了验证下载文件的说明,因此这里就不再赘述了.针对实际的校验和检查校验和文件,以此验证下载的文件没有损坏.检查签名文件来验证下载的所有文件(包括校验和与签名)都来自于Apache而不是其他地方.你真的需要验证下载的文件么?一般来说,这是个好做法,也是Apache推荐的方式.如果不验证

《Flume日志收集与MapReduce模式》一1.5　Flume事件

1.5 Flume事件 Flume传输的基本的数据负载叫作事件.事件由0个或多个头与体组成. 头是一些键值对,可用于路由判定或是承载其他的结构化信息(比如说事件的时间戳或是发出事件的服务器主机名).你可以将其看作是与HTTP头完成相同的功能--传递与体不同的额外信息的方式. 体是个字节数组,包含了实际的负载.如果输入由日志文件组成,那么该数组就非常类似于包含了单行文本的UTF-8编码的字符串. Flume可能会自动添加头(比如,源添加了数据来自的主机名或是创建了事件时间戳),不过体基本上是不受影

《Flume日志收集与MapReduce模式》一2.3　从“Hello World”开始

2.3 从"Hello World"开始每一本技术图书都会有一个"Hello World"示例.下面是我们将会使用的配置文件: 这里定义了一个名为agent的代理,它有一个名为s1的源.一个名为c1的通道,以及一个名为k1的接收器.源s1的类型为netcat,它只是打开一个Socket监听事件(每个事件一行文本).它需要两个参数,分别是一个绑定IP与一个端口号.该示例使用0.0.0.0作为绑定地址(表示监听任何地址的Java约定)以及端口号12345.源配置还有一

《Flume日志收集与MapReduce模式》一3.2　文件通道

3.2 文件通道文件通道指的是将事件存储到代理本地文件系统中的通道.虽然要比内存通道慢一些,不过它却提供了持久化的存储路径,可以应对大多数情况,它应该用在数据流中不允许出现缺口的场合.这种持久化能力是由Write Ahead Log(WAL)以及一个或多个文件存储目录联合提供的.WAL用于以一种原子且安全的方式追踪来自于通道的所有输入与输出.通过这种方式,如果代理重启,那么WAL可以重放,从而确保在清理本地文件系统的数据存储前进入到通道中的所有事件都会被写出.此外,如果数据处理策略要求磁盘上的

《Flume日志收集与MapReduce模式》一3.3　小结

3.3 小结本章介绍了在数据处理管道中常用的两类通道.内存通道提供了更快的速度,这是以故障事件出现时数据丢失为代价的.此外,文件通道提供了更可靠的传输,因为它能容忍代理故障与重启,这是以牺牲性能为代价的.你需要确定哪种通道更适合于你的使用场景.在确定内存通道是否适合时,请问问自己丢失一些数据的经济上的代价如何.在考虑是否使用持久化通道时请衡量它与添加更多的硬件以弥补性能上的差异时的代价相比如何.另一个考虑就是数据问题了.写入到Hadoop中的数据不一定都来自于流式应用日志.如果接收的是每天的数

《Flume日志收集与MapReduce模式》一1.3　HDFS与流式数据/日志的问题

1.3 HDFS与流式数据/日志的问题 HDFS并不是真正的文件系统,至少从传统的认识来说不是这样,对于通常的文件系统来说,很多我们认为理所当然的东西并不适合于HDFS,比如挂载.这使得将流式数据装载进Hadoop中变得有些复杂.在通常的Portable Operating System Interface(POSIX)风格的文件系统中,如果打开文件并写入数据,那么在文件关闭前它会一直存在于磁盘上.也就是说,如果另一个程序打开了相同的文件并开始读取,那么它会读取到写入器写到磁盘上的数据.此外,如

《Flume日志收集与MapReduce模式》一1.2　Flume 1.X（Flume-NG）

1.2 Flume 1.X(Flume-NG) Flume之所以会重构有很多原因,如果对细节感兴趣可以参考https://issues.apache.org/jira/browse/FLUME-728.一开始的重构分支最后变成了Flume 1.X的开发主线. Flume 1.X最为明显的变化是不再使用中心化的配置Master/Masters与Zookeeper.Flume 0.9的配置有些过度烦琐,并且极易出错.此外,中心化的配置已经超出了Flume的目标范围.取代中心化配置的是一个简单的磁盘上

猜你喜欢

用WPS文字复制粘贴和移动文字

WPS文字中复制和粘贴文字还是很方便的. 这里小编根据应用的区域的不同提供了两种复制或移动文字的实现方式: 1.在同一窗口中移动或复制项选取要复制或移动的项. 请执行下列操作之一: 若要进行复制 ...

CSS3实例教程:hover、active和:focus伪选择器

文章简介:CSS3实例教程:hover.active和:focus伪选择器. CSS3的伪类选择器就是多,今天我们来学习新的伪类选择器--UL状态伪类选择器.这些选择器都有一个共同的特征名那就是定义的 ...

利用VisualBasic操作XML数据

visual|xml|数据什么是XML 扩展标记语言XML是一种简单的数据存储语言,使用一系列简单的标记描述数据,而这些标记可以用方便的方式建立,虽然XML占用的空间比二进制数据要占用更多的空间,但 ...

影响关键词排名的关键性因素

关键词排名是我们做SEO的一个基础性的指标,任何转换率.微调.用户体验的操作都是在有关键词排名网站有了流量之后进一步的操作,我们在做排名的时候似乎没有思考过影响关键词排名的因素最重要的是什么?我们知道 ...

MySQL 3.23.40 又发布了

mysql MySQL 3.23.40 又发布了. 修正了--low-priority-updates 和 INSERT 的问题. 修正了从进程在一些特别的情况下超前主进程 22 字节的问题. 为复制 ...

WCF技术剖析之五：利用ASP.NET兼容模式创建支持会话（Session）的WCF服务

在<基于IIS的WCF服务寄宿(Hosting)实现揭秘>中,我们谈到在采用基于IIS(或者说基于ASP.NET)的WCF服务寄宿中,具有两种截然不同的运行模式:ASP.NET并行(Sid ...

PPT怎么制作卷角效果

PPT怎么制作卷角效果 1.插入一个圆角矩形和一个直角三角形,直角三角形不能太小,具体大小取决于你所要实现的卷角效果. 2.拖动直角三角形,使其与圆角矩形顶端对齐.右对齐,然后复制一份出来. 3. ...

css网页设计小技巧

1.CSS字体属性简写规则一般用CSS设定字体属性是这样做的: font-weight:bold; font-style:italic; font-varient:small-caps; fon ...

Windows8开始屏幕取消固定应用不让其出现在开始屏幕上

如果你确定不再需要某个磁贴继续位于"开始"屏幕中,则可以从"开始"屏幕取消固定该磁贴. 取消固定应用与卸载应用不同 - 如果你从"开始" ...

Win7系统用户在局域网中共享设置方法

现在,一般的家庭有两三台电脑已经相当普遍,而其中的一些品牌笔记本,则可能已经升级安装了最新的Windows 7操作系统(以下简称Win 7).那么在这样的情况下,如何组建纯Win 7系统环境或Win ...

c++-C++运行调试问题。。。。。

问题描述 C++运行调试问题..... #include ""stdafx.h""#include using namespace std; class Dat ...

命令行的艺术:linux bash命令大全详解

熟练使用命令行是一种常常被忽视,或被认为难以掌握的技能,但实际上,它会提高你作为工程师的灵活性以及生产力.本文是一份我在 Linux 上工作时,发现的一些命令行使用技巧的摘要.有些技巧非常基础,而另一 ...

会员通、服务通、商品通、营销通，全域大数据解决方案有秘诀

全面赋能,双11电商解决方案上新,全新75折:https://www.aliyun.com/solution/ecommerce/act/huhang1111 9月23日由阿里云主办的第五期<电 ...

《Java语言导学（原书第6版）》一3.1　变量

3.1 变量根据第2章可知,对象的状态存储在字段中: 2.1节已经介绍了字段的概念,但读者仍可能会问:命名字段有什么规则和约定除了整型,是否还有其他数据类型?字段在声明时是否必须初始化?如果字段没 ...

优秀程序员的十个习惯

--转来和大家一起共勉在这个世界上,有数百万的人热衷于软件开发,他们有很多名字,如:软件工程师(Software Engineer),程序员(Programmer),编码人(Coder),开发人员( ...

“GANs之父”Goodfellow 38分钟视频亲授：如何完善生成对抗网络？（上）

编者按:深度学习顶级盛会NIPS于今年12月初在巴塞罗那举行,相信有很多人都无法参加.不过,有另一个AI盛会却是全世界所有人都能参加的,叫做"AI WITH THE BEST",已 ...

网络虚拟化简介

云计算就是计算虚拟化,而存储虚拟化已经在SAN上实现得很好了,那么为什么还要网络虚拟化呢?云计算多虚一时,所有的服务资源都成为了一个对外的虚拟资源,那么网络不管是从路径提供还是管理维护的角 ...

小米将推出智能电视

富士康国际发布了2012财年报告,由于部分重要客户的订单量减少,富士康国际2012年净亏损3 .2亿美元,创历史最大亏损纪录.作为全球最大的手机代工企业,富士康国际的兴衰亦是手机产业格局的窥镜,其上一 ...

sqlite-Android 下载视频到本地 listview界面更新问题

问题描述 Android 下载视频到本地 listview界面更新问题在Activity-A中启动下载,然后跳转到activity-B中查看下载列表更新情况,我下载的时候使用sqlite保存下载详情 ...

安卓 ca证书-安卓“受信任的CA证书”（5.0）

问题描述安卓"受信任的CA证书"(5.0) 我的手机安装了许多"受信任的CA证书",不知道是什么时候安装的,也不知道哪些有用?现在一些应用不能使用了,求大神指 ...

结构型模式－－装饰模式

下面先用java,然后用Objective-C行对装饰模式的讲解: 对于java的装饰模式讲解和使用比较详细和难度有点偏高,而对于Objective-C的装饰模式讲解和使用方面比较简单,而且和java ...

strlen-C语言请问这两行代码是什么意思

问题描述 C语言请问这两行代码是什么意思 for(int i = 0; i < strlen(charSet); i++) hash[charSet[i]] = 1; 下面是完整代码 // C ...

javascirpt中有斜杠的参数怎么解决？

问题描述我想做驱动器映射,下面是javascirpt写得代码:varWshNetwork=newActiveXObject("WScript.Network");WshNetwo ...

nignx健康检查

健康检查分为tcp方式和http方式 tcp方式如果服务假死,则会继续分发请求,造成很大一部分用户无法访问,比如一个tomcat server假死,但8080端口并没有关闭 http ...

递归的运行

问题描述 //想搞清楚这个递归问题classDG{//fact()方法,使用方法的递归调用来计算阶乘intfact(intn){//定义返回值intresult;if(n==1){return1;}/ ...

chrome flash有对应的内存管理扩展或者插件么.求推荐谢谢?

问题描述 chrome flash有对应的内存管理扩展或者插件么.求推荐谢谢? 玩页游,有时候需要挂机一挂挂一天,任务管理器里面显示的chrome占用内存在不停的涨,看了chrome的内存管理器发现 ...

83届奥斯卡颁奖梅丽莎获最佳女配角激动爆粗口

里奥获最佳女配角梅丽莎里奥光彩照人梅丽莎里奥风韵犹存梅丽莎里奥向影迷招呼梅丽莎里奥侧面梅丽莎里奥着镂空礼服梅丽莎里奥向影迷作揖梅丽莎优雅动人里奥(点击小图看大图)点击此处查看其它图片 ...

Shell编程中的特殊变量之进程状态变量介绍_linux shell

进程状态变量 1.$$获取当前shell的进程号(PID) 2.$!执行上一个指令的PID 3.$?获取执行上一个命令的返回值(0为成功,非零为失败,这个很常用) 4.$_在此之前执行的命令或脚本的最 ...

Shell实现识别物理cpu个数、核心数_linux shell

如何识别物理cpu个数,几个核,是超线程还是多核心判断依据: 1.具有相同core id的cpu是同一个core的超线程. 2.具有相同physical id的cpu是同一颗cpu封装的线程或者co ...

jQuery中DOM操作实例分析_jquery

本文实例讲述了jQuery中DOM操作的方法.分享给大家供大家参考.具体分析如下: 这里主要设计的dom操作包括:dom对象的创建(JS方式和jquery方式).属性的修改.样式的修改.动态绑定事件 ...

热搜

© 2024 iVAN | info#iamivan.net | 11 q. 0.023 s.