利用Splunk收集HBase集群日志

什么是splunk

Splunk是日志界的google。支持任何服务器产生的日志,其对日志进行处理的方式是进行高效索引之后让管理员可以对日志中出现的各种情况进行搜索,并且通过非常好的图形化的方式展现出来。让管理员彻底从繁琐的ssh,grep中解放出来。

我们可以通过配置splunk,收集cluster内的HBase/Hadoop以及一切由log4j生成的日志。

1. 安装splunk

可以在其中一台机器上安装splunk,安装方法可以参考:http://www.splunk.com/base/Documentation/latest/Installation/InstallonLinux

2. 为splunk添加数据源

Splunk的webconsole是: http://{install_machine_ip}:8000

以admin和默认的changeme密码登录后,可以看到这样的界面

现在,我们为splunk加入一个udp的数据源

“Add Data” à “UDP”
à 新增资料

这里,我们添加了一个UDP数据源,类别为log4j,端口为1688

3. 修改log4j配置,将日志导入到splunk中。

修改HBase中conf的log4j配置,增加一个指向splunk server服务器的appender。

view plaincopy
to clipboard
print?

  1. # syslog  
  2.   
  3. #  
  4.   
  5. log4j.rootLogger=INFO,logfile,SYSLOG  
  6.   
  7. ……  
  8.   
  9. # Define the root logger to the system property "hbase.root.logger".  
  10. log4j.rootLogger=${hbase.root.logger},SYSLOG  
  11.   
  12. .......  
  13.   
  14. log4j.appender.SYSLOG=org.apache.log4j.net.SyslogAppender  
  15.   
  16. log4j.appender.SYSLOG.facility=local1  
  17.   
  18. log4j.appender.SYSLOG.layout=org.apache.log4j.PatternLayout  
  19.   
  20. log4j.appender.SYSLOG.layout.ConversionPattern=%p %c{2}: %m%n  
  21.   
  22. log4j.appender.SYSLOG.SyslogHost=10.64.66.211:1688  
  23.   
  24. log4j.appender.SYSLOG.threshold=DEBUG  
  25.   
  26. log4j.appender.SYSLOG.Header=true  
  27.   
  28. log4j.appender.SYSLOG.FacilityPrinting=true  

这个例子中,我们的syslog Host是10.64.66.211,将其改为实际的splunk server IP地址就可以了。

这样子,日志将导入到splunk,之后,我们就可以方便的对其查询了。

转载

时间: 2024-07-31 18:55:17

利用Splunk收集HBase集群日志的相关文章

HBase集群出现NotServingRegionException问题的排查及解决方法

HBase集群在读写过程中,可能由于Region Split或Region Blance等导致Region的短暂下线,此时客户端与HBase集群进行RPC操作时会抛出NotServingRegionException异常,从而导致读写操作失败.这里根据实际项目经验,详细描述这一问题的发现及排查解决过程. 1. 发现问题 在对HBase集群进行压力测试过程中发现,当实际写入HBase和从HBase查询的量是平时的若干倍时(集群规模10~20台,每秒读写数据量在几十万条记录的量级),导致集群的读写出

高可用Hadoop平台-HBase集群搭建

1.概述 今天补充一篇HBase集群的搭建,这个是高可用系列遗漏的一篇博客,今天抽时间补上,今天给大家介绍的主要内容目录如下所示: 基础软件的准备 HBase介绍 HBase集群搭建 单点问题验证 截图预览 那么,接下来我们开始今天的HBase集群搭建学习. 2.基础软件的准备 由于HBase的数据是存放在HDFS上的,所以我们在使用HBase时,确保Hadoop集群已搭建完成,并运行良好.若是为搭建Hadoop集群,请参考我写的<配置高可用的Hadoop平台>来完成Hadoop平台的搭建.另

如何访问E-MapReduce中HBase集群

一.创建HBase集群 E-MapReduce在EMR-1.2.0版本开始支持HBase(1.1.1)了,创建集群时注意点如下: 1)选择付费类型 创建集群的基本信息页面可选择付费类型,包括包年包月和按量付费两种,一般HBase集群都是长期存在的,所以选择包年包月价格更实惠. 2)选择软件版本配置 产品版本选择EMR-1.2.0及以上版本,集群类型选择HBASE,目前EMR支持的HBase版本号为1.1.1. 3)集群网络配置 可以选择将HBase集群创建在经典网络环境或者专有网络环境(VPC)

HBase集群管理

通过之前文章的描述,我们已经有能力设计并部署搭建HBase集群了 当我们的HBase集群开始运行的时候,新的挑战又来了 例如,我们可能会遇到在集群运行的时候添加或者删除节点 又或者需要拷贝/备份整个集群的数据等等 如何在集群运行的时候以最小的代价来执行这些操作呢? 下面总结一下HBase集群的相关运维和管理知识点 运维任务 添加/删除节点 在HBase中动态添加/删除节点非常简单,只需要一些命令操作即可,HBase会自动帮你处理节点上下线需要做的事情 添加节点 1.修改conf目录下的regio

hbase 集群启动后master 端口监听不正确

问题描述 hbase 集群启动后master 端口监听不正确 截图是在master机器上端口监听,可以看到60000.60020是监听在127.0.0.1上的 这样就导致其他的slave 机器无法访问60000.60020端口,网上说是hosts配置不正确,但是都各种修改了还是不正确,请问该如何解决

E-MapReduce的HBase集群使用Hue

E-MapReduce产品的emr-2.0.0以下的版本创建的HBase集群,实现Hue访问HBase步骤如下: 1. 启动HBase thrift(emr集群的master节点) >su -l hdfs -c '/opt/apps/hbase-1.1.1/bin/hbase thrift start >/dev/null 2>&1 &' 2.安装Hue(本地或者emr集群的master节点) 备注:对于emr-2.0.0版本的集群,Hue已经安装,忽略步骤2. 下面以在

青云QingCloud推出HBase集群服务 支持SQL等高级功能

为了更好地满足用户对大数据基础平台的需求,企业级基础云服务商青云QingCloud(qingcloud.com)日前宣布正式推出HBase集群服务,包含HBase数据库服务.HDFS分布式文件系统.Phoenix查询引擎三大组件.在原生HBase的基础上,QingCloud在配置的易用性.监控告警.在线伸缩等方面进行全面优化,并支持二级索引.SQL和JDBC API,以及完全ACID事务等高级功能,用户能够在2-3分钟内创建一个HBase集群,并能够在控制台直接修改配置文件并应用,极大地减轻了H

HBase 集群监控

为什么需要监控? 为了保证系统的稳定性,可靠性,可运维性. 掌控集群的核心性能指标,了解集群的性能表现. 集群出现问题时及时报警,便于运维同学及时修复问题. 集群重要指标值异常时进行预警,将问题扼杀在摇篮中,不用等集群真正不可用时才采取行动. 当集群出现问题时,监控系统可以帮助我们更快的定位问题和解决问题 如何构建 HBase 集群监控系统? 公司有自己的监控系统,我们所要做的就是将 HBase 中我们关心的指标项发送到监控系统去,问题就转换为我们开发,采集并返回哪些 HBase 集群监控指标项

我为什么建议自建HBase集群应该迁移过来?

引言 最近云HBase商业化了,HBase在业界应用还是比较广泛.在云上环境下中,不少客户都自建了HBase集群,还有一部分用户是把HBase集群放在Hadoop离线集群内部.此文主要对比下云HBase数据库跟自建HBase的差异.另外,在成本上,云HBase数据库跟自建基本差不多,目前云HBase在推广打折阶段,比自建还便宜不少 自建HBase与ApsaraDB HBase对比 自建目前在云上,基本是基于ecs去自己构建,ApsaraDB HBase我们还是做了不少事情的: ApsaraDB