HBase学习总结(1):HBase的下载与安装

(HBase是一种数据库:Hadoop数据库,它是一种NoSQL存储系统,专门设计用来快速随机读写大规模数据。本文介绍HBase的下载与安装的整个过程。)
一、HBase的下载
1.登录HBase官网http://hbase.apache.org/,可看到如图1所示的页面:

图1 登录HBase官网的页面

2.点击图1中的红色小框中的“here”,进入如图2所示的页面。

图2 下载链接

3.点击图2中的红色小框中的链接,进入如图3所示的下载页面。


图3 下载页面

点击文件名便可以下载所需要的HBase安装包和源代码,本文示例中使用的是HBase 1.0.1版本。

二、HBase的安装
将下载的安装包(hbase-1.0.1-bin.tar.gz)上传到Linux机器上。为了避免文件权限的问题,建议将该安装包上传到root用户下。在本文中,安装包存放在“/root/zhouzx”目录下。由于本次安装HBase的目的是自己学习,因此只是安装了单机版。HBase真正的威力体现在集群中,这是大数据项目中采用的部署方式。
1.解压安装包
执行“tar -zxvf hbase-1.0.1-bin.tar.gz”命令解压安装包,得到“hbase-1.0.1”。转到该目录下,可以看到有如下文件及目录:

-rw-r--r--  1 root root 140371 Apr 18 13:02 CHANGES.txt
-rw-r--r--  1 root root  11358 Jan 25 17:47 LICENSE.txt
-rw-r--r--  1 root root    897 Apr 18 12:55 NOTICE.txt
-rw-r--r--  1 root root   1477 Apr  6 06:03 README.txt
drwxr-xr-x  4 root root   4096 Apr 18 12:58 bin
drwxr-xr-x  2 root root   4096 Apr 18 12:55 conf
drwxr-xr-x 12 root root   4096 Apr 18 13:14 docs
drwxr-xr-x  7 root root   4096 Apr 18 13:08 hbase-webapps
drwxr-xr-x  3 root root   4096 Jun 26 09:07 lib

到这里,HBase的安装已经可以告一段落了,下面来设置环境。

2.部署jdk并设置java环境
要想让HBase成功运行,还需要在Linux机器上部署jdk,并设置java环境。为了支持最新的HBase版本,建议部署的jdk的版本在1.7.0以上。
将“jdk1.7.0-linux.tar.gz”上传到“/usr/java”目录下,运行“tar -zxvf jdk1.7.0-linux.tar.gz”命令,得到“/usr/java/jdk1.7.0”目录下的内容。
接下来需要在root用户(安装HBase的用户)下设置java环境。在root用户下执行“vi .bash_profile”命名,并将以下命令拷贝到该文件中:

export JAVA_HOME=/usr/java/jdk1.7.0
export PATH=$JAVA_HOME/bin:$PATH
export CLASSPATH=.:$JAVA_HOME/lib/dt.jar:$JAVA_HOME/lib/tools.jar

然后执行“:wq”命令保存文件内容。此时,环境变量已设置完成。为了确定环境变量是否已设置成功,可直接执行“java -version”命令,如果出现以下内容:

java version "1.7.0_60"
Java(TM) SE Runtime Environment (build 1.7.0_60-b19)
Java HotSpot(TM) 64-Bit Server VM (build 24.60-b09, mixed mode)

则表示部署jdk和设置java环境已成功。

3.启动和停止HBase
转到“/root/zhouzx/hbase-1.0.1/bin”目录下,执行“sh start-hbase.sh”或“./start-hbase.sh”命令启动HBase。如果出现以下内容:

starting master, logging to /root/zhouzx/hbase-1.0.1/bin/../logs/hbase-root-master-A10168992.out

则表示HBase启动成功。
接着,执行“sh stop-hbase.sh”或“./stop-hbase.sh”命令停止HBase。如果出现以下内容:

stopping hbase.................

则表示HBase已停止运行。



本人微信公众号:zhouzxi,请扫描以下二维码:

时间: 2024-10-18 13:39:20

HBase学习总结(1):HBase的下载与安装的相关文章

HBase学习笔记——基于HBase的日志系统的性能优化

我之前参与过一个日志系统的开发,存储用HBase.我简单罗列下用到的HBase优化,备忘.以后把它整理成更友好的介绍性文章. 系统简介 有一张大的日志数据表,保存所有日志.row key是 hash + app id + log-severity + timestamp + host等,cell保存日志正文数据. 可以看到row key的hash保证日志散列在各个region中,写入.查询的负载均衡.但是无法通过它进行范围查询,所以为不同查询模式,建立了多张索引表. 为不同的日志级别(DEBUG

hbase学习(一)hbase单机部署和java客户端连接单机hbase

最近看了些hbase的东西,打算写点什么,谁知鼓捣的过程中步步是坑,最终呕心沥血,憋出了这篇文章,实属不易. hbase和hive总是成对出现的,简单说,hbase是数据库,hive是mapReduce作业. 先从hbase单机部署说起,尽量说的简洁点,说多了都是眼泪. 1.给服务器起个机器名,iptables关掉,同时本地绑定host. 起个机器名 1 vi /etc/hosts 127.0.0.1 localhost 211.155.225.210 love-kaige 1 vi /etc/

HBase学习总结(3):HBase的数据模型及工作机制

一.HBase数据模型 HBase模式里的逻辑实体包括: (1)表(table):HBase用表来组织数据.表名是字符串(String),由可以在文件系统路径里使用的字符组成. (2)行(row):在表里,数据按行存储.行由行键(rowkey)唯一标识.行键没有数据类型,总是视为字节数组byte []. (3)列族(column family):行里的数据按照列族分组,列族也影响到HBase数据的物理存放,因此,它们必须事前定义并且不轻易修改.表中每行拥有相同列族,尽管行不需要在每个列族里存储数

HBase学习总结(2):HBase介绍及其基本操作

(HBase是一种数据库:Hadoop数据库,它是一种NoSQL存储系统,专门设计用来快速随机读写大规模数据.在已成功安装并正常启动的前提下,本文介绍HBase的基本操作.) 一.HBase简介 什么是HBase(Hadoop Database)呢?有以下两种常见的说法: 第一,它是一种稀疏的.分布式的.持久化的.多维有序映射,它基于行键(row key).列键(column key)和时间戳(timestamp)建立索引. 第二,它是一种键值(key value)存储,面向列族的数据库,有时也

Hbase 学习(四) hbase客户端设置缓存优化查询

我们在用hbase的api对hbase进行scan操作的时候,可以设置caching和batch来提交查询效率,那它们之间的关系是啥样的呢,我们又应该如何去设置? 首先是我们的客户端代码. 当caching和batch都为1的时候,我们要返回10行具有20列的记录,就要进行201次RPC,因为每一列都作为一个单独的Result来返回,这样是我们不可以接受的. 下面展示的是当batch=3,caching=6时候的图,是一次RPCs的传递的数据. 接着我们继续看下图 一次查询20条记录的话,只需要

hbase 学习(十五)缓存机制以及可以利用SSD作为存储的BucketCache

下面介绍Hbase的缓存机制: a.HBase在读取时,会以Block为单位进行cache,用来提升读的性能 b.Block可以分类为DataBlock(默认大小64K,存储KV).BloomBlock(默认大小128K,存储BloomFilter数据).IndexBlock(默认大小128K,索引数据,用来加快Rowkey所在DataBlock的定位) c.对于一次随机读,Block的访问顺序为BloomBlock.IndexBlock.DataBlock,如果Region下面的StoreFi

Hbase 学习(一) hbase配置文件同步

最近在狂啃hadoop的书籍,这部<hbase:权威指南>就进入我的视野里面了,啃吧,因为是英文的书籍,有些个人理解不对的地方,欢迎各位拍砖. HDFS和Hbase配置同步 hbase的配置中有一些和hdfs关联的配置,当hdfs中修改了,但是hbase中修改了,hbase中是不会知道的,比如dfs.replication,有时候我们想增加备份的数量,在hdfs中设置为5了,但是hbase中默认为3,这样hbase还是只保存3份. 那么有什么方法可以使他们的配置文件同步,有三种方法: (1)在

hbase 学习(十二)非mapreduce生成Hfile,然后导入hbase当中

最近一个群友的boss让研究hbase,让hbase的入库速度达到5w+/s,这可愁死了,4台个人电脑组成的集群,多线程入库调了好久,速度也才1w左右,都没有达到理想的那种速度,然后就想到了这种方式,但是网上多是用mapreduce来实现入库,而现在的需求是实时入库,不生成文件了,所以就只能自己用代码实现了,但是网上查了很多资料都没有查到,最后在一个网友的指引下,看了源码,最后找到了生成Hfile的方式,实现了之后,发现单线程入库速度才达到1w4左右,和之前的多线程的全速差不多了,百思不得其解之

hbase启动报错 hbase shell

问题描述 hbase启动报错 hbase shell 请大神帮帮忙 hbase启动 OK hbase shell有下问题 ./bin/hbase shell 2016-04-05 08:53:06,328 ERROR [main] zookeeper.RecoverableZooKeeper: ZooKeeper exists failed after 4 attempts 2016-04-05 08:53:06,331 WARN [main] zookeeper.ZKUtil: hconnec