Hive和HBase整合

Hive和Hbase有各自不同的特征：hive是高延迟、结构化和面向分析的，hbase是低延迟、非结构化和面向编程的。Hive数据仓库在hadoop上是高延迟的。Hive集成Hbase就是为了使用hbase的一些特性。

Hive继承HBase可以有效利用HBase数据库的存储特性，如行更新和列索引等。在集成的过程中注意维持HBase jar包的一致性。Hive集成HBase需要在Hive表和HBase表之间建立映射关系，也就是Hive表的列和列类型与HBase表的列族及列限定词建立关联。每一个在Hive表中的域都存在与HBase中，而在Hive表中不需要包含所有HBase中的列。HBase中的rowkey对应到Hive中为选择一个域使用 :key 来对应，列族(cf:)映射到Hive中的其他所有域，列为(cf:cq)。

下面来简单实战下：

创建HBase表

create 'user1',{NAME => 'info',VERSIONS => 1}

向user表中插入一些数据

put 'user1','1','info:name','zhangsan'
put 'user1','1','info:age','25'
put 'user1','2','info:name','lisi'
put 'user1','2','info:age','22'
put 'user1','3','info:name','wangswu'
put 'user1','3','info:age','21'

使用scan命令来查看下user表中的数据

scan 'user';

结果如下

ROW COLUMN+CELL

1 column=info:age, timestamp=1476773051604, value=25

1 column=info:name, timestamp=1476773046344, value=zhangsan

2 column=info:age, timestamp=1476773051685, value=22

2 column=info:name, timestamp=1476773051661, value=lisi

3 column=info:age, timestamp=1476773052632, value=21

3 column=info:name, timestamp=1476773051709, value=wangswu

3 row(s) in 0.0610 seconds

创建Hive中与HBase中对应的表

SET hbase.zookeeper.quorum=hadoop001;
SET zookeeper.znode.parent=/hbase;
ADD jar /opt/bigdata/hive-1.2.1-bin/lib/hive-hbase-handler-1.2.1.jar;
// user1表
CREATE EXTERNAL TABLE user1 (
rowkey string,
info map<STRING,STRING>
) STORED BY 'org.apache.hadoop.hive.hbase.HBaseStorageHandler'
WITH SERDEPROPERTIES ("hbase.columns.mapping" = ":key,info:")
TBLPROPERTIES ("hbase.table.name" = "user1");
// user2表
CREATE EXTERNAL TABLE user2 (
rowkey string,
name string,
age int
) STORED BY 'org.apache.hadoop.hive.hbase.HBaseStorageHandler'
WITH SERDEPROPERTIES ("hbase.columns.mapping" = ":key,info:name,info:age")
TBLPROPERTIES ("hbase.table.name" = "user2");

查询user1，user2表数据

查询user1表数据

select * from user1;

结果如下

OK
1 {"age":"25","name":"zhangsan"}
2 {"age":"22","name":"lisi"}
3 {"age":"21","name":"wangswu"}
Time taken: 0.467 seconds, Fetched: 3 row(s)

查询user2表数据

select * from user2;

结果如下:

OK
1 zhangsan 25
2 lisi 22
3 wangswu 21
Time taken: 0.087 seconds, Fetched: 3 row(s)

hive插入数据到hbase

INSERT INTO TABLE user1
SELECT '4' AS rowkey,
map('name','lijin','age','22') AS info
from dual limit 1;

本文作者：佚名

来源：51CTO

时间： 2024-11-10 00:57:23

Hive和HBase整合的相关文章

Hive与Hbase整合

Hive与Hbase整合我们这边开始使用hbase做实时查询,但是分析的任务还是得交给hive,hive计算的结果导入到hbase. hive提供了几个jar包,帮助我们实现: 创建与hbase共享的表,数据(数据和表两边都有) 映射来自hbase的表到hive hive查询的结果直接导入hbase 启动hive 启动命令如下,主要是指定jar包,以及hbase使用的zookeeper的地址 bin/hive --auxpath /opt/CDH/hive/lib/hive-hbase-han

大数据工具篇之Hive与HBase整合完整教程

一.引言最近的一次培训,用户特意提到Hadoop环境下HDFS中存储的文件如何才能导入到HBase,关于这部分基于HBase Java API的写入方式,之前曾经有过技术文章共享,本文就不再说明.本文基于Hive执行HDFS批量向HBase导入数据,讲解Hive与HBase的整合问题.这方面的文章已经很多,但是由于版本差异,可操作性不大,本文采用的版本均基于以下版本说明中的版本. 二.版本说明序号软件版本 1 Hive 0.10.0 2 HBase 0.94.0 3 Hadoop 1.

急，求高手！！hive在向整合hbase的分区表插入数据时报错：Must specify table

问题描述急,求高手!!hive在向整合hbase的分区表插入数据时报错:Must specify table hadoop版本:hadoop-2.7.12.7.1 hbase版本:hbase-1.1.2 hive版本:apache-hive-2.0.0-bin 本人是新手,在整合了hive和hbase之后,我在hive中创建了一张关联了hbase表的分区表,然后在向表插入数据的时候报错了,下面是插入语句和报错,求懂的人解答. visited_in_hive是关联了hbase表,准备插入数据的表

一文看懂HIVE和HBASE的区别

两者分别是什么? Apache Hive是一个构建在hadoop基础设施之上的数据仓库.通过Hive可以使用HQL语言查询存放在HDFS上的数据.HQL是一种类SQL语言,这种语言最终被转化为Map/Reduce. 虽然Hive提供了SQL查询功能,但是Hive不能够进行交互查询–因为它只能够在Haoop上批量的执行Hadoop. Apache HBase是一种Key/Value系统,它运行在HDFS之上.和Hive不一样,Hbase的能够在它的数据库上实时运行,而不是运行MapReduce任务

Impala与HBase整合实践

我们知道,HBase是一个基于列的NoSQL数据库,它可以实现的数据的灵活存储.它本身是一个大表,在一些应用中,通过设计RowKey,可以实现对海量数据的快速存储和访问.但是,对于复杂的查询统计类需求,如果直接基于HBase API来实现,性能非常差,或者,可以通过实现MapReduce程序来进行查询分析,这也继承了MapReduce所具备的延迟性. 实现Impala与HBase整合,我们能够获得的好处有如下几个: 可以使用我们熟悉的SQL,像操作传统关系型数据库一样,很容易给出复杂查询.统计分

浅谈Hive vs. HBase

对于刚接触大数据的用户来说,要想区分Hive与HBase是有一定难度的.本文将尝试从其各自的定义.特点.限制.应用场景等角度来进行分析,以作抛砖引玉之用. Hive是什么? Apache Hive是一个构建于Hadoop(分布式系统基础架构)顶层的数据仓库,注意这里不是数据库.Hive可以看作是用户编程接口,它本身不存储和计算数据:它依赖于HDFS(Hadoop分布式文件系统)和MapReduce(一种编程模型,映射与化简:用于大数据并行运算).其对HDFS的操作类似于SQL-名为HQL,它提供

Hive Over HBase的介绍

Hive Over HBase是基于Hive的HQL查询引擎支持对hbase表提供及时查询的功能,它并不是将hql语句翻译成mapreduce来运行,其响应时间在秒级别. 特性支持的字段类型: boolean, tinyint, smallint, int, bigint, float, double, string, struct (当hbase中的rowkey字段为struct类型,请将子字段定义为string类型,同时指定表的collection items terminated分隔字符

hive跟hbase整合用hive导入数据报错，报一个路径不是目录。

问题描述 hive跟hbase整合用hive导入数据报错,报一个路径不是目录. hive>load data local inpath '/home/hadoop/ha1.txt' into table ha1; FAILED: Hive Internal Error: java.lang.RuntimeException(org.apache.hadoop.ipc.RemoteException: java.io.FileNotFoundException: Parent path is no

服务器-Springmvc 和 Hbase整合

问题描述 Springmvc 和 Hbase整合求大神指点运行到图中红线处报错,但是我用junit 测试这个方法是正常的,部署到tomcat服务器上之后运行就会出错.HbaeDAO就是访问hbase的一个类,测试运行的时候没问题的解决方案这不是明显的少jar包吗

猜你喜欢

qq-多源数据中的QQ账号信息筛选

问题描述多源数据中的QQ账号信息筛选我是名大学生,信息安全专业的.关于这个课题,我觉得好难阿,恳请各位大神多多帮忙,我没思路.小弟感激不尽! 解决方案这个可通过账号中的信息将账号进行分类管理( ...

XMLHTTP组件相关技术应用资料

xml 一.数据库远程管理技术基于互联网的广域网现代应用中的一个重要环节是数据库远程监控.首先简单回顾一下互联网上的数据库远程管理技术的发展过程和方式: 早期通过编写CGI-BIN程序模块进 ...

百度常用的搜索指令分享

用户在搜索引擎中搜索普通词语外,还可以使用一些特殊的指令,对于SEO人员来说,这样可以使你更好的分析竞争对手和查找更多的资源. 一双引号的使用把搜索的词语放在双引号("")内, ...

编程算法：求1+2+...+n(函数继承) 代码(C++)

题目: 求1+2+...+n, 要求不能使用乘除法\for\while\if\else\switch\case等关键字及条件判断语句(A?B:C). 可以使用函数继承, 通过递归调用, 每次递归值减1 ...

PS给人物相片加上超炫背景

教程的制作需要较强的美术功底,尤其是鼠绘方面.教程中有很多特效都需要用手绘去完成.可见作者美术功底非常深,而且细节及创意部分都非常不错. 原图最终效果 1.制作之前可以自己设想画出草图.打开原图素材 ...

怎样在Word2013中插入文档摘要和关键字

第1步,打开Word2013文档窗口,并将插入点光标定位到需要插入文档信息的位置.切换到"插入"功能区,在"文本"分组中单击"文档部件" ...

腾讯美女设计师教你如何抄现实

晋小彦(腾讯 TGI 高级视觉设计师,美女设计师一枚):抄现实是我们在设计中最直接也是常用的一种方法,它顾名思意就是抄袭现实中存在的物体.因为其结果直接与主题相关联,所以抄现实的方法可以让视觉整体 ...

酷狗音乐怎么K歌？

1.首先打开酷狗音乐,点击卡拉OK模式进入. 2.然后直接切换到伴唱,要注意有些歌曲是没有伴唱的,可能是没有资源的原因吧! 3.等歌曲全部缓冲完毕的时候就可以选择K歌了.点击开始K歌. 4.然后你 ...

Mac通讯录如何导出联系人

Mac通讯录是一款非常简单的Mac自带APP应用,Mac通讯录导入,相信几乎每个用苹果设备的朋友都会用,那么如何导出Mac通讯录里的联系人呢?无论你是想与某人共享一个联系人名片,还是想备份你 Ma ...

金钱并非一切

本人曾经亲身体验过融资过程,算得上是个正面的例子,证明即使是现在这样的经济大气候下,发明家和创业者一样有机会融到钱.我从亲身经历中学到很多容易被忽略的问题,现在打算和大家分享一点心得,一些曾让我大吃一 ...

pb11.5 cs转bs，浏览时报错。

问题描述 pb11.5 cs转bs,浏览时报错. [FileNotFoundException: 找不到指定的模块. (异常来自 HRESULT:0x8007007E)] Sybase.PowerBu ...

如何为TensorFlow和PyTorch自动选择空闲GPU，解决抢卡争端

使用 git clone https://github.com/QuantumLiu/tf_gpu_manager 把manager.py放到你训练的目录就行. 直接使用with gm.auto_ch ...

Android群英传笔记——第九章：Android系统信息和安全机制

Android群英传笔记--第九章:Android系统信息和安全机制本书也正式的进入尾声了,在android的世界了,不同的软件,硬件信息就像一个国家的经济水平,军事水平,不同的配置参数,代表着一个 ...

Android复选框对话框用法实例简析_Android

本文实例分析了Android复选框对话框用法.分享给大家供大家参考,具体如下: /** * 创建筛选复选框对话框 * @param guoguanglist 联赛名 * @param flags 是否 ...

【转码系列之一】利用阿里云进行媒体转码，你得先知道这些

媒体转码介绍阿里云媒体转码(Media Transcoding) 是为多媒体数据提供的转码计算服务.它以经济.易用.弹性和高可扩展的音视频转换方法,帮助您将存储于OSS的音视频转码成适合在PC.TV ...

分期付款买手机竟多花400元

消委会提醒消费者提防商家"虚低实高"的猫腻本报讯 (记者马骏)个别商家推出手机分期付款业务,看似实惠诱人但却可能潜存"陷阱". 网友"风之子&quo ...

湖北关闭152家违法违规网站

中介交易 http://www.aliyun.com/zixun/aggregation/6858.html">SEO诊断淘宝客云主机技术大厅本报讯(记者马振华)昨日,省通信管 ...

人工智能小镇开园未来聚焦四大发展目标

本文讲的是人工智能小镇开园未来聚焦四大发展目标[IT168 资讯]谷歌研发的人工智能程序AlphaGo战胜了围棋世界冠军,开启了AI技术的大发展.据统计,2011年至今,阿里,谷歌.微软.Twitt ...

罗立被拘真实原因曝光：涉嫌20万倒卖千万版权

中介交易 http://www.aliyun.com/zixun/aggregation/6858.html">SEO诊断淘宝客云主机技术大厅凤凰科技讯 5月29日消息,昨日晚 ...

个体老板迷网赌输百万为翻本骗货款36万元

中介交易 http://www.aliyun.com/zixun/aggregation/6858.html">SEO诊断淘宝客云主机技术大厅个体老板曹某疯狂参与网络赌博,7个 ...

如何用最简单的语句提交大量表单对象的值存储到数据库

如何用最简单的语句提交大量表单对象的值存储到数据库?说道这个问题可能大家经常遇到,感到很头痛,但是又没办法,只能慢慢写,笔者以提交一张应聘表单的提交为例给大家介绍如何用最简短的语句来达到目的脚本运行通 ...

jQuery实现精美的多级下拉菜单特效_jquery

这是一款精美的多级下拉菜单美化,可以完美替代"select"来实现下拉菜单的效果.而且支持多级菜单,有加载等待效果,有层级分类展示. 复制代码代码如下: <!DOCTYPE ...

搜索引擎蜘蛛程序3-搜索引擎技术

二. Robots META标签1.什么是Robots META标签Robots.txt文件主要是限制整个站点或者目录的搜索引擎访问情况,而Robots META标签则主要是针对一个个具体的页面.和 ...

报告称去年全球应用下载量增长15% 收入飙升40%

据科技博客VentureBeat报道,市场研究公司App Annie发布的最新报告显示,2016年,全球应用的下载量.收入以及用户在应用上花费的时间均实现了双位数增长.报告显示,用户去年在应用上花费的 ...

算法-快速排序这段代码有问题吗？为什么排不好序呢？

问题描述快速排序这段代码有问题吗?为什么排不好序呢? #include<stdio.h> void quicksort(int A[],int p,int r); int partiti ...

HR背景调查与简历不符会影响给offer么？

问题描述刚面试一家公司并且已经同意给offer了,但是之后HR找一哥们做背景调查,那哥们把一些信息说错了(之前公司的入职时间),跟我在简历上的不一致,相差了一年啊!本来说上个星期给offer的,但是 ...

讲解独立站应用

摘要: 电子商务这门技术在国外的发展远比中国要领先,不过中国发展迅速也不甘落后的加入了这列大军之中,在电子商务国内的技术包括有B2B平台的SEO应用.企业独立站的SEO应用.百度功能电子商务这门技术 ...

需求变更的烦恼

客户今天要求变更需求,加某某功能,"这个应该不难吧,某某公司的产品都有这个功能的."客户的需求一直在变,烦恼... 开始是需求不明确,客户都不知道要做成什么样,只有一个大概的粗略的 ...

[LeetCode]116.Populating Next Right Pointers in Each Node

[题目] Given a binary tree struct TreeLinkNode { TreeLinkNode *left; TreeLinkNode *right; TreeLinkNode ...

华为荣耀6首选网络设置方法

1)在手机桌进入设置后找到[全部设置]选项卡,之后我们点击全部设置下面的[更多]然后再点击下面的[移动网络]打开进入效果如下.(如下图) 2)然后你再找到下面的[首选网络类型],自行选择所 ...

热搜

© 2024 iVAN | info#iamivan.net | 11 q. 0.027 s.