改善数据访问:HBase、Sqoop以及Flume - 产品和技术

改善数据访问:">HBase、Sqoop以及Flume 发布时间:2012.04.16 14:38      来源:和讯     作者:和讯

Hadoop核心还是一套批处理系统,数据加载进HDFS、处理然后检索。对于计算这或多或少有些倒退,但通常互动和随机存取数据是有必要的。HBase作为面向列的数据库运行在HDFS之上。HBase以Google BigTable为蓝本。项目的目标就是快速在主机内数十亿行数据中定位所需的数据并访问它。HBase利用MapReduce来处理内部的海量数据。同时Hive和Pig都可以与HBase组合使用,Hive和Pig还为HBase提供了高层语言支持,使得在HBase上进行数据统计处理变的非常简单。

但为了授权随机存储数据,HBase也做出了一些限制:例如Hive与HBase的性能比原生在HDFS之上的Hive要慢4-5倍。同时HBase大约可存储PB级的数据,与之相比HDFS的容量限制达到30PB。HBase不适合用于ad-hoc分析,HBase更适合整合大数据作为大型应用的一部分,包括日志、计算以及时间序列数据。

时间: 2024-08-02 07:38:05

改善数据访问:HBase、Sqoop以及Flume - 产品和技术的相关文章

SAP设立大数据理事会 拓展合作伙伴生态系统 - 产品和技术

SAP设立大数据理事会 拓展合作伙伴生态系统 发布时间:2012.05.18 15:35 &http://www.aliyun.com/zixun/aggregation/37954.html">nbsp;    来源:赛迪网     作者:赛迪网 SAP特别设立了一个"大数据"合作伙伴理事会.该理事会致力于进行合作创新,研发基于SAP实时数据平台和Hadoop的新产品解决方案,探索新应用和架构.理事会将由包括初创公司,硬件.软件提供商以及技术服务组织在内的不同

面对大数据OLAP分析的一些问题 - 产品和技术

面 对大数据OLAP分析的一些问题 发布时间:2012.05.16 09:25 &http://www.aliyun.com/zixun/aggregation/37954.html">nbsp;    来源:赛迪网     作者: OLAP分析需要进行大量的数据分组和表间关联,而这些显然不是NoSQL和传统数据库的强项,往往必须使用特定的针对BI优化的数据库.比如绝大多数针对BI优化的数据库采用了列存储或混合存储.压缩.延迟加载.对存储数据块的预统计.分片索引等技术. Hadoo

HBase数据访问的一些常用方式

类型 特点 场合 优缺点分析 Native Java API 最常规和高效的访问方式 适合MapReduce作业并行批处理HBase表数据     Hbase Shell HBase的命令行工具,最简单的访问方式 适合HBase管理使用   Thrift GateWay 利用Thrift序列化技术,支持c++,PHP,Python等多种语言 适合其他异构系统在线访问HBase表数据     REST Gateway 解除了语言限制 支持REST风格的Http API访问Hbase   Pig 使

sqoop将oracle数据导入hbase的问题,求各位大神们指导

问题描述 sqoop将oracle数据导入hbase的问题,求各位大神们指导 sqoop将oracle数据导入hbase,要求可以Java连接服务器上的sqoop,sqoop1可以直接实现但是没有Java client的API,sqoop2 有client但是不能直接实现oracle到hbase,这是我得出的结论,请教大神们,有没有好的方法?

sqoop 从oracle导数据到hbase中报错

问题描述 sqoop 从oracle导数据到hbase中报错 解决方案 通过Sqoop实现Mysql / Oracle 与HDFS / Hbase互导数据通过Sqoop实现Mysql / Oracle 与HDFS / Hbase互导数据通过Sqoop实现Mysql / Oracle 与HDFS / Hbase互导数据

如何利用mapreduce访问hbase数据

package com.mr.test; import java.io.IOException; import java.util.Iterator; import org.apache.hadoop.conf.Configuration; import org.apache.hadoop.fs.Path; import org.apache.hadoop.hbase.HBaseConfiguration; import org.apache.hadoop.hbase.KeyValue; imp

了解 XML实现通用的数据访问

xml|访问|数据   了解可扩展标记语言 (XML) 如何帮助我们实现通用的数据访问.XML 是一种基于 Unicode 的纯文本元语言,即一种用于定义标记语言的语言.它不依赖于任何编程语言.操作系统或软件供应商.XML 可以提供对各种数据处理.构建.转换和查询技术的访问.(本文包含一些指向英文站点的链接.)  简介     最初设想的可扩展标记语言 (XML) 用于为 Web 定义新文档的格式.XML 由标准通用标记语言 (SGML) 衍生而来,可以认为它是一种元语言,即一种定义标记语言的语

.NET 数据访问体系结构指南一

访问|数据|体系  ADO.NET 引入的主要变化之一是用 DataTable.DataSet.DataAdapter 和 DataReader 对象的组合取代了 ADO Recordset 对象.DataTable 表示单个表中行的集合,在这一方面类似于 Recordset.DataSet 表示 DataTable 对象的集合,同时包括将各种表绑定在一起的关系和约束.实际上,DataSet 是带有内置 XML 支持的.内存中的关系结构. DataSet 的主要特性之一是它不了解可能用来填充它的

数据访问接口体系及数据对象模型探讨--[附录]

对象|访问|数据|体系 数据访问接口体系及数据对象模型探讨(Beat 1.0)                                                             81_RedStar81@163.com                                               TomHornson.student@www.sina.com.cn                                                个