HBase全网最佳学习资料汇总

前言

HBase这几年在国内使用的越来越广泛,在一定规模的企业中几乎是必备存储引擎,互联网企业阿里巴巴、京东、小米都有数千台的HBase集群,中国电信的话单、中国人寿的保单都是存储在HBase中。注意大公司有数十个数百个HBase集群,此点跟Hadoop集群很不相同。另外,数据需求,很多公司是mysql+hbase+hadoop(spark),满足关系型数据库需求,满足大规模结构化存储需求,满足复杂分析的需求。如此流行的原因来源于很多方面,如:

  • 开源繁荣的生态:1. 任何公司倒闭了,开源的HBase还在 2.几乎每家公司都可以去下载源码,改进她,再反馈给社区,就如阿里已经反馈了数百个patch了。加入的人越多,引擎就越好
  • 跟HADOOP深度结合:本就同根同源,在数据存储在HBase后,如果想复杂分析,则非常方便
  • 高扩展、高容量、高性能、低成本、低延迟、稀疏宽表、动态列、TTL、多版本等最为关键,起源google论文,发扬社区及广大互联网公司,设计之初就是为存储互联网,后经过多年的改进升级,如今已经是结构化存储的事实标准

以下资料会一直更新中......请大家关注!

书籍

最好买纸质书籍,集中时间看下

  • HBase权威指南(HBase: The Definitive Guide):理论多一些
  • HBase实战:实践多一些

总结性

  • HBase2.0: HBase2.0 :预计今年会发布,hbase2.0是革命性的版本
  • HBase Phoenix:Apache Phoenix与HBase:HBase之上SQL的过去,现在和未来
  • 社区hbase博客:https://blogs.apache.org/hbase/

方法论

  • 学术界关于HBase应用场景(物联网/车联网/交通/电力等)研究大全: HBase在互联网领域有广泛的应用,比如:互联网的消息系统的存储、订单的存储、搜索原材料的存储、用户画像数据的存储等。得益于HBase海量的存储量及超高并发写入读取量。HBase在09年就开始在工业界大范围使用,在学术界,也有非常多的高校、机构在研究HBase应用于不同的行业,本文主要梳理下这些资料(主要是中文资料,有一些是硕士论文\期刊),这些很多都在工业界使用了。
  • HBase使用场景和成功案例 存储互联网的初心不变
  • 一种基于物联网大数据的设备信息采集系统及方法:怎么使用HBase、sparkStreaming、redis处理物联网大数据
  • 一种基于HBase的智能电网时序大数据处理方方案:一种基于HBase的智能电网时序大数据处理方方案
  • HBase配合GeoHash算法支持经纬度:此文主要讲GeoHash算法的
  • ** 基于HBase的海量GIS数据分布式处理实践**:设计了一种基于分布式数据库HBase的GIS数据管理系统。系统优化了栅格数据的生成和存储过程,将海量栅格数据直接写入HBase存储、索引。同时,针对矢量空间数据的存储、索引与检索,提出了一种新的rowkey设计,既考虑经纬度,又考虑空间数据类型和属性,使得在按空间位置检索矢量地理信息时,能通过HBase的rowkey迅速定位需要返回的数据。在HBase的集群环境上用真实GIS数据对上述方法进行了验证,结果表明,提出的系统具有较高的海量数据存储和检索性能,实现了海量地理信息数据的高效存储和实时高速检索。
  • 基于HBase的金融时序数据存储系统:金融类时序数据的存储方案,写的还是结合实际场景的。

各大公司的实践

基本围绕在用户画像、安全风控、订单存储、交通轨迹、物理网、监控、大数据中间存储、搜索、推荐等方面:

HBase资料库

结尾

这些资料是笔者整理,以供有大规模结构化需求的用户及HBase爱好者学习交流,以使用HBase更好的解决实际的问题。

交流群

如果大家对HBase有兴趣,致力于使用HBase解决实际的问题,欢迎加入阿里云Hbase技术交流群交流.
欢迎加入阿里云云HBase技术交流群
钉钉阿里云hbase交流群

声明

以上资料来自互联网,如果侵权,请联系我删除

时间: 2024-11-05 14:57:56

HBase全网最佳学习资料汇总的相关文章

(转) 深度学习全网最全学习资料汇总之入门篇

  本文转自: http://www.dlworld.cn/ZiLiaoXiaZai/3428.html 深度学习全网最全学习资料汇总之入门篇  作为人工智能领域一个重要的研究分支,深度学习技术几乎出现在当下所有热门的AI应用领域,包括语音识别,语义理解,图像识别,大数据分析等等,甚至有人把当前的人工智能等同于深度学习.面对如此重要的江湖地位,我们相信一定有为数众多的 AI 开发者对深度学习技术充满了好奇心,想要快速着手使用这项强大的技术来解决现实生活中的实际问题.因此,雷锋网将围绕深度学习技术

(zhuan) 深度学习全网最全学习资料汇总之模型介绍篇

  This blog from : http://weibo.com/ttarticle/p/show?id=2309351000224077630868614681&u=5070353058&m=4077873754872790&cu=5070353058   深度学习全网最全学习资料汇总之模型介绍篇 雷锋网  作者: 三川 2017-02-21 16:38:00 查看源网址 阅读数:4       本文旨在加速深度学习新手入门,介绍 CNN.DBN.RNN.RNTN.自动编码

Java 8学习资料汇总

本文首发于InfoQ. Java 8发布已经有一段时间,它被认为是Java 5发布以来最大的一次版本升级.Java 8 为Java语言.编译器.类库.开发工具以及JVM(Java虚拟机)带来了大量新特性.Lambda表达式.默认方法.并行API等都受到了开发者的追捧,社区上关于Java 8的学习资料如雨后春笋般涌现.下面是一些优秀的学习资料汇总: Brian Goetz在Stack Overflow上的回答Brian是<Java并发编程实战>的作者之一,有20多年的软件咨询行业经验.Brian

我的Android进阶之旅------&amp;gt;RxJava学习资料汇总

在响应式编程中,应该牢记以下两点: everything is a stream(一切皆流) don't break the chain(不要打断链式结构) 记住,可观测序列就像一条河,它们是流动的.你可以"过滤"一条河,你可以"转换"一条河,你可以将两条河合并成一条,然后它依旧是流动的.最后,它将成为你想要的那条河. "Be Water,my friend"  --Bruce Lee(李小龙) -------------------------

转:PyQt4学习资料汇总 from coderzh

一个月前研究了下PyQt4,感觉比较不错.相比wxpython,界面美观了很多,并且将界面设计与代码逻辑很好的分离了开来.关于PyQt4的资料也不少,这里我将我找到的资料汇总一下,以防自己以后忘得一干二净. 1.PyQt4资料链接  http://www.riverbankcomputing.com  http://wiki.woodpecker.org.cn/moin/PyQt  http://www.commandprompt.com/community/pyqt/book1  http:/

【我的Android进阶之旅】Realm数据库学习资料汇总(持续更新)

介绍 realm是一个跨平台移动数据库引擎,支持iOS.OS X(Objective-C和Swift)以及Android. 2014年7月发布.由YCombinator孵化的创业团队历时几年打造,是第一个专门针对移动平台设计的数据库.目标是取代SQLite. 为了彻底解决性能问题,核心数据引擎C++打造,并不是建立在SQLite之上的ORM.如果对数据引擎实现想深入了解可以查看:Realm 核心数据库引擎探秘.因此得到的收益就是比普通的ORM要快很多,甚至比单独无封装的SQLite还要快. 因为

深度学习全网最全学习资料汇总之入门篇

作为人工智能领域一个重要的研究分支,深度学习技术几乎出现在当下所有热门的AI应用领域,包括语音识别,语义理解,图像识别,大数据分析等等,甚至有人把当前的人工智能等同于深度学习.面对如此重要的江湖地位,我们相信一定有为数众多的 AI 开发者对深度学习技术充满了好奇心,想要快速着手使用这项强大的技术来解决现实生活中的实际问题.因此,雷锋网(公众号:雷锋网)将围绕深度学习技术整理一个系列文章,全面覆盖与其相关的各项知识点. 本文针对如何入门深度学习这一话题,整理了若干参考资料,希望对广大开发者有所裨益

Tensorflow 全网最全学习资料汇总之框架平台的综合对比【3】

作为机器学习领域.尤其是 Python 生态圈最受欢迎的框架平台,TensorFlow 具有许多吸引开发者的优点.其中最显而易见的是谷歌的技术支持和完善的社区(庞大用户群).这些都为 TensorFlow 的普及打下了基础.但是,开发者需要了解 Tensorflow 在技术上有哪些值得一提的优势,又有哪些不足,以便在处理特定任务时进行工具选择.而这些,必须要在与其他平台.框架的对比中才能凸显.顺便说一句老生常谈的话,没有万能的工具,只有在不同应用场景下最合适的选择.因此,雷锋网整理了介绍 Ten

深度学习全网最全学习资料汇总之模型介绍篇

本文旨在加速深度学习新手入门,介绍 CNN.DBN.RNN.RNTN.自动编码器.GAN 等开发者最常用的深度学习模型与架构.雷锋网搜集整理了涉及以上话题的精品文章,供初学者参考. 卷积神经网络 CNN 深度学习元老Yann Lecun详解卷积神经网络 Yann Lecun 的 CNN 话题演讲+ppt. 链接:http://www.leiphone.com/news/201608/zaB48AcZ1AFm1TaP.html 卷积神经网络(CNN)新手指南 翻译自国外的 CNN 教程,解释详细,