Hadoop是专为大量数据进行分布式处理而设计的。HBase则是一个分布式的、可以随机存取大型数据集的开源NoSQL数据库。HBase是Hadoop的子项目,可以通过Cloudera's Hadoop来发行。
目前,广泛采用的NoSQL数据库的主要应用障碍之一,就是缺乏的查询语言,即缺乏全面的非编程接口内的NoSQL数据存储的数据。我们期望在不久的将来,NoSQL数据库能够解决这一问题。但现下, Quest's Toad for Cloud则可以填补这一空白。通过Quest's Toad for Cloud,我们可以很容易地无缝访问的NoSQL,云和通过单一接口的关系型数据源,也可以通过使用熟悉的SQL接口和问题的DML命令(SELECT,INSERT,UPDATE,DELETE)来访问HBase/ Hadoop,Cassandra、其它NoSQL和云来源。
打开Cloudera Manager的主要服务面板,启动HBase服务:
图1
HbaseStartup
启动Toad for Cloud,设置好一个名为“ETLData ”的新数据源,并提供与HBase数据存储的连接参数。我们的HBase Stargate (REST)服务器名为EC2-107-21-36-222.compute 1.amazonaws.com(Amazon Web Services的虚拟服务器):
图2
PickDataSourceType
现在可以看到以前HBase的HBase的shell界面(在本例中名称为客户创建表):
图3
Customer
由于Toad SQL是HBase顶部的一个抽象层,它需要HBase的表映射到自己的表。Toad会自动为我们正确识别—我们的单列客户表与两列(名和姓)家族的对应关系:
图4
MapTable
现在,我们可以发出熟悉的SQL语句查询或修改数据了。
图5
Select