扩展阅读
 
当前位置:  NOSQL>hadoop/hbase

hbase介绍及最新稳定版hbase-0.98.3下载地址

 
    发布时间:2014-7-23  


    本文导语:  hbase介绍及最新稳定版hbase-0.98.3下载地址 HBase是一个分布式的、面向列的开源数据库,该技术来源于Google论文“Bigtable:一个结构化数据的分布式存储系统”。就像Bigtable利用了Google文件系统(File System)所提...

   hbase介绍及最新稳定版hbase-0.98.3下载地址

   HBase是一个分布式的、面向列的开源数据库,该技术来源于Google论文Bigtable:一个结构化数据的分布式存储系统”。就像Bigtable利用了Google文件系统File System)所提供的分布式数据存储一样,HBase在Hadoop之上提供了类似于Bigtable的能力。HBase是Apache的Hadoop项目的子项目。HBase不同于一般的关系数据库,它是一个适合于非结构化数据存储的数据库。另一个不同的是HBase基于列的而不是基于行的模式


HBase主要特点(HBase features of note are):

    Strongly consistent reads/writes: HBase is not an "eventually consistent" DataStore. This makes it very suitable for tasks such as high-speed counter aggregation.

    Automatic sharding: HBase tables are distributed on the cluster via regions, and regions are automatically split and re-distributed as your data grows.

    Automatic RegionServer failover.

Hadoop/HDFS Integration: HBase supports HDFS out of the box as its distributed file system.

MapReduce: HBase supports massively parallelized processing via MapReduce for using HBase as both source and sink.

Java Client API: HBase supports an easy to use Java API for programmatic access.

Thrift/REST API: HBase also supports Thrift and REST for non-Java front-ends.

Block Cache and Bloom Filters: HBase supports a Block Cache and Bloom Filters for high volume query optimization.

Operational Management: HBase provides build-in web-pages for operational insight as well as JMX metrics.


什么情况下使用Hbase?

1)要确认有足够多的数据存入HBase.

    如果有几亿或者几十亿条记录要存入HBase,那么HBase就是一个正确的选择;否则如果你仅有几百万条甚至更少的数据,那么HBase当然不是正确的选择,这种情况下应当选择传统的关系型数据库,因为如果这么少的数据存入HBase,就会导致数据堆积在一两个节点上,而HBase集群内部的其他节点都处于空闲状态

   2)要确认即便不使用传统关系型数据库提供的额外功能(比如数据库的列有强类型限制,secondary indextransactionSQL高级查询语言)系统也能顺畅工作基于传统关系型数据上的应用不能通过简单的更换JDBC驱动程序"迁移"到HBase。系统从普通的关系型数据库迁移到HBase将导致整个系统的重新设计

   3)确认有足够的硬件服务器来支撑HBase的运行。

   即便单独运行HDFS,HDFS在少于5个节点的情况下工作不理想,由于在默认情况下HDFS的block replication factor为3,另外还要加上一个Namenode


HBase访问接口介绍

1. Native Java API,最常规和高效的访问方式,适合Hadoop MapReduce Job并行批处理HBase表数据.

2. HBase Shell,HBase的命令行工具,最简单的接口,适合HBase管理使用.

3. thrift gateway,利用thrift序列化技术,支持c++phppython等多种语言,适合其他异构系统在线访问hbase表数据.

4. REST Gateway,支持REST 风格的Http API访问HBase, 解除了语言限制.

5. Pig,可以使用Pig Latin流式编程语言来操作HBase中的数据,和Hive类似,本质最终也是编译成MapReduce Job来处理HBase表数据,适合做数据统计.

6. Hive,当前Hive的Release版本尚没有加入对HBase的支持,但在下一个版本Hive 0.7.0中将会支持HBase,可以使用类似SQL语言来访问HBase.


hbase-0.98.3下载地址:


hbase-0.98.3下载


   进入下载页面之后打开任意一个镜像地址之后即可看见各个版本的Hbase,如下所示:

   


  • 本站(WWW.)旨在分享和传播互联网科技相关的资讯和技术,将尽最大努力为读者提供更好的信息聚合和浏览方式。
    本站(WWW.)站内文章除注明原创外,均为转载,整理或搜集自网络.欢迎任何形式的转载,转载请注明出处.
    转载请注明:文章转载自:[169IT-IT技术资讯]
    本文标题:hbase介绍及最新稳定版hbase-0.98.3下载地址
相关文章推荐:


站内导航:


特别声明:169IT网站部分信息来自互联网,如果侵犯您的权利,请及时告知,本站将立即删除!

©2012-2021,,E-mail:www_#163.com(请将#改为@)

浙ICP备11055608号-3