HBase是一个高可靠性、高性能、面向列和可伸缩的分布式存储系统。本文为您介绍如何在E-MapReduce中使用HBase。

背景信息

E-MapReduce中HBase架构如下所示。 HBase

E-MapReduce(简称EMR)中的HBase也可以构建在JindoFS(OSS)上。

HBase特点如下:
  • 处理海量数据(TB或PB级别以上)。
  • 具有高吞吐量。
  • 在海量数据中实现高效的随机读取。
  • 具有很好的伸缩能力。
EMR中HBase的主要组件如下:
  • HMaster:部署EMR的Master节点。
    说明 集群开启高可用时会启动两个HMaster。
  • RegionServer:部署EMR的Worker节点。

关于Apache HBase的更多介绍,请参见Apache HBase官网

使用HBase