HBase介绍
HBase–Hadoop Database,是一个高可靠性、高性能,面向列、可伸缩的分布式存储系统,利用HBase技术可以在廉价的PC Server上搭建起大规模结构化存储集群。
HBase主要有三个组件,分别是HMaster、HRegionServer和ZooKeeper,三个组件的主要职责如下。
HMaster
HMaster是整个HBase组件的控制者,主要有以下职责:
- 负载均衡。
- 权限管理(ACL)。
- HDFS上的垃圾文件回收。
- 管理namespace和table的元数据。
- 表格的创建、删除和更新(列族的更新)。
- Region分配:启动时分配、失效RegionServer上Region的再分配、Region切分时分配。
HRegionServer
HRegionServer是HBase实际读写者,主要有以下职责:
- Region切分。
- HDFS交互,管理table数据。
- 响应client的读写请求,进行I/O操作。
ZooKeeper
ZooKeeper是HBase的协调者,主要有以下职责:
- 存储HBase中表格的元数据信息。
- 保证集群中有且只有一个HMaster为Active。
- 存储hbase:meta,即所有Region的位置信息。
- 监测RegionServer状态,将RS的上下线情况汇报给HMaster。
- ZooKeeper集群本身使用Paxos协议保证每个节点状态的一致性。
父主题: 调优概述