中文
注册
我要评分
文档获取效率
文档正确性
内容完整性
文档易理解
在线提单
论坛求助

介绍

产品介绍

BulkLoad是一款将数据快速高效的导入到HBase的工具。

相关概念

HBase:一个开源的非关系型分布式数据库,它参考了谷歌的BigTable建模,实现的编程语言为Java。它是Apache软件基金会的Hadoop项目的一部分,运行于HDFS文件系统之上,为Hadoop提供类似于BigTable规模的服务。因此,它可以对稀疏文件提供极高的容错率。

原理说明

HBase BulkLoad主要包含以下内容:

  • 通过MapReduce任务来准备数据。
  • 将数据加载到HBase中。