HBase BulkLoad数据恢复

HBase BulkLoad data recovery

由于Bulkload方法完全绕过了写路径,WAL不会被写入 作为过程的一部分,所以在以下情况下如何恢复批量加载的数据 区域服务器 failure/crash?

HBase将数据存储在HFiles中,HFiles是不可变的,放在HDFS中,HDFS已经是可靠的存储。通常,此类文件的最小大小约为 128mb。在创建HFile之前,HBase在内存中积累了需要的数据量,为了在这个过程中实现持久化,HBase使用了WAL。在这种情况下,在批量加载中,您不需要 WAL,因为批量加载操作会直接创建 HFile,并告诉 HBase 将它们用作数据存储的一部分。