如何设计高性能的 Hbase 模式
how to design Hbase schema for high performance
对于设计性能良好的 Hbase 模式,有什么好的建议吗?例如:不要使用太多的 columnFamily,因为太多的 columnFamily 会导致 read/write 变慢?在不同的 columnFamily 中将大列与小列分开?我非常感谢任何建议。
HBase table 由列族组成,列族是列的逻辑和物理分组。一个族中的列与另一个族中的列分开存储。如果您有不经常查询的数据,请将该数据分配给单独的列族。
每行重复列族和列限定符名称。因此,名称应尽可能短,以减少 HBase 存储和读取的数据量。例如,使用 f:q 而不是 mycolumnfamily:mycolumnqualifier。
因为列族存储在单独的HFile中,所以列族的数量越少越好。您还希望减少列族的数量以减少 MemStore 刷新的频率和压缩的频率。并且,通过使用尽可能少的列族,您可以缩短加载时间并减少磁盘消耗。
对于设计性能良好的 Hbase 模式,有什么好的建议吗?例如:不要使用太多的 columnFamily,因为太多的 columnFamily 会导致 read/write 变慢?在不同的 columnFamily 中将大列与小列分开?我非常感谢任何建议。
HBase table 由列族组成,列族是列的逻辑和物理分组。一个族中的列与另一个族中的列分开存储。如果您有不经常查询的数据,请将该数据分配给单独的列族。
每行重复列族和列限定符名称。因此,名称应尽可能短,以减少 HBase 存储和读取的数据量。例如,使用 f:q 而不是 mycolumnfamily:mycolumnqualifier。
因为列族存储在单独的HFile中,所以列族的数量越少越好。您还希望减少列族的数量以减少 MemStore 刷新的频率和压缩的频率。并且,通过使用尽可能少的列族,您可以缩短加载时间并减少磁盘消耗。