cassandra 压力工具中插入分布下的 select 分布比是多少?

what is select distribution ratio under insert distributions in cassandra stress tool?

select分配比例: 每个分区应插入的行占分区可能行总数的比例(由聚类分布列定义)。默认 FIXED(1)/1

谁能解释一下这是什么意思?以及为什么它在插入分配时被称为 select 分配比例?

http://www.datastax.com/dev/blog/improved-cassandra-2-1-stress-tool-benchmark-any-schema

在cassandra中,数据通过分区键分配给给定的节点,然后根据分区内的聚类键排序存储在磁盘上。

'distribution ratio' 允许您定义:

1) 压力工具将在每个分区中创建多少行,

2) 压力工具将从每个分区读取多少行(它们将被排序,因此抓取多个行相当快)

在 FIXED() 的情况下,这意味着每个分区将具有固定的行数 - 如果您选择其他一些选项,最终的行数将是可变的。

编辑以解释每个分区多行:

例如,如果您有一个从不同城市收集天气信息的数据模型:

CREATE TABLE sensor_readings (
station_id text,
weather_time timestamp,
temperature int,
humidity int,
PRIMARY KEY(station_id, weather_time)); 

在这种情况下,每个分区 (station_id) 中有多行(每个 weather_time 一行)。您可以查询给定 station_id 中的所有传感器读数,也可以仅查询一个特定的 weather_time。分配比率控制每个 station_id 有多少 weather_time