在 cassandra 中 select distinct count 有哪些方法?
What are the ways to select distinct count in cassandra?
我需要在 cassandra 的 table 中 select 不同计数。
据我了解,cassandra 不支持直接非重复计数,甚至不支持像 rdbms 这样的嵌套查询。
select count(*) from (select distinct key_part_one from Whosebug_composite) as count;
SyntaxException: line 1:21 no viable alternative at input '(' (select count(*) from [(]...)
有哪些获取途径。我是否可以直接从 cassandra 获取或需要使用任何插件 tools/languages?
下面是我的创建 table 语句。
CREATE TABLE nishant_ana.ais_profile_table (
profile_key text,
profile_id text,
last_update_day date,
last_transaction_timestamp timestamp,
last_update_insertion_timestamp timeuuid,
profile_data blob,
PRIMARY KEY ((profile_key, profile_id), last_update_day)
) WITH CLUSTERING ORDER BY (last_update_day DESC)
AND bloom_filter_fp_chance = 0.01
AND caching = {'keys': 'ALL', 'rows_per_partition': 'NONE'}
AND comment = ''
AND compaction = {'class': 'org.apache.cassandra.db.compaction.SizeTieredCompactionStrategy', 'max_threshold': '32', 'min_threshold': '4'}
AND compression = {'chunk_length_in_kb': '64', 'class': 'org.apache.cassandra.io.compress.LZ4Compressor'}
AND crc_check_chance = 1.0
AND dclocal_read_repair_chance = 0.1
AND default_time_to_live = 0
AND gc_grace_seconds = 864000
AND max_index_interval = 2048
AND memtable_flush_period_in_ms = 0
AND min_index_interval = 128
AND read_repair_chance = 0.0
AND speculative_retry = '99PERCENTILE';
我刚开始使用cassandra。
在 Cassandra 中,您只能执行 select distinct partition_key from ...
。
如果你需要这样的东西,你可以使用 Spark + Spark Cassandra Connector - 它会起作用,但不要指望真正的实时答案,因为它需要从所有节点读取必要的数据,并且然后计算答案。
我需要在 cassandra 的 table 中 select 不同计数。
据我了解,cassandra 不支持直接非重复计数,甚至不支持像 rdbms 这样的嵌套查询。
select count(*) from (select distinct key_part_one from Whosebug_composite) as count;
SyntaxException: line 1:21 no viable alternative at input '(' (select count(*) from [(]...)
有哪些获取途径。我是否可以直接从 cassandra 获取或需要使用任何插件 tools/languages?
下面是我的创建 table 语句。
CREATE TABLE nishant_ana.ais_profile_table (
profile_key text,
profile_id text,
last_update_day date,
last_transaction_timestamp timestamp,
last_update_insertion_timestamp timeuuid,
profile_data blob,
PRIMARY KEY ((profile_key, profile_id), last_update_day)
) WITH CLUSTERING ORDER BY (last_update_day DESC)
AND bloom_filter_fp_chance = 0.01
AND caching = {'keys': 'ALL', 'rows_per_partition': 'NONE'}
AND comment = ''
AND compaction = {'class': 'org.apache.cassandra.db.compaction.SizeTieredCompactionStrategy', 'max_threshold': '32', 'min_threshold': '4'}
AND compression = {'chunk_length_in_kb': '64', 'class': 'org.apache.cassandra.io.compress.LZ4Compressor'}
AND crc_check_chance = 1.0
AND dclocal_read_repair_chance = 0.1
AND default_time_to_live = 0
AND gc_grace_seconds = 864000
AND max_index_interval = 2048
AND memtable_flush_period_in_ms = 0
AND min_index_interval = 128
AND read_repair_chance = 0.0
AND speculative_retry = '99PERCENTILE';
我刚开始使用cassandra。
在 Cassandra 中,您只能执行 select distinct partition_key from ...
。
如果你需要这样的东西,你可以使用 Spark + Spark Cassandra Connector - 它会起作用,但不要指望真正的实时答案,因为它需要从所有节点读取必要的数据,并且然后计算答案。