配置单元聚合查询从缓存中获取错误值
hive aggregate query takes wrong value from cache
我正在 运行 蜂巢会话聚合查询。
hive>select count(1) from table_name;
第一次运行mapreduce程序和returns结果。但是对于当天晚些时候的连续运行,它 returns 来自缓存的相同计数(尽管 table 每小时更新一次)。这是错误的计数。
尝试过:-
set hive.metastore.aggregate.stats.cache.enabled=false
hive.cache.expr.evaluation=false
set hive.fetch.task.conversion=none
但运气不好。使用 Hive 1.2.1.2.3.4.29-5
配置单元版本。谢谢
禁止使用统计数据进行查询计算:
set hive.compute.query.using.stats=false;
另请参阅此答案了解更多详情:
我正在 运行 蜂巢会话聚合查询。
hive>select count(1) from table_name;
第一次运行mapreduce程序和returns结果。但是对于当天晚些时候的连续运行,它 returns 来自缓存的相同计数(尽管 table 每小时更新一次)。这是错误的计数。
尝试过:-
set hive.metastore.aggregate.stats.cache.enabled=false
hive.cache.expr.evaluation=false
set hive.fetch.task.conversion=none
但运气不好。使用 Hive 1.2.1.2.3.4.29-5
配置单元版本。谢谢
禁止使用统计数据进行查询计算:
set hive.compute.query.using.stats=false;
另请参阅此答案了解更多详情: