对配置单元中的某些列获取 "No stats" 意味着什么?

What is the implication of getting "No stats" for certain columns in hive?

我在我的日志文件中得到以下内容,但不知道这意味着什么:

查询:

create table mydb.new as

select a.col1,b.col4,a.col3 from 

sampledb.table1 a
left join sampledb.table2 b
on a.col3=b.col3
;


No Stats for sampledb@table1, Columns: col_1
No Stats for sampledb@table2, Columns: col_4

有人可以帮忙解决这个问题或指导我去哪里找吗?

没有答案的相关问题:Hive No Stats for 'database'@'table', Columns

没有统计信息可以导致次优计划(对于连接列)或 table 扫描而不是仅对简单查询使用统计信息:

CBO 在创建查询计划时使用统计信息。缺少统计信息或过时的统计信息可能导致次优查询计划。如果没有统计数据,CBO 会根据文件 size/avg 行大小进行一些估计(参见 hive.stats.avg.row.size 配置和其他 statistics related settings)。

此外,如果 hive.compute.query.using.stats=true 和统计信息存在,那么优化器将使用统计信息进行简单查询(例如 select count(col1) ...)计算而不是查询 table 数据(如果统计数据陈旧,这可能会导致错误的查询结果),请参阅 .

另请阅读此设计文档以了解有关统计信息的更多详细信息:https://cwiki.apache.org/confluence/display/Hive/StatsDev#StatsDev-StatisticsinHive