不一致的 Hive 左连接结果

Inconsistent Hive Left Join Results

我写了一个简单的left out join hiveql select * from a left outer join b on (a.f1=b.f1 and a.f2=b.f2) 以上查询结果总数为798,608。 但是,tablea中的记录总数为780,499,不匹配。

我试图找到所有只存在于left join结果中但不存在于table a中的记录;结果返回空白。

我什至尝试用一些记录创建 2 个小 tables(a' 和 b'),左连接结果的计数与 table a' 记录的计数相匹配,不出所料。

什么会导致结果不一致?

感谢大卫·李。 table b中有1对多的情况。 问题已解决。