使用 Pig/hive 不匹配在配置单元中加载的文件

File loaded in hive using Pig/hive mismatch

如果将一个文件加载到配置单元 tables 中,一个是使用 Pig,另一个是使用配置单元。您如何确保 table 中的数据相同?你如何从两个 table 中得到不匹配的记录?

它们应该相同,如果您想确定,运行 这些配置单元查询:

SELECT * from table_pig
WHERE NOT EXISTS (select * from table_hive)

SELECT * from table_hive
WHERE NOT EXISTS (select * from table_pig)

如果两次查询都没有return任何记录,那么两个表都是一样的。