使用 Pig/hive 不匹配在配置单元中加载的文件
File loaded in hive using Pig/hive mismatch
如果将一个文件加载到配置单元 tables 中,一个是使用 Pig,另一个是使用配置单元。您如何确保 table 中的数据相同?你如何从两个 table 中得到不匹配的记录?
它们应该相同,如果您想确定,运行 这些配置单元查询:
SELECT * from table_pig
WHERE NOT EXISTS (select * from table_hive)
和
SELECT * from table_hive
WHERE NOT EXISTS (select * from table_pig)
如果两次查询都没有return任何记录,那么两个表都是一样的。
如果将一个文件加载到配置单元 tables 中,一个是使用 Pig,另一个是使用配置单元。您如何确保 table 中的数据相同?你如何从两个 table 中得到不匹配的记录?
它们应该相同,如果您想确定,运行 这些配置单元查询:
SELECT * from table_pig
WHERE NOT EXISTS (select * from table_hive)
和
SELECT * from table_hive
WHERE NOT EXISTS (select * from table_pig)
如果两次查询都没有return任何记录,那么两个表都是一样的。