Hive 和 Pig 在同一数据集之上

Hive and Pig on top of same dataset

比方说:我有一个与配置单元结构关联的 table。我可以在这个 table 数据上创建一个 pig 模式吗? Hive 查询和 pig 模式都可行吗?

是的。您将需要 HCatalog。在 Pig Shell 运行 中,使用以下命令导入必要的 jars。

pig -useHCatalog

然后将 table 加载到这样的关系中

A = LOAD 'tablename' USING org.apache.hive.hcatalog.pig.HCatLoader();