Hive 中的外部表

external tables in Hive

  1. 我使用 R 脚本在 HDFS 中添加了一个 CSV 文件。

  2. 我用新的 CSV/append 数据更新了这个 CSV

  3. 在此 CSV 上使用 Hive 中的色调创建table。

  4. 将其更改为外部 table。

现在,如果在 hdfs 位置更改数据时,hive 中的数据会自动更新吗table?

这就是 Hive 中外部(和托管)table 的问题。他们不是真正的 table。您可以将它们视为 link 到 HDFS 位置。因此,每当您查询外部 table 时,Hive 都会从您创建此 table 时选择的位置读取所有数据。

来自 Hive 文档:

An EXTERNAL table points to any HDFS location for its storage, rather than being stored in a folder specified by the configuration property hive.metastore.warehouse.dir.