Hive 中的外部表
external tables in Hive
我使用 R 脚本在 HDFS 中添加了一个 CSV 文件。
我用新的 CSV/append 数据更新了这个 CSV
在此 CSV 上使用 Hive 中的色调创建table。
将其更改为外部 table。
现在,如果在 hdfs 位置更改数据时,hive 中的数据会自动更新吗table?
这就是 Hive 中外部(和托管)table 的问题。他们不是真正的 table。您可以将它们视为 link 到 HDFS 位置。因此,每当您查询外部 table 时,Hive 都会从您创建此 table 时选择的位置读取所有数据。
来自 Hive 文档:
An EXTERNAL table points to any HDFS location for its storage, rather
than being stored in a folder specified by the configuration property
hive.metastore.warehouse.dir.
我使用 R 脚本在 HDFS 中添加了一个 CSV 文件。
我用新的 CSV/append 数据更新了这个 CSV
在此 CSV 上使用 Hive 中的色调创建table。
将其更改为外部 table。
现在,如果在 hdfs 位置更改数据时,hive 中的数据会自动更新吗table?
这就是 Hive 中外部(和托管)table 的问题。他们不是真正的 table。您可以将它们视为 link 到 HDFS 位置。因此,每当您查询外部 table 时,Hive 都会从您创建此 table 时选择的位置读取所有数据。
来自 Hive 文档:
An EXTERNAL table points to any HDFS location for its storage, rather than being stored in a folder specified by the configuration property hive.metastore.warehouse.dir.