如何从本地磁盘而不是 HDFS 上的数据在 Hive 上创建外部 Table?

How to create External Table on Hive from data on local disk instead of HDFS?

对于HDFS上的数据,我们可以做到

CREATE EXTERNAL TABLE <table>
{
id INT,
name STRING,
age INT 
} LOCATION 'hdfs_path';

但是如何为上面的LOCATION指定本地路径呢?

谢谢。

我认为您不能在本地文件系统上创建外部 table。最接近的是在 AWS S3 存储桶上创建一个外部 table,其中 LOCATION 's3://yourbucket/'

您可以先使用 "hdfs dfs -put " 将文件上传到 HDFS,然后在此基础上创建外部 Hive table。

Hive 无法在本地文件上创建外部 table 的原因是,当 Hive 处理数据时,实际处理发生在 Hadoop 集群上,您的本地文件可能根本无法访问。