如何从本地磁盘而不是 HDFS 上的数据在 Hive 上创建外部 Table?
How to create External Table on Hive from data on local disk instead of HDFS?
对于HDFS上的数据,我们可以做到
CREATE EXTERNAL TABLE <table>
{
id INT,
name STRING,
age INT
} LOCATION 'hdfs_path';
但是如何为上面的LOCATION指定本地路径呢?
谢谢。
我认为您不能在本地文件系统上创建外部 table。最接近的是在 AWS S3 存储桶上创建一个外部 table,其中 LOCATION 's3://yourbucket/'
您可以先使用 "hdfs dfs -put " 将文件上传到 HDFS,然后在此基础上创建外部 Hive table。
Hive 无法在本地文件上创建外部 table 的原因是,当 Hive 处理数据时,实际处理发生在 Hadoop 集群上,您的本地文件可能根本无法访问。
对于HDFS上的数据,我们可以做到
CREATE EXTERNAL TABLE <table>
{
id INT,
name STRING,
age INT
} LOCATION 'hdfs_path';
但是如何为上面的LOCATION指定本地路径呢?
谢谢。
我认为您不能在本地文件系统上创建外部 table。最接近的是在 AWS S3 存储桶上创建一个外部 table,其中 LOCATION 's3://yourbucket/'
您可以先使用 "hdfs dfs -put " 将文件上传到 HDFS,然后在此基础上创建外部 Hive table。
Hive 无法在本地文件上创建外部 table 的原因是,当 Hive 处理数据时,实际处理发生在 Hadoop 集群上,您的本地文件可能根本无法访问。