在Hive中执行LOAD DATA时,是否复制了数据?
When executing LOAD DATA in Hive, does it copies the data?
当将存储在 HDFS 中的数据加载到 HIVE 中时,来自 HDFS 的数据是否被复制为 HIVE 使用的不同格式?还是使用原始文件 store/select/insert/modify 数据?
上下文:
在路径中加载数据 '/home/user/sample.txt' 覆盖到 TABLE 员工;
HIVE 是否总是使用 /home/user/sample.txt 来 store/select/insert/modify 数据,或者它是否会创建一个新文件在 HDFS/HBASE 处占用新的 space?
LOAD DATA INPATH
除了将 HDFS 文件移动到 table 的位置外什么都不做,"moving" 我的意思是 HDFS 的元数据操作。
在documentation中有说明:
If the keyword LOCAL is not specified, then Hive will either use the full URI of filepath, if one is specified, or will apply the following rules:
[...]
Hive will move the files addressed by filepath into the table (or partition)
当将存储在 HDFS 中的数据加载到 HIVE 中时,来自 HDFS 的数据是否被复制为 HIVE 使用的不同格式?还是使用原始文件 store/select/insert/modify 数据?
上下文: 在路径中加载数据 '/home/user/sample.txt' 覆盖到 TABLE 员工;
HIVE 是否总是使用 /home/user/sample.txt 来 store/select/insert/modify 数据,或者它是否会创建一个新文件在 HDFS/HBASE 处占用新的 space?
LOAD DATA INPATH
除了将 HDFS 文件移动到 table 的位置外什么都不做,"moving" 我的意思是 HDFS 的元数据操作。
在documentation中有说明:
If the keyword LOCAL is not specified, then Hive will either use the full URI of filepath, if one is specified, or will apply the following rules: [...] Hive will move the files addressed by filepath into the table (or partition)