如何跳过并继续 Vertica 中的文件加载失败?
How to skip and continue file load failures in Vertica?
我正在尝试使用带有 glob 表达式的复制语句通过 NFS 一次将数千个压缩文件加载到 Vertica 中,但该操作因以下错误而中止:
ERROR 6253: Error occured during LZO header processing: expecting more than 8 bytes, possibly file corrupted
告诉 vertica 继续加载所有好的文件并只报告加载结束时失败的文件的正确方法是什么?
如果您是 运行 Vertica 7.2.x,他们添加了一个名为 ERROR TOLERANCE
的新参数。在此版本之前,它不存在。
您可以看到复制选项here。
Treats each source during execution independently when loading data.
The statement is not rolled back if a single source is invalid. The
invalid source is skipped and the load continues.
This parameter is disabled for ORC files, Parquet files, and when
using a fenced User Defined Load (UDL).
唯一的其他选择是预先检查脚本中的有效性或单独加载它们(显然这是一个性能问题,所以我会选择预先检查)。
我正在尝试使用带有 glob 表达式的复制语句通过 NFS 一次将数千个压缩文件加载到 Vertica 中,但该操作因以下错误而中止:
ERROR 6253: Error occured during LZO header processing: expecting more than 8 bytes, possibly file corrupted
告诉 vertica 继续加载所有好的文件并只报告加载结束时失败的文件的正确方法是什么?
如果您是 运行 Vertica 7.2.x,他们添加了一个名为 ERROR TOLERANCE
的新参数。在此版本之前,它不存在。
您可以看到复制选项here。
Treats each source during execution independently when loading data. The statement is not rolled back if a single source is invalid. The invalid source is skipped and the load continues.
This parameter is disabled for ORC files, Parquet files, and when using a fenced User Defined Load (UDL).
唯一的其他选择是预先检查脚本中的有效性或单独加载它们(显然这是一个性能问题,所以我会选择预先检查)。