将 BLOB(图像)从 oracle 导入到 hive

Import BLOB (Image) from oracle to hive

我正在尝试使用以下 Sqoop 命令将 BLOB(图像)数据从 oracle 导入到 Hive。

sqoop import --connect jdbc:oracle:thin:@host --username --password  --m 3 --table tablename  --hive-drop-import-delims  --hive-table tablename --target-dir '' --split-by id;

但是没有成功。请记住,BLOB 数据以十六进制形式存储在 oracle 数据库中,我们需要将其以文本或二进制形式存储到 Hive table。

有哪些可行的方法?

Sqoop 不知道如何将 oracle 中的 blob 数据类型映射到 Hive 中。所以你需要指定 --map-column-hive COLUMN_BLOB=binary

sqoop import --connect 'jdbc:oracle:thin:@host' --username $USER --password $Password  --table $TABLE  --hive-import --hive-table $HiveTable  --map-column-hive COL_BLOB=binary --delete-target-dir --target-dir $TargetDir  -m 1 -verbose