Sqoop导出导入数据错误处理方法
How to handle data errors during Sqoop export and import
如果源数据库中存在任何数据问题,例如
- 当数字字段包含字符或
- 日期字段未正确填充时,
有什么方法可以处理这些异常并继续处理 sqoop 中的剩余记录而不会使作业失败吗?
我看到几年前有人问过类似的问题,但没有人回答。
Handling bad records during sqoop import or export
想知道最新版本的Sqoop有没有这个选项
提前致谢。
目前暂时没有解决这个问题。为了寻找解决方案,去年开了一个jira。但是目前,您不能通过跳过它来处理不良记录。
https://issues.apache.org/jira/browse/SQOOP-1856
但是,可以通过自由格式查询在 sqoop 导入期间修改数据来处理错误记录。检查以下 sqoop 参数:
--query and --split-by
这是 sqoop cookbook 中关于自由格式查询的一个很好的教程:
https://www.safaribooksonline.com/library/view/apache-sqoop-cookbook/9781449364618/ch04.html
如果源数据库中存在任何数据问题,例如
- 当数字字段包含字符或
- 日期字段未正确填充时,
有什么方法可以处理这些异常并继续处理 sqoop 中的剩余记录而不会使作业失败吗?
我看到几年前有人问过类似的问题,但没有人回答。
Handling bad records during sqoop import or export
想知道最新版本的Sqoop有没有这个选项
提前致谢。
目前暂时没有解决这个问题。为了寻找解决方案,去年开了一个jira。但是目前,您不能通过跳过它来处理不良记录。
https://issues.apache.org/jira/browse/SQOOP-1856
但是,可以通过自由格式查询在 sqoop 导入期间修改数据来处理错误记录。检查以下 sqoop 参数:
--query and --split-by
这是 sqoop cookbook 中关于自由格式查询的一个很好的教程:
https://www.safaribooksonline.com/library/view/apache-sqoop-cookbook/9781449364618/ch04.html