Sqoop - 自定义水槽
Sqoop - Custom sink
我希望能够使用 Sqoop 将数据导入自定义 Hadoop 数据存储。这相当于从任意结构化数据库(MySql、Netezza 等)导入我自己的自定义数据存储(在本例中,相当于 Hive)
关于创建此自定义接收器和与 Scoop 集成的任何指示?
我认为不支持使用 sqoop 创建自定义接收器。但是您可以使用 flume 创建自定义接收器,并且 flume 能够从数据源加载。
顺便说一句,什么是自定义 Hadoop 数据存储?。它存储的是什么格式以及与hadoop有何不同。
我建议您为 flume 使用 flume-ng-sql-source 插件,然后将数据导入您的自定义下沉。
以下链接可以帮助您使用 flume-ng-sql-source。
https://github.com/keedio/flume-ng-sql-source
要编写自定义接收器,请遵循 custom sink docs。自定义源在同一文档中。
我希望能够使用 Sqoop 将数据导入自定义 Hadoop 数据存储。这相当于从任意结构化数据库(MySql、Netezza 等)导入我自己的自定义数据存储(在本例中,相当于 Hive)
关于创建此自定义接收器和与 Scoop 集成的任何指示?
我认为不支持使用 sqoop 创建自定义接收器。但是您可以使用 flume 创建自定义接收器,并且 flume 能够从数据源加载。
顺便说一句,什么是自定义 Hadoop 数据存储?。它存储的是什么格式以及与hadoop有何不同。
我建议您为 flume 使用 flume-ng-sql-source 插件,然后将数据导入您的自定义下沉。
以下链接可以帮助您使用 flume-ng-sql-source。
https://github.com/keedio/flume-ng-sql-source
要编写自定义接收器,请遵循 custom sink docs。自定义源在同一文档中。