Sqoop - 自定义水槽

Sqoop - Custom sink

我希望能够使用 Sqoop 将数据导入自定义 Hadoop 数据存储。这相当于从任意结构化数据库(MySql、Netezza 等)导入我自己的自定义数据存储(在本例中,相当于 Hive)

关于创建此自定义接收器和与 Scoop 集成的任何指示?

我认为不支持使用 sqoop 创建自定义接收器。但是您可以使用 flume 创建自定义接收器,并且 flume 能够从数据源加载。

顺便说一句,什么是自定义 Hadoop 数据存储?。它存储的是什么格式以及与hadoop有何不同。

我建议您为 flume 使用 flume-ng-sql-source 插件,然后将数据导入您的自定义下沉。

以下链接可以帮助您使用 flume-ng-sql-source。

https://www.toadworld.com/platforms/oracle/w/wiki/11114.streaming-mysql-database-table-data-to-hdfs-with-flume

https://github.com/keedio/flume-ng-sql-source

要编写自定义接收器,请遵循 custom sink docs。自定义源在同一文档中。