如何将数据从 Microsoft SQL 服务器导入到 HBase

How to do Import data from Microsoft SQL server into HBase

我已经使用 Cloudera Manager 和 CDH 5.4 在集群系统上成功安装了 Apache Hadoop(1 Master,2 Slaves,高配置 Ubuntu)

我想将数据从 Microsoft SQL 服务器导入到 HBase(基于列的 hadoop 数据库),截至目前我已经从 SQL 服务器生成 CSV 文件并使用 HBase 浏览器将 CSV 导入到 HBase (Cloudera Manager 中的 Hue 应用程序)。

如果有任何方法可以直接将 SQL 服务器数据导入 HBase,那对我会有帮助,我听说 Sqoop 应用程序已经完成了将数据从 RDBMS 导入 Hadoop 系统(即使我没有尝试过这个,我假设这会将 CSV 文件导入 Hadoop 系统而不是 HBase)

如果有任何可能的方法来解决上述情况,请告诉我。

Sqoop 支持通过在 sqoop 命令中使用 --hbase-table 选项将数据直接导入到 HBASE。

https://sqoop.apache.org/docs/1.4.2/SqoopUserGuide.html#_importing_data_into_hbase