Pentaho PDI - 从 MongoDB 读取数据

Pentaho PDI - Reading data from MongoDB

我已经在我的机器上安装了 Pentaho 数据集成版本 (ce-5.0.1.A-stable),我正在尝试使用 PDI 从 MongoDB 中检索信息。我用 Mongo 输入步骤创建了一个转换。现在,当我尝试配置我的 MongoDB 连接详细信息时,我找不到 MongoDB 的任何显式连接类型。有人可以建议如何在 Pentaho 中配置 MongoDB 数据源。

我已经参考了大部分 Pentaho-MongoDb 文档,但是 none 的解决方案是可行的。

此外,我已尝试执行 Pentaho 官方网站中提到的以下步骤,但我仍然找不到 MongoDB

的任何连接类型

1- 将以下文件夹移出数据集成文件夹结构: data-integration/plugins/pentaho-big-data-plugin

2- 将以下文件移出数据集成文件夹结构(如果存在): data-integration/libext/JDBC/pentaho-hadoop-hive-jdbc-shim-1.3.0.jar data-integration/libext/JDBC/pentaho-hadoop-hive-jdbc-shim-1.3.1.jar data-integration/libext/JDBC/pentaho-hadoop-hive-jdbc-shim-1.3.2.jar

3- 从 data-integration/plugins 文件夹中解压文件 pentaho-big-data-plugin-shimtastic-1.3.3.1.zip。

4- 或者,删除 data-integration/plugins/pentaho-big-data-plugin/hadoop-configurations 下不相关的文件夹。

5-将文件pentaho-hadoop-hive-jdbc-shim-1.3.3.jar复制到文件夹中 data-integration/libext/JDBC

6-解压文件pentaho-instaview-templates-shimtastic-1.3.3.zip到以下目录即可 data-integration/plugins/spoon/agile-bi/platform/pentaho-solutions/system/instaview/templates/Big Data

非常感谢任何帮助..!

Pentaho 没有 MongodB 的特定数据库连接。所以您不会在数据库连接查看器中找到它。连接Mongodb的方法是在PDI中使用Mongodb Input步骤。在那里您会找到连接详细信息部分 (配置凭据)。然后您可以连接 JSON Input 步骤来读取 mongodb 输出的结果。检查下面的屏幕截图:

您也可以从 here 中的 Pentaho Wiki 中阅读它。虽然文档看起来有点旧,但确实是这样做的过程。

请注意,您不需要大数据垫片即可连接到 mongodb。您似乎已经配置了 hadoop-hive 垫片。这里不需要。

希望对您有所帮助:)