配置 pentaho 的 hdfs-vfs 以获取 hdfs-site.xml

Configuring pentaho's hdfs-vfs to pick up hdfs-site.xml

刚开始使用Pentaho's HDFS VFS,对这个项目了解不多。 我正在尝试从外部位置读取我的 Hadoop 配置文件。这似乎适用于除 hdfs-site.xml. The failure occurs in the VFS layer when trying to communicate with HDFS through the Pentaho HDFS VFS project. My gut tells me that pentaho is reading this file through some environment variable or other external pointer, but I can't seem to find it in their source. Everything works fine when I manually place the hdfs-site.xml file in the compiled war 文件之外的所有文件,但这对我来说不够,因为我需要将此文件放在外部位置,以便其他进程可以更改它。

有没有人处理过这个问题?有人可以告诉我如何告诉 pentaho 从哪里获取这个文件吗?

谢谢

能否提供更多信息?你说的是 pentaho 发布的 VFS api 吗?

所以我找到了一种让 pentaho hdfs 工作的方法,你需要做的就是将 hdfs-site.xml 添加到你的类路径中。 我在启动 jar 文件时这样做了:

java -jar start.jar --lib=/etc/hadoop/conf.cloudera.yarn1

而/etc/hadoop/conf.cloudera.yarn1是hdfs-site.xml所在的目录