Apache Beam 中 HDFS 集群的附加配置
Additional configuration for HDFS cluster in Apache Beam
有谁知道是否有办法在 Apache Beam 中为 HDFS 指定额外的 xml 配置文件?
正如我所见,它有两个选项:
- hdfsConfiguration 属性 在启动命令中。
- core-site.xml 和 hdfs-site.xml 文件
HadoopFileSystemOptions#ConfigurationLocator 如果未指定第一个选项
也许还有其他我遗漏的东西可以允许指定一些其他文件?
我用这种方法解决了问题:
PipelineOptions po = ???
List<Configuration> configs = ???
HadoopFileSystemOptions options = po.as(HadoopFileSystemOptions.class);
options.setHdfsConfiguration(configs);
org.apache.beam.sdk.io.FileSystems.setDefaultPipelineOptions(options);
有谁知道是否有办法在 Apache Beam 中为 HDFS 指定额外的 xml 配置文件? 正如我所见,它有两个选项:
- hdfsConfiguration 属性 在启动命令中。
- core-site.xml 和 hdfs-site.xml 文件 HadoopFileSystemOptions#ConfigurationLocator 如果未指定第一个选项
也许还有其他我遗漏的东西可以允许指定一些其他文件?
我用这种方法解决了问题:
PipelineOptions po = ???
List<Configuration> configs = ???
HadoopFileSystemOptions options = po.as(HadoopFileSystemOptions.class);
options.setHdfsConfiguration(configs);
org.apache.beam.sdk.io.FileSystems.setDefaultPipelineOptions(options);