Nifi 中的 PutMarklogic 处理器
PutMarklogic processor in Nifi
我打算使用 Nifi marklogic 处理器从我的 s3 存储桶中提取文档。
- 下面的putMarklogic是否使用了MLCP?
- 是否可以采用所有 MLCP 选项,例如:
aggregate_record_namespace
或 transform_module
或 transform_namespace
或 transform_param
- 如果不是,我有什么选择,是编写自定义处理器,在底层使用 MCLP,因为我喜欢 MLCP 提供的灵活性:)
如您所见,我正计划调用我的 DHF 输入流。所以在查看代码后,我认为我可以设置 transform:ml:inputFlow
和其他转换参数以 trans:
为前缀.. 这是正确的吗?
我如何使用 mlcp aggregates
和 aggregate_record_element
以及 aggregate_record_namespace
.. 当我加载 .xml.gz
文件时包含多个 xml 文件..或者我唯一的选择是将它们分解为单独的文件
我通过编写调用 ContentPump.runCommand
的自定义处理器解决了这个问题。仅供参考,如果有人感兴趣,我必须排除 log4j
并添加 log4j-over-slf4j
以便 mclp 可以将进度记录写入 nifi-app.log
。
我打算使用 Nifi marklogic 处理器从我的 s3 存储桶中提取文档。
- 下面的putMarklogic是否使用了MLCP?
- 是否可以采用所有 MLCP 选项,例如:
aggregate_record_namespace
或transform_module
或transform_namespace
或transform_param
- 如果不是,我有什么选择,是编写自定义处理器,在底层使用 MCLP,因为我喜欢 MLCP 提供的灵活性:)
如您所见,我正计划调用我的 DHF 输入流。所以在查看代码后,我认为我可以设置 transform:ml:inputFlow
和其他转换参数以 trans:
为前缀.. 这是正确的吗?
我如何使用 mlcp aggregates
和 aggregate_record_element
以及 aggregate_record_namespace
.. 当我加载 .xml.gz
文件时包含多个 xml 文件..或者我唯一的选择是将它们分解为单独的文件
我通过编写调用 ContentPump.runCommand
的自定义处理器解决了这个问题。仅供参考,如果有人感兴趣,我必须排除 log4j
并添加 log4j-over-slf4j
以便 mclp 可以将进度记录写入 nifi-app.log
。