MLCP 加载压缩的 xml 文件并跳过带有特定 xml 标签的 xml 文件
MLCP load compressed xml files and skip xml files with a specific xml tag
我正在尝试加载 xml gzip 文件,我正在将输入 xml 分解为多个 xml 记录。但是 mlcp 中有没有办法在忽略记录的同时如果存在特定的 xml 标记或 xml 值,则加载。如果不是,我的其他选择是什么?
以下是我现在用来加载 gzip xml 文件并拆分为单个记录的选项
import
-host
xxxxx
-port
xxxx
-username
xxxx
-password
xxxx
-batch_size
1
-input_compressed
true
-input_compression_codec
gzip
-input_file_type
aggregates
-output_collections
wos
-output_permissions
rest-reader,read,rest-writer,update
-output_uri_prefix
/wos/
-output_uri_suffix
.xml
-aggregate_record_element
REC
-aggregate_record_namespace
http://xxxx.yyyy.com
-uri_id
UID
我只能想到使用 MLCP 转换 (-transform_module
e.a.),在其中有条件地传递 $content map:map。 Return 如果您想抑制特定的聚合片段,则为空序列。
HTH!
我正在尝试加载 xml gzip 文件,我正在将输入 xml 分解为多个 xml 记录。但是 mlcp 中有没有办法在忽略记录的同时如果存在特定的 xml 标记或 xml 值,则加载。如果不是,我的其他选择是什么?
以下是我现在用来加载 gzip xml 文件并拆分为单个记录的选项
import
-host
xxxxx
-port
xxxx
-username
xxxx
-password
xxxx
-batch_size
1
-input_compressed
true
-input_compression_codec
gzip
-input_file_type
aggregates
-output_collections
wos
-output_permissions
rest-reader,read,rest-writer,update
-output_uri_prefix
/wos/
-output_uri_suffix
.xml
-aggregate_record_element
REC
-aggregate_record_namespace
http://xxxx.yyyy.com
-uri_id
UID
我只能想到使用 MLCP 转换 (-transform_module
e.a.),在其中有条件地传递 $content map:map。 Return 如果您想抑制特定的聚合片段,则为空序列。
HTH!