用于导出二进制文件的 MLCP 命令选项

MLCP command options to export a binary file

我想将存储在 MarkLogic 中的二进制 (PPTX) 文件导出到我的本地文件系统。是否可以通过 MLCP EXPORT 导出存储在 URI 中的文档?

同一目录中存储了数百万个文档 - 因此 MLCP EXPORT-directory_filter 选项没有用。导出操作开始并出错 "RequestException instantiating ResultItem 141931: Time limit exceeded"。

这是我的选项文件

-host
marklogic-dev-server
-port
9014
-username
pk
-password
pk
-directory_filter
/openxml2/
#-query_filter
#doc("/openxml2/doc-uri.pptx")
-output_type
archive
-output_file_path
/Users/pk/marklogic/
-compress
true````

默认情况下,MLCP 会将文档导出到 native format:

Use the mlcp export command to export documents in their original format as files on the native filesystem or HDFS. For example, you can export an XML document as a text file containing XML, or a binary document as a JPG image.

使用 mlcp 导出命令以原始格式将文档导出为本机文件系统或 HDFS 上的文件。例如,您可以将 XML 文档导出为包含 XML 的文本文件,或将二进制文档导出为 JPG 图像。 有一个number of different ways to limit the documents exported by MCLP。 您应该能够使用 -query_filter, -query_options 或 -document_selector 来 select 文件本身。

或者,您可以将文档添加到新的集合中,然后使用 -collection_filter。这对于少量文档来说是可以的,但对于更大的集合来说是不可取的,因为将集合添加到大量文档中可能会占用大量资源。