在 marklogic 中搜索二进制文件

Searching Binary files in marklogic

除了

,还有什么方法可以搜索PPT、PDF等二进制文件的内容吗?

使用 xdmp:document-filter() 函数将其转换为 X HTML 格式并搜索它?

基本没有。您必须从二进制格式中提取可读文本,以允许 MarkLogic 对其进行索引。您可以使用 xdmp:document-filter()xdmp:pdf-convert()xdmp:word-convert() 等函数提取该文本,但无法直接索引二进制节点。

HTH!