在 marklogic 中搜索二进制文件
Searching Binary files in marklogic
除了
,还有什么方法可以搜索PPT、PDF等二进制文件的内容吗?
使用 xdmp:document-filter() 函数将其转换为 X HTML 格式并搜索它?
基本没有。您必须从二进制格式中提取可读文本,以允许 MarkLogic 对其进行索引。您可以使用 xdmp:document-filter()
或 xdmp:pdf-convert()
和 xdmp:word-convert()
等函数提取该文本,但无法直接索引二进制节点。
HTH!
除了
,还有什么方法可以搜索PPT、PDF等二进制文件的内容吗?使用 xdmp:document-filter() 函数将其转换为 X HTML 格式并搜索它?
基本没有。您必须从二进制格式中提取可读文本,以允许 MarkLogic 对其进行索引。您可以使用 xdmp:document-filter()
或 xdmp:pdf-convert()
和 xdmp:word-convert()
等函数提取该文本,但无法直接索引二进制节点。
HTH!