管道 PDF 转换原始文档 URI

Pipeline PDF conversion original document URI

CPF 帮我把 PDF 转换成 XHTML。这很好用,当它在 XHTML 中时,我有另一个管道来丰富数据。这也很好用。

我注意到我没有从 PDF 转换管道获得原始文档 URI,只有 XHTML 文件的 URI。

我能做的是使用替换结构转换 XHTML URI,但我宁愿在所有管道中保留原始 URI:

/converted/Berry, Steve - Het Venetiaans bedrog_pdf.xhtml

into

/pdf/Berry, Steve - Het Venetiaans bedrog.pdf

我查看了 /MarkLogic/conversion/actions/convert-pdf-action.xqy,但我不清楚应该在何处添加一些代码。

欢迎任何建议!

既然你已经在使用CPF,那么你已经有属性个碎片了。我建议您将可能需要的任何此类信息保留为 属性。同样,您也可以在第一步添加一个集合,然后将其复制到上一步中每个新创建的文档中。

这些方法中的任何一种都可以以原始 URI 作为一种排序规则 ID 结束