使用 Watson 文档转换保留 HTML

Preserving HTML with Watson Document Conversion

我们构建了 Microsoft Word 文档,以便它们使用 Watson Document Conversation Service 生成高质量的 Watson RaR JSON 答案单元。但是,Word 文档中任何有效的 links 都会被 Doc Con 服务从生成的 JSON 答案单元中删除,这些答案单元只是平面文本。

有没有办法配置 Doc Con 服务来保留这些 link,以便 link HTML 出现在生成的 JSON 答案单元中?如果没有,您建议我们如何继续将工作 links 的 Word 文档放入我们的 RaR 语料库中。

目前 Doc Con(特别是 Microsoft Doc 和 Docx 转换)删除了 外部 链接。 内部 链接被保留。

很遗憾,没有配置设置来保留外部链接。