Pandoc:将 docx 转换为 markdown 时有条件中断

Pandoc: Conditional breaks when converting docx to markdown

我有一个包含条件中断 (Ctrl + -) 的 docx 文档。我将它们转换为 markdown,然后(使用 jekyll)转换为 HTML。不幸的是,条件中断丢失了。解决方法是编辑生成的 markdown 文档并插入 ­,但这不是解决方案,因为我需要从 docx regulary 生成 markdown。

如何告诉 pandoc 保留条件中断?

编辑:不仅在转换为 markdown 时出现,直接转换为 HTML 时条件中断也会丢失。

不幸的是,Word 不使用 unicode 字符 'SOFT HYPHEN' (U+00AD),而是在其内部以 docx 格式创建自己的 XML 元素 <w:softHyphen/>

已提交 pandoc issue 以调整 docx reader。