有没有办法以编程方式从带有文本突出显示的 docx 创建 "plain text"

Is there way to create "plain text" from docx with text highlight programmatically

我试过用 pandoc 创建包含文本高亮的第一个和乳胶文档。突出显示的文本包含我需要解析的所有必要信息。

有没有办法用 pandoc 来做,还是我应该开始寻找其他东西?

此外,解决方案应该是支持 cli 工具。

不,pandoc 的文档模型不包括笔标记类型的突出显示,仅包括语义 emphasis。您需要 post 处理生成的文件。