从 docx 转换为 markdown 如何摆脱链接中的 span 下划线?
Converting from docx to markdown how to get rid of span underline in links?
自从最近的 pandoc 更新(现在我是 2.2.1)以来,docx 文档中的 links 被转换为 [<span class="underline">graphic novel hero</span>](https://www.amazon.com/exec/obidos/ASIN/1596432594/braipick-20)
,向 link 标签添加了不需要的跨度.是否有任何黑魔法(除了向管道添加 sed
调用)来摆脱它们并返回到纯 commonmark?
我使用的pandoc选项是:pandoc -f docx --atx-headers --wrap=none --extract-media=. -t commonmark-smart myFile.docx
感谢您的澄清!
如果您使用 -t commonmark
,docx-reader 生成的跨度将转换为原始 HTML,因此您可以使用:
pandoc -t commonmarkd-raw_html
或者,使用 markdown-writer,它在扩展方面更灵活(但截至 2018 年尚未 100%-commonmark 兼容):
pandoc -t markdown-bracketed_spans-raw_html-native_spans
有关详细信息,请参阅 MANUAL。
自从最近的 pandoc 更新(现在我是 2.2.1)以来,docx 文档中的 links 被转换为 [<span class="underline">graphic novel hero</span>](https://www.amazon.com/exec/obidos/ASIN/1596432594/braipick-20)
,向 link 标签添加了不需要的跨度.是否有任何黑魔法(除了向管道添加 sed
调用)来摆脱它们并返回到纯 commonmark?
我使用的pandoc选项是:pandoc -f docx --atx-headers --wrap=none --extract-media=. -t commonmark-smart myFile.docx
感谢您的澄清!
如果您使用 -t commonmark
,docx-reader 生成的跨度将转换为原始 HTML,因此您可以使用:
pandoc -t commonmarkd-raw_html
或者,使用 markdown-writer,它在扩展方面更灵活(但截至 2018 年尚未 100%-commonmark 兼容):
pandoc -t markdown-bracketed_spans-raw_html-native_spans
有关详细信息,请参阅 MANUAL。