如何跳过 html 上具有特定标签的元素进行降价转换?

How can I skip elements which have specific tag on html to markdown conversion?

我不想将 HTML 中的某些特定元素转换为 markdown conversion.Let 说我不想转换 svg 标签:

输入(html格式):

<p><strong>one-to-many</strong> – where the ‘many’ side can be <strong>zero or more</strong> (an optional relationship) or <strong>one or more</strong> (a mandatory relationship).</p>
<svg xmlns="http://www.w3.org/2000/svg" height="248" width="693" viewBox="-197 0 866.2499999999993 309.9999999999998">
        ...
</svg>

预期结果(降价格式):

**one-to-many** – where the ‘many’ side can be zero or more (an optional relationship) or one or more (a mandatory relationship).
<svg xmlns="http://www.w3.org/2000/svg" height="248" width="693" viewBox="-197 0 866.2499999999993 309.9999999999998">
...
</svg>

我可以使用 HTML 解析器提取所有特定元素,然后将文档转换为 markdown,并在转换后将这些元素以所需的方式放入 markdown 文档,但我想知道有什么方法可以做到这一点pandoc 命令?

你可以告诉 pandoc 的 HTML reader 到 include the HTML:

pandoc -f html+raw_html -t markdown

如果你想进一步自定义 pandoc 的行为,你可以写一个 pandoc filter.