在 pandoc LaTeX 到 Word 的转换过程中,如何去除数字和 table?

How can I strip figures and table during a pandoc LaTeX to Word conversion?

我正在尝试使用 pandoc 将论文从 latex 转换为 docx。通常,这适用于以下命令:

pandoc input.tex -f latex -t docx -s -o output.docx --bibliography references.bib --csl=mystyle.csl

但是,我还有一个无法满足的额外要求。我希望从源文件中包含的任何图形和表格中删除输出。到目前为止,阅读 pandoc 文档和相关的 Whosebug 问题对我没有帮助。

你有什么办法可以解决这个问题吗?

这是 pandoc filters 的海报用例。以下 Lua 过滤器将删除所有表格和图像:

function Image () return {} end
function Table () return {} end

将其保存到文件中,例如remove-tables-images.lua,然后通过--lua-filter参数将文件传递给pandoc:

pandoc input.tex -s -o output.docx \
    --bibliography references.bib --csl=mystyle.csl \
    --lua-filter remove-tables-images.lua