Pandoc lua 过滤器以在文档末尾移动图像标题

Pandoc lua filter to move image caption at the end of the document

我是 Lua pandoc 过滤器的新手,所以这个问题超出了我的水平。

从降价文档开始,我想收集手稿中的所有图形,删除乳胶调用以显示它们,捕获它们的标题并将它们显示在最后一个名为 Figures 的块中。

例如,图形在中间 .tex 中呈现为:

\begin{figure}
  \includegraphics[width=1\linewidth]{figure1} \caption{Figure 1. Caption.}\label{fig:figure1}
\end{figure}

我想删除上述块,获取标题并将其移动到具有以下结构的(现有)图形部分:

\section*{Figures}
  \begin{figure}[h!]
    \caption{Figure 1. Caption.}
  \end{figure}

  \begin{figure}[h!]
    \caption{Figure 2. Caption.}
  \end{figure}

我想强调的是,最终文件中不应再显示这些数字。这个结构是我发送 .tex 的期刊所要求的,它要求图片单独加载,并在手稿中保留对它们的引用。

我尝试了一些 Lua 编码,但没有成功。但后来我发现 lua 根本看不到我的图像。

我将其放入 .md 文件中:

\begin{figure}
  \includegraphics[width=1\linewidth]{figure1} \caption{Figure 1. Caption.}\label{fig:figure1}
\end{figure}

然后尝试检查 Lua 是如何看待它的:

function Para (el) print(pandoc.utils.stringify(el)) end

但没有打印图像参考(打印了其他元素,作为测试)。我尝试用 Para 代替 Str、Inline、Image、Pandoc,但什么都没有。

所以我连AST里的图都看不出来...

而不是实际移动数字,你可以告诉 latex 在最后显示标题:

\usepackage{figcaps}

将原始 LaTeX 放入 R Markdown 输入的问题在于它不会被 pandoc 处理,而是逐字传递。这可能非常有用,但在这种情况下,它限制了 Lua 过滤器的用途。但是,\begin{figure}...\end{figure} 代码成为 pandoc 中的“原始块”,仍然可以通过 RawBlock 从 Lua 过滤器访问。您或许可以使用类似于以下的代码来收集字幕:

local captions = pandoc.List()

function RawBlock (raw)
  local caption = raw.text:match('\caption%{(.*)%}')
  if caption then
    captions:insert(caption)
  end
end

function Pandoc (doc)
  -- append collected captions at the end
  doc.blocks:insert(captions:map(function(x) return pandoc.Para(x) end))
  return doc
end

或者将所有数字放入元数据字段:

function Pandoc (doc)
  doc.meta.figures = captions:map(function (c)
      return pandoc.RawBlock('latex', c)
  end)
  return doc
end