使用 python-docx 识别 word 文档 .docx 文件中的封面

Question

我想知道是否有可能识别 .docx 文件的 xml 中可用于区分 word 文档封面的任何元素。

到目前为止，我发现表示封面的唯一可识别元素是分页符。

<w:br type="page">

然而，这是在整个文档中都可以找到的同一个分页符。

这道题的目的是希望如果word文档中有封面，则从第二页开始编号，否则从第一页开始编号。

Answer 1

这些是一些想法，但简而言之，您需要根据内容检测此类内容。 Word中没有区别于其他页面的“cover-page”的概念。

Identifying a cover page in word document .docx file using python-docx