Microsoft Word (OOXML/DOCX) 文档格式验证

Microsoft Word (OOXML/DOCX) documents formatting validation

有人熟悉 OOXML 模式吗? 我需要构建一个模式来根据特定规则验证特定文档的样式,但我找不到特定的参考甚至示例开始。

OOXML 的参考是标准 ECMA-376 Office 打开 XML 文件格式。请注意,规范很复杂;在取得任何进展之前,预计必须对 OOXML 规范和 XML 技术和技巧做很多 reading/learning。

另请参阅:

Word 文档通常只是段落和 table 的扁平序列(table 单元格包含段落),但您可以 use/nest 内容控件对段落进行分组,并且有其他更奇特的对象,例如 altChunks。

您可能感兴趣的其他内容:

  • sectPr(控制 headers/footers、页面 size/orientation 等),因为这表示一个新的 part/chapter

  • 大纲级别?

段落样式只是对段落的设置。考虑到这种结构,schematron 可能不像 docbook 或 TEI 那样有用。

但是通过 XSLT 将主要文档部分 (word/document.xml) 转换为更简单的部分可能是一个不错的方法。

这完全取决于您的约束条件。