如何访问作者姓名和其他 docx 元数据

How to acces the author name and other docx metadata

我想使用 C# 获取文件的元数据,例如 docx。 在下面的屏幕截图中,您可以看到文件的作者和其他元数据。

如何将此元数据写入控制台?

DOCX 中的 word 文件被打包为 zip 文件。元数据位于该 zip 文件中的 XML 文件中。 作为一种非常简单的思考方式,这就是您需要通过 C# 以编程方式执行的操作:

  1. 将 DOCX 文件解压缩到它的文件夹结构中。
  2. 打开位于该结构的 docProps 文件夹中的 core.xml 文件。
  3. 把你要找的XML相关元素拉出来存起来,比如 标题、主题或其他任何内容。
  4. 用 Console.WriteLine() 写那些元素。

Image Showing Structure and XML file

Info on Office Open XML format