如何了解段落颜色 docx python?

How to get to know paragraph color docx python?

我有文档,其中一些行被突出显示。我设法打开它并逐行获取文本:

doc = Document("/Users/an/PycharmProjects/projects/test.docx")

for para in doc.paragraphs:
   print(para.text)

但我不知道如何检查每一行的颜色。也许这个库有一些方法来完成这样的任务?

一个运行可以有一个.highlight_color,这也许就是你要找的:

for p in doc.paragraphs:
    for r in p.runs:
        print(r.font.highlight_color)

Word中没有“行”的概念。有,其中有运行s。 运行 是一系列具有相同字符格式(也称为“字体”)的字符。

请注意,运行 之间的中断在文本中是任意出现的,没有什么可以阻止突出显示文本的“行”被分成几个 运行。因此,您可能需要检查 adjacent 运行s 是否具有与“assemble”相同的 .highlight_color 值“明显”突出显示的段落。