通过 python 代码在 docx 文件中查找红色单词

finding red color words in docx file through python code

我有一个 mircosoft docx 文件,其中只有很少的红色文字。 现在我想通过 python 代码读取该文件并提取那些红色单词。

但我找不到应该用于它的 api。我试图迭代 para 以访问单个单词。但它说 para 不可迭代。 我也不知道如何检查单词的颜色。

你能帮忙吗。

import docx

def readtxt(filename):
    doc = docx.Document(filename)
    fullText = []
    for para in doc.paragraphs:
        print(para.text);

readtxt('C:\Users\X\some.docx')

此致

试试这个,该函数将 return 文档中所有连续部分的列表,这些部分位于 red.

import docx
from docx.shared import RGBColor

def readtxt(filename):
    doc = docx.Document(filename)
    fullText = []
    for para in doc.paragraphs:
        for run in para.runs:
            if run.font.color.rgb == RGBColor(255, 000, 000):
                fullText.append(run.text)
    return fullText

fullText = readtxt('filepath.docx')

此外,请检查您是否正确传递 filepath