python: 在docx文件中查找数字并替换

python: find numbers in docx file and replace

我想阅读python中的docx文件。 然后从中提取数字 喜欢:

with open('test.docx') as t:
    text = t.readlines()
a = []
a.append([int(s) for s in text.split() if s.isdigit()])
a = [int(numeric_string) for numeric_string in a]

感谢您的帮助

您可以使用 docx 库来读取 .docx 文件的内容。

pip install python-docx

改编 here 中的一些代码并结合您发布的代码我得到:

import docx

def getText(filename):
    doc = docx.Document(filename)
    fullText = []
    for para in doc.paragraphs:
        fullText.append(para.text)
    return '\n'.join(fullText)

text = getText('Doc1.docx')

a = [int(s) for s in text.split() if s.isdigit()]

这对我来说是一个简单的测试文件 - 尽管您可能需要根据您希望搜索数字的方式调整某些部分。