将整个文本作为字符串读入列表而不是每个段落

Read in whole text as string to list instead of each paragraph

我阅读了一个 docx 文档,并使用以下代码将每个段落作为字符串附加到列表中:

from docx import Document
paragraphs = []

document = Document('/path to/*.docx')
for para in document.paragraphs:
    para = para.text
    paragraphs.append(para)

我想阅读整个文本作为一个字符串并将其附加到列表中,而不是阅读每个段落。我必须如何修改上面的代码?

您可以简单地将所有段落连接到一个变量中,然后您可以通过如下追加将完整的文本存储在列表中:

from docx import Document
text_com=""
paragraphs = []

document = Document('/path to/*.docx')
for para in document.paragraphs:
    text_com += para.text

paragraphs.append(text_com)