将整个文本作为字符串读入列表而不是每个段落
Read in whole text as string to list instead of each paragraph
我阅读了一个 docx 文档,并使用以下代码将每个段落作为字符串附加到列表中:
from docx import Document
paragraphs = []
document = Document('/path to/*.docx')
for para in document.paragraphs:
para = para.text
paragraphs.append(para)
我想阅读整个文本作为一个字符串并将其附加到列表中,而不是阅读每个段落。我必须如何修改上面的代码?
您可以简单地将所有段落连接到一个变量中,然后您可以通过如下追加将完整的文本存储在列表中:
from docx import Document
text_com=""
paragraphs = []
document = Document('/path to/*.docx')
for para in document.paragraphs:
text_com += para.text
paragraphs.append(text_com)
我阅读了一个 docx 文档,并使用以下代码将每个段落作为字符串附加到列表中:
from docx import Document
paragraphs = []
document = Document('/path to/*.docx')
for para in document.paragraphs:
para = para.text
paragraphs.append(para)
我想阅读整个文本作为一个字符串并将其附加到列表中,而不是阅读每个段落。我必须如何修改上面的代码?
您可以简单地将所有段落连接到一个变量中,然后您可以通过如下追加将完整的文本存储在列表中:
from docx import Document
text_com=""
paragraphs = []
document = Document('/path to/*.docx')
for para in document.paragraphs:
text_com += para.text
paragraphs.append(text_com)