如何从 python 中的许多 Word 文档中的多个表格中提取所有数据(直接从 MS Word 中提取数据)?

How do I extract all data from multiple tables in many word documents in python (Data-Extraction directly from MS Word)?

我尝试使用以下代码,但它只能打开一个文档来打印单元格文本。

问题是我有67个word文档,表格相似,如何从每67个word文档中的表格中提取所有数据?

目前以下代码只能打开一个文档来提取所有表格中的单元格文本,但是,我想使用以下代码在一个文件夹中打开多个word文档。 因此,有没有办法使用以下代码打开多个word文档? 请帮忙看看下面的代码,谢谢!!! :((

from docx import Documenthttps

wordDoc = Document(r"C:\Users\user\Documents\Lynn\FYPJ P3\FYP (Updated Ver)\FYP\dataprep\documents_sampling0305644_Cat_5_Patient Care Record (Inpatient Nursing)_Admission.docx")
for table in wordDoc.tables:
    for row in table.rows:
        for cell in row.cells:
            print(cell.text)

你可以只使用这个:

import os
from docx import Documenthttps

path = '\some\path\to\folder'
worddocs_list = []
for filename in os.listdir(path):
    wordDoc = Document(path+"\"+filename)
    worddocs_list.append(wordDoc)

for wordDoc in worddocs_list:
    for table in wordDoc.tables:
        for row in table.rows:
            for cell in row.cells:
                print(cell.text)