如何从 python 中的许多 Word 文档中的多个表格中提取所有数据(直接从 MS Word 中提取数据)?
How do I extract all data from multiple tables in many word documents in python (Data-Extraction directly from MS Word)?
我尝试使用以下代码,但它只能打开一个文档来打印单元格文本。
问题是我有67个word文档,表格相似,如何从每67个word文档中的表格中提取所有数据?
目前以下代码只能打开一个文档来提取所有表格中的单元格文本,但是,我想使用以下代码在一个文件夹中打开多个word文档。
因此,有没有办法使用以下代码打开多个word文档?
请帮忙看看下面的代码,谢谢!!! :((
from docx import Documenthttps
wordDoc = Document(r"C:\Users\user\Documents\Lynn\FYPJ P3\FYP (Updated Ver)\FYP\dataprep\documents_sampling0305644_Cat_5_Patient Care Record (Inpatient Nursing)_Admission.docx")
for table in wordDoc.tables:
for row in table.rows:
for cell in row.cells:
print(cell.text)
你可以只使用这个:
import os
from docx import Documenthttps
path = '\some\path\to\folder'
worddocs_list = []
for filename in os.listdir(path):
wordDoc = Document(path+"\"+filename)
worddocs_list.append(wordDoc)
for wordDoc in worddocs_list:
for table in wordDoc.tables:
for row in table.rows:
for cell in row.cells:
print(cell.text)
我尝试使用以下代码,但它只能打开一个文档来打印单元格文本。
问题是我有67个word文档,表格相似,如何从每67个word文档中的表格中提取所有数据?
目前以下代码只能打开一个文档来提取所有表格中的单元格文本,但是,我想使用以下代码在一个文件夹中打开多个word文档。 因此,有没有办法使用以下代码打开多个word文档? 请帮忙看看下面的代码,谢谢!!! :((
from docx import Documenthttps
wordDoc = Document(r"C:\Users\user\Documents\Lynn\FYPJ P3\FYP (Updated Ver)\FYP\dataprep\documents_sampling0305644_Cat_5_Patient Care Record (Inpatient Nursing)_Admission.docx")
for table in wordDoc.tables:
for row in table.rows:
for cell in row.cells:
print(cell.text)
你可以只使用这个:
import os
from docx import Documenthttps
path = '\some\path\to\folder'
worddocs_list = []
for filename in os.listdir(path):
wordDoc = Document(path+"\"+filename)
worddocs_list.append(wordDoc)
for wordDoc in worddocs_list:
for table in wordDoc.tables:
for row in table.rows:
for cell in row.cells:
print(cell.text)