无法加载大型 excel 文件 (Python)
Trouble loading large excel file (Python)
我正在尝试使用 OpenPyXL
加载大型 .xlsx
文件,而加载 80 MB .xlsx 文件时,我的整个 8 GB 内存已满
Excel 文件有 4 张 800 000 行。
from openpyxl import load_workbook
wb = load_workbook('Record.xlsx')
def process(ws):
'''
Read all rows of a worksheet
'''
data = []
for a, c, f, k in zip(ws['A'], ws['C'], ws['F'], ws['K']):
data.append([a, c, f, k])
return data
ws1 = wb.worksheets[0] # Sheet 1
data1 = process(ws1)
ws2 = wb.worksheets[1] # Sheet 2
data2 = process(ws2)
ws3 = wb.worksheets[2] # Sheet 3
data3 = process(ws3)
ws4 = wb.worksheets[3] # Sheet 4
data4 = process(ws4)
为什么加载 80 MB 的 excel 文件时 8 GB 内存不够?
尝试使用 read_only = True
参数来使用只读模式,如 here 所述。
我正在尝试使用 OpenPyXL
加载大型 .xlsx
文件,而加载 80 MB .xlsx 文件时,我的整个 8 GB 内存已满
Excel 文件有 4 张 800 000 行。
from openpyxl import load_workbook
wb = load_workbook('Record.xlsx')
def process(ws):
'''
Read all rows of a worksheet
'''
data = []
for a, c, f, k in zip(ws['A'], ws['C'], ws['F'], ws['K']):
data.append([a, c, f, k])
return data
ws1 = wb.worksheets[0] # Sheet 1
data1 = process(ws1)
ws2 = wb.worksheets[1] # Sheet 2
data2 = process(ws2)
ws3 = wb.worksheets[2] # Sheet 3
data3 = process(ws3)
ws4 = wb.worksheets[3] # Sheet 4
data4 = process(ws4)
为什么加载 80 MB 的 excel 文件时 8 GB 内存不够?
尝试使用 read_only = True
参数来使用只读模式,如 here 所述。