将大型 Excel 文件导入到 Python

Importing large Excel file to Python

我正在尝试将 Excel (.xlsx) 文件导入 Spyder IDE。当我使用 openpyxl 导入小文件时,一切正常,但对于这个特定文件(大约 30MB 和 800k 行),我的系统崩溃了。

以下是导入的代码部分:

from openpyxl import load_workbook 
wb = load_workbook(filename=path + 'cleaned_noTC_s_PERNO_Date.xlsx', data_only=True)

谁能告诉我这种方法有什么问题,我还能用什么来导入指定的文件?

听起来你 运行 内存不足。如果您不需要编辑文件,那么您可以使用 read_only 模式,否则您将需要更多内存。

尝试使用 excellent pandas 库,它具有非常强大的 excel 阅读功能,并且根据我的经验,记忆力非常好:

here:

import pandas as pd
xl = pd.read_excel("file.xlsx")