将大型 Excel 文件导入到 Python
Importing large Excel file to Python
我正在尝试将 Excel (.xlsx
) 文件导入 Spyder IDE。当我使用 openpyxl
导入小文件时,一切正常,但对于这个特定文件(大约 30MB 和 800k 行),我的系统崩溃了。
以下是导入的代码部分:
from openpyxl import load_workbook
wb = load_workbook(filename=path + 'cleaned_noTC_s_PERNO_Date.xlsx', data_only=True)
谁能告诉我这种方法有什么问题,我还能用什么来导入指定的文件?
听起来你 运行 内存不足。如果您不需要编辑文件,那么您可以使用 read_only
模式,否则您将需要更多内存。
尝试使用 excellent pandas 库,它具有非常强大的 excel 阅读功能,并且根据我的经验,记忆力非常好:
见here:
import pandas as pd
xl = pd.read_excel("file.xlsx")
我正在尝试将 Excel (.xlsx
) 文件导入 Spyder IDE。当我使用 openpyxl
导入小文件时,一切正常,但对于这个特定文件(大约 30MB 和 800k 行),我的系统崩溃了。
以下是导入的代码部分:
from openpyxl import load_workbook
wb = load_workbook(filename=path + 'cleaned_noTC_s_PERNO_Date.xlsx', data_only=True)
谁能告诉我这种方法有什么问题,我还能用什么来导入指定的文件?
听起来你 运行 内存不足。如果您不需要编辑文件,那么您可以使用 read_only
模式,否则您将需要更多内存。
尝试使用 excellent pandas 库,它具有非常强大的 excel 阅读功能,并且根据我的经验,记忆力非常好:
见here:
import pandas as pd
xl = pd.read_excel("file.xlsx")