连接并加载多个文件

Concat and loading several files

我有以下代码(在此处发布,Import multiple excel files into python pandas and concatenate them into one dataframe)并尝试使用它但它一直标记以下错误:

BadZipFile: File is not a zip file

我的目录中没有任何 zip 文件。唯一的文件是 Jupyter 笔记本,Excel 个文件。

all_data = pd.DataFrame()
for f in glob.glob("C:/Users/rmerida/OneDrive/Mineco/Unidad Inteligencia Mercados/Mesa Inversión Interinstitucional/Hitech/*.xlsx"):
    df = pd.read_excel(f)
    all_data = all_data.append(df,ignore_index=True)

all_data.to_xls("Consolidado.xlsx")  

有什么问题吗?

xlsx 文件是一种 zip 文件。此错误有时会发生,具体取决于 Python 或模块的版本。

以下代码可以通过明确指定一个引擎来读取 excel 文件来解决问题。

df = pd.read_excel(f, engine='openpyxl')