求 5000 个不同 csvs 的平均值以汇总在一个 python 列表中

Finding mean of 5000 different csvs to summarize in one python list

我有一个包含大约 5000 个 csvs 的文件夹,每个 csv 有 60,000 行和 10 列。我希望获得每个 csv 的平均值并将其附加到列表中。当前代码如下:

mean_list = []
   
for item in train_frags: # train_frags is a variable that holds location of all files
    segment = pd.read_csv(item,dtype = 'Int16')
    mean_list.append(segment.mean())

此代码已经 运行 超过 10 分钟了!!.请推荐一个有效的版本。

我唯一能想到的是你正在使用追加,这很慢,所以如果可能的话,可以尝试将它转换为列表理解。我唯一能想到的另一件事是使用 numba (https://numba.pydata.org/),这有助于提高性能和速度。