如何使用 Google Colab python read/loop 通过文件夹中的多个 .csv 文件,然后将每个文件分配为函数参数

How to read/loop through multiple .csv files in a folder using Google Colab python, then assign each file as a function parameter

我目前正在使用 Google Colab 并且已经安装了我的 Google 驱动器。 我的驱动器内有一个文件夹,其中包含多个 .csv 文件

例如文件夹名称:dataset

文件夹内容:data1.csv, data2.csv, data3.csv,依此类推

我想遍历文件夹中的每个文件,然后将文件作为函数参数

这是我的代码,但仍然无效

from google.colab import drive
drive.mount('/content/drive/')

def myfunction(data):
###function detail here###

dir = '/content/drive/dataset'

for files in dir:
  myfunction(pd.read_csv('filename'))

谢谢

您必须使用类似 os.listdir 的函数遍历文件。下面是一个使用此函数并防御性地检查读取的内容是否为 csv 文件的示例。我使用了 Google Colab 的 sample_data 文件夹,这样代码就可以重现了;您需要更改 dir 变量以指向您的 Google Drive 文件夹。

import pandas as pd
import os

def myfunction(data):
  print(data)

dir = 'sample_data'

for file in os.listdir(dir):
  if file.endswith(".csv"):
    myfunction(file)