将包含多个 excel 个文件的文件夹读取到一个循环中,每个文件包含超过 15 个工作表以进行特征提取处理

Reading a folder with multiple excel files which contain more than 15 sheets each into a loop to be processed for feature extraction

社区。希望您能提供一些指导,因为我是 python 编程的新手

我正在尝试读取一个包含 15 个 excel 文件的文件夹,每个 excel 文件有 30 个作品sheet。我试图分别阅读每个 excel 作品 sheet,因为我需要从 30 个 sheet 中提取特征。我需要使用 pandas 数据框读取 excel sheets,但是,当我尝试这样做时,它显示为空。我不确定如何从这里开始,我试图将 df 放入 df_frame 但我收到错误。

获取当前工作目录 print("当前工作目录是:")

打印(os.getcwd())

文件夹路径

path = r'C:\Users' excel_files = glob.glob(os.path.join(路径, "*.xlsx"))

遍历 excel 个文件的列表

对于 excel_files 中的文件:

# read the csv file
df = pd.read_excel(files,sheet_name=None)
df_frame = pd.DataFrame(df,columns= ['Time','Sensor'])  


# print the location and filename
print (df_frame)
display(df_frame)
#print('Location:', files)
#print('File Name:', files.split("\")[-1])
  
# print the content
#print('Content:')
#display(df)

打印()`


我已尝试解决消息错误,但是,我不知道如何使 df_frame = pd.DataFrame(df,columns= ['Time','Sensor']) 应用于所有 excel 文件中的所有 excel 作品sheet。

P.s 我现在不需要将 excel 作品 sheet 加入 1 个单曲 sheet。我只是希望能够单独阅读以便能够继续进行特征提取,然后将提取的特征连接在一起。

df = pd.read_excel(files,sheet_name=None)创建了一个字典,字典键是每个sheet的字符串名称,字典值是sheet中每个[=]中找到的数据16=]数据框。

你可以像这样循环:

df_dict = pd.read_excel(files,sheet_name=None)
for sheet_name, df in df_dict.items():
    ## Rest of code here