从多个 csv 中提取列名前几个字符的列
Extract columns with first few characters of the column name from multiple csv
我正在尝试从多个 csv 文件中提取特定列并将它们合并为一个。每个文件包含 265 列,提取特定列及其索引号非常困难。他们能高效地完成这些任务吗?
我有大约 120 个 csv 文件。
pandas 中有一个解决方案,可以从当前目录中的所有 *.csv 文件中按名称提取两列。
代码:
import pandas as pd
from glob import glob
seek_cols = ["FccFaultB1", "FccFaultB2"]
infiles = glob("*.csv")
df = pd.DataFrame(columns=seek_cols)
for infile in infiles:
data = pd.read_csv(infile)[seek_cols]
df = df.append(data)
就我而言,test1.csv:
FccFaultB0,FccFaultB1,FccFaultB2,FccFaultB3
0,0,0,0
和test2.csv:
FccFaultB0,FccFaultB1,FccFaultB2,FccFaultB3
1,1,1,1
导致 df:
FccFaultB1 FccFaultB2
0 1 1
0 0 0
我正在尝试从多个 csv 文件中提取特定列并将它们合并为一个。每个文件包含 265 列,提取特定列及其索引号非常困难。他们能高效地完成这些任务吗?
我有大约 120 个 csv 文件。
pandas 中有一个解决方案,可以从当前目录中的所有 *.csv 文件中按名称提取两列。
代码:
import pandas as pd
from glob import glob
seek_cols = ["FccFaultB1", "FccFaultB2"]
infiles = glob("*.csv")
df = pd.DataFrame(columns=seek_cols)
for infile in infiles:
data = pd.read_csv(infile)[seek_cols]
df = df.append(data)
就我而言,test1.csv:
FccFaultB0,FccFaultB1,FccFaultB2,FccFaultB3
0,0,0,0
和test2.csv:
FccFaultB0,FccFaultB1,FccFaultB2,FccFaultB3
1,1,1,1
导致 df:
FccFaultB1 FccFaultB2
0 1 1
0 0 0