跳过前 48 行后,使用 python 的 Pandas 逐行读取
Reading line by line with python's Pandas after skipping first 48 rows
标题解释得很清楚。
我有一个很长的 CSV 文件,我想使用以下代码逐行阅读:
lines = []
for line in pd.read_csv(file, chunksize = 1, header = None):
lines.append(line.iloc[0 0])
print(lines)
我想跳过前 48 行。起初它看起来很简单,我认为我需要做的就是将我的读取功能更改为:
pd.read_csv(file,chunksize = 1, header = None, skiprows = 48):
遗憾的是,这似乎产生了每次循环跳过 48 行的效果。不是很好的结果。
我怎样才能逐行读取有效地读取这个文件,同时跳过这个长的、不规则文件的前 48 行?
您可以将 skiprows 设置为在首次执行后重置的变量。
lines = []
row_skip = 48
for line in pd.read_csv(file, chunksize = 1, header = None,skiprows=row_skip):
lines.append(line.iloc[0,0])
if row_skip:
row_skip = None
print(lines)
标题解释得很清楚。
我有一个很长的 CSV 文件,我想使用以下代码逐行阅读:
lines = []
for line in pd.read_csv(file, chunksize = 1, header = None):
lines.append(line.iloc[0 0])
print(lines)
我想跳过前 48 行。起初它看起来很简单,我认为我需要做的就是将我的读取功能更改为:
pd.read_csv(file,chunksize = 1, header = None, skiprows = 48):
遗憾的是,这似乎产生了每次循环跳过 48 行的效果。不是很好的结果。
我怎样才能逐行读取有效地读取这个文件,同时跳过这个长的、不规则文件的前 48 行?
您可以将 skiprows 设置为在首次执行后重置的变量。
lines = []
row_skip = 48
for line in pd.read_csv(file, chunksize = 1, header = None,skiprows=row_skip):
lines.append(line.iloc[0,0])
if row_skip:
row_skip = None
print(lines)