从 dask 数据框中按索引选择几行?

selecting few rows by index from dask dataframe?

df = dd.read_csv('csv',usecols=fields,skip_blank_lines=True)
len(df.iloc[0:5])

以上代码引发

AttributeError: 'DataFrame' object has no attribute 'iloc'

尝试了 ix loc 但无法 select 行基于索引

Dask.dataframe不支持iloc。通常,如果不先将其全部读入内存,就很难访问 csv 文件中的任何特定行。

但是,如果您只想要顶部的几行,那么我建议使用 .head() 方法

>>> df.head()

一种解决方法是在您的 csv 文件中将索引创建为列,即 df_index,并像这样使用它:

selection = (df[ df['df_index'].isin( list_of_indexes ) ]).compute()