使用 usecols 将 CSV 文件读入 Dask DataFrames
Reading CSV files into Dask DataFrames using usecols
我正在快速阅读 CSV 文件,但在阅读时,我想像在 panads 中使用的那样“使用cols”。
我目前使用的 DASK,
df = dd.read_csv('myfiles.csv') #in dask
我想像在pandas,
中那样使用
df = pd.read_csv('myfiles.csv',usecols=["date", "loc", "x"])
你试过了吗:
df = dd.read_csv('myfiles.csv',names=["date", "loc", "x"])
这是来自pandas.read_csv
的定义
名称 array-like, 可选
要使用的列名列表。如果文件包含 header 行,那么您应该显式传递 header=0
以覆盖列名。此列表中不允许重复。
您可以使用 Extra 关键字参数转发到 pandas.read_csv()
。
dask.dataframe.read_csv 所以偶数
df = dd.read_csv('myfiles.csv',usecols=["date", "loc", "x"])
会为你工作。
我正在快速阅读 CSV 文件,但在阅读时,我想像在 panads 中使用的那样“使用cols”。
我目前使用的 DASK,
df = dd.read_csv('myfiles.csv') #in dask
我想像在pandas,
中那样使用df = pd.read_csv('myfiles.csv',usecols=["date", "loc", "x"])
你试过了吗:
df = dd.read_csv('myfiles.csv',names=["date", "loc", "x"])
这是来自pandas.read_csv
的定义名称 array-like, 可选
要使用的列名列表。如果文件包含 header 行,那么您应该显式传递 header=0
以覆盖列名。此列表中不允许重复。
您可以使用 Extra 关键字参数转发到 pandas.read_csv()
。
dask.dataframe.read_csv 所以偶数
df = dd.read_csv('myfiles.csv',usecols=["date", "loc", "x"])
会为你工作。