Dask 在上一列的基础上添加新列
Dask Add New Column Based on the Previous Column
我正在使用 Dask 库来分析我的数据。
我有这组数据,我想添加新的列Phone No. Flag:
ID Phone No
001 NaN
002 O123421
003 Nan
我希望的输出是这样的,如果用户有 NaN phone No flag as '0' else '1':
ID Phone No Phone No Flag
001 NaN 0
002 O123421 1
003 Nan 0
谁能帮我解决这个问题?
能否根据您显示的示例尝试以下操作。您可以在此处使用 np.where
和 .isnull()
函数。只需通过 np.where 检查条件,如果列(Phone 否)的值为 NaN,则将 0 分配给新列或将 1 分配给新列值。
import pandas as pd
import numpy as np
df1['Phone No Flag']=np.where(df1['Phone No'].isnull(),0,1)
Dask 支持常规 pandas
语法,因此下面的代码与 pandas
中的代码相同:
ddf['phone_no_flag'] = ddf['phone_no'].isna() * 1
乘以1是得到0/1的值而不是True/False。
我正在使用 Dask 库来分析我的数据。
我有这组数据,我想添加新的列Phone No. Flag:
ID Phone No
001 NaN
002 O123421
003 Nan
我希望的输出是这样的,如果用户有 NaN phone No flag as '0' else '1':
ID Phone No Phone No Flag
001 NaN 0
002 O123421 1
003 Nan 0
谁能帮我解决这个问题?
能否根据您显示的示例尝试以下操作。您可以在此处使用 np.where
和 .isnull()
函数。只需通过 np.where 检查条件,如果列(Phone 否)的值为 NaN,则将 0 分配给新列或将 1 分配给新列值。
import pandas as pd
import numpy as np
df1['Phone No Flag']=np.where(df1['Phone No'].isnull(),0,1)
Dask 支持常规 pandas
语法,因此下面的代码与 pandas
中的代码相同:
ddf['phone_no_flag'] = ddf['phone_no'].isna() * 1
乘以1是得到0/1的值而不是True/False。