Dask相当于Pandas替换?

Dask equivalent to Pandas replace?

我在 pandas 中经常使用的是 .replace 操作。我正在努力了解人们如何轻松地在 dask 数据帧上执行相同的操作?

df.replace('PASS', '0', inplace=True)
df.replace('FAIL', '1', inplace=True)

您可以使用 mask:

df = df.mask(df == 'PASS', '0')
df = df.mask(df == 'FAIL', '1')

或等效地链接 mask 调用:

df = df.mask(df == 'PASS', '0').mask(df == 'FAIL', '1')

如果有人想知道如何替换特定列中的某些值,请按以下步骤操作:

def replace(x: pd.DataFrame) -> pd.DataFrame:
    return x.replace(
      {'a_feature': ['PASS', 'FAIL']},
      {'a_feature': ['0', '1']}
    )
df = df.map_partitions(replace)

由于我们在这里操作的是pandas' DataFrame,请参考the documentation了解更多信息