不选择缺失值?

na not picking missing values?

有一个 DF med562。分类变量的分布如下

I    6119923

O     764905

      166666

Name: IND, dtype: int64

只想使用具有 6119923 行的 I 的值来估算 166666 个缺失值。写了这个

med562['IND']=med562['IND'].fillna(value='I')

Catcounts=med562.IND.value_counts(dropna=False)

Catcounts

没变,还是一样的分布。这是 Python 3.7.3 上的 运行。应该不是软件问题。任何想法?谢谢

那不是 NaN,它是空格,如果那是 NaN 当你做 value_counts 它不会显示在结果中,因为 dropna=Truevalue_counts 默认为 True

med562['IND']=med562['IND'].replace({'':'I'})

Catcounts=med562.IND.value_counts(dropna=False)