在 pandas 数据框的字符串类型列上应用 pd.get_dummies()?
Apply pd.get_dummies() on string type columns of pandas dataframe?
我有以下数据框:
df = pd.DataFrame({'a': [6.6, -5.2, 2.1, 3.3, 1.1],
'b': ['a', 'a', 'c', 'b', 'a'],
'c': ['kfr', 'kfr', 'lu', 'ku', 'lu'],
'd': ['t', 's', 's', 't', 'a']})
所有数据类型(b、c、d 列)都是字符串类型。
如果我调用 df = df.convert_dtypes()
,然后调用 pd.get_dummies()
,没有任何反应。
但是当我只在数据框的一列上调用它时,它起作用了。
为什么会这样?这是一个错误吗?
经过一些调查,我不知道为什么会发生这种情况,特别是因为它适用于单列。我猜这是一个错误,因为其中似乎有很多以 pd.NA
类型为中心(convert_dtypes
支持。)
我建议在 https://github.com/pandas/pandas-dev 打开错误报告。
我有以下数据框:
df = pd.DataFrame({'a': [6.6, -5.2, 2.1, 3.3, 1.1],
'b': ['a', 'a', 'c', 'b', 'a'],
'c': ['kfr', 'kfr', 'lu', 'ku', 'lu'],
'd': ['t', 's', 's', 't', 'a']})
所有数据类型(b、c、d 列)都是字符串类型。
如果我调用 df = df.convert_dtypes()
,然后调用 pd.get_dummies()
,没有任何反应。
但是当我只在数据框的一列上调用它时,它起作用了。
为什么会这样?这是一个错误吗?
经过一些调查,我不知道为什么会发生这种情况,特别是因为它适用于单列。我猜这是一个错误,因为其中似乎有很多以 pd.NA
类型为中心(convert_dtypes
支持。)
我建议在 https://github.com/pandas/pandas-dev 打开错误报告。