如何将列描述为分类值?
How to describe columns as categorical values?
我有一个 pandas 数据框,其中混合了分类列和数字列。默认情况下,df.describe()
returns 只是数值数据的摘要(用 count
、mean
、std
、min
、quantiles
, max
)
当遍历 df 中的所有列并将它们单独描述为 [df[c].describe() for c in df.columns]
时,根据特定列 dtype 返回描述;即 int
和 float
的数字摘要和 object
的分类摘要
有没有人知道用 count
、unique
、top
、freq
将所有列描述为分类的简洁方法?
以下将所有列转换为 object
类型然后描述它们:
df.astype('object').describe()
为了更清晰的视图,请尝试:
df.astype('object').describe().transpose()
一个略短的答案版本:
df.describe(include = 'object')
我有一个 pandas 数据框,其中混合了分类列和数字列。默认情况下,df.describe()
returns 只是数值数据的摘要(用 count
、mean
、std
、min
、quantiles
, max
)
当遍历 df 中的所有列并将它们单独描述为 [df[c].describe() for c in df.columns]
时,根据特定列 dtype 返回描述;即 int
和 float
的数字摘要和 object
有没有人知道用 count
、unique
、top
、freq
将所有列描述为分类的简洁方法?
以下将所有列转换为 object
类型然后描述它们:
df.astype('object').describe()
为了更清晰的视图,请尝试:
df.astype('object').describe().transpose()
一个略短的答案版本:
df.describe(include = 'object')