我们可以在 pandas 中自动检测特征类型是标称的还是有序的?

can we auto detect the feature type as nominal or ordinal in pandas?

我正在开展一个项目,我想通过 python 脚本在没有任何人工干预的情况下将特征检测为名义型或序数型。这可能吗

我是数据科学的新手。你的意见对我有帮助

像'Age'这样的列不代表名义或有序数据,而是数值数据。您可以使用以下命令查找包含数字数据的所有列:

numeric_cols = df._get_numeric_data().columns  # numeric columns
cols = df.columns  # all columns

假设非数字列要么是名义列,要么是有序列(例如性别),您可以通过以下方式找到这些列:

categorical_cols = list(set(cols) - set(numeric_cols))

如果您想识别名义数据与有序数据,则需要为此定义一些方法。例如,如果您有衣服尺码(小号、中号、大号)的序数数据,则必须先定义固定顺序。