自动检测并删除不需要的功能
Automatically detect and drop unwanted features
我是 Pandas 的数据分析新手。是否有可能自动检测Pandas中所有不需要的特征,如ID、姓名、地址(假设不需要)、日期时间(假设不需要)?
- 输入是具有有用和无用特征的任何数据框。
- 输出
应该是一个没有不需要的功能的新数据框。
这里我正在尝试进行分类、无监督学习(没有目标特征)但我不需要 ID、姓名、地址等
我使用了 df.info() 并删除了所有 dtype 为 'object' 的特征,但我也遗漏了一些其他重要的分类特征。
如果有可能,谁能帮我解释一下?
我认为 python pandas 不可能做到这一点。您可以使用 pandas' drop() 函数手动删除不需要的列。
例如:
df.drop(['col1', 'col2'], axis=1)
我是 Pandas 的数据分析新手。是否有可能自动检测Pandas中所有不需要的特征,如ID、姓名、地址(假设不需要)、日期时间(假设不需要)?
- 输入是具有有用和无用特征的任何数据框。
- 输出 应该是一个没有不需要的功能的新数据框。
这里我正在尝试进行分类、无监督学习(没有目标特征)但我不需要 ID、姓名、地址等
我使用了 df.info() 并删除了所有 dtype 为 'object' 的特征,但我也遗漏了一些其他重要的分类特征。
如果有可能,谁能帮我解释一下?
我认为 python pandas 不可能做到这一点。您可以使用 pandas' drop() 函数手动删除不需要的列。
例如:
df.drop(['col1', 'col2'], axis=1)