如何添加一个步骤来删除具有常量值的列?
How to add a step to remove a column with constant value?
背景: 我正在创建一个方法来清理和转换将由多个模型使用的时间序列数据。方法中的步骤之一是使用 step_corr()
函数删除相关预测变量。
但是,由于数据集的性质,在使用滚动 window 进行交叉验证时,某些变量对于整个训练数据集可能具有恒定值,从而导致 step_corr()
函数发出警告。
问题陈述:在这种情况下,是否可以从关联步骤中排除此类变量?或者可能完全删除变量?
P.S。我知道我可以轻松忽略警告并继续。但我正在寻找更简洁的方法/最佳实践建议。
您可以考虑两个步骤:
step_zv()
将删除所有具有相同值(零方差)的变量
step_nzv()
将删除 几乎 都具有相同值(高度稀疏和不平衡) 的变量
背景: 我正在创建一个方法来清理和转换将由多个模型使用的时间序列数据。方法中的步骤之一是使用 step_corr()
函数删除相关预测变量。
但是,由于数据集的性质,在使用滚动 window 进行交叉验证时,某些变量对于整个训练数据集可能具有恒定值,从而导致 step_corr()
函数发出警告。
问题陈述:在这种情况下,是否可以从关联步骤中排除此类变量?或者可能完全删除变量?
P.S。我知道我可以轻松忽略警告并继续。但我正在寻找更简洁的方法/最佳实践建议。
您可以考虑两个步骤:
step_zv()
将删除所有具有相同值(零方差)的变量step_nzv()
将删除 几乎 都具有相同值(高度稀疏和不平衡) 的变量