Python: 数据缩放应该在机器学习采样之前完成吗?

Python: should Data Scaling be done before Sampling in Machine Learning?

我什么时候应该进行数据缩放和采样(因为我的数据是不平衡的)? 我应该先做数据缩放再采样吗?

您可能希望在 sampling/splitting 之后 standardize/scale 您的独立值。

如果您喜欢 Python 编程语言,scikit-learn.org 有一些示例可能会更好地解决您的问题。 Here's 处理特征缩放重要性的示例解决方案。

Here's 另一个包含分层抽样的方法。