在 2 个分层部分划分数据集
Dividing dataset on 2 stratified parts
我需要将数据集分成 2 个部分,按一个分类列的值分层。也就是说,sklearn.model_selection 工具不适合,因为它们会创建 4 个部分。我可以使用 pandas 或其他方式吗?
X_train, X_test = sklearn.model_selection.train_test_split(X, stratify='column_name')
我需要将数据集分成 2 个部分,按一个分类列的值分层。也就是说,sklearn.model_selection 工具不适合,因为它们会创建 4 个部分。我可以使用 pandas 或其他方式吗?
X_train, X_test = sklearn.model_selection.train_test_split(X, stratify='column_name')