train_test_split 是二进制分类所必需的吗?为什么会有 4 个结果?
Is train_test_split necessary for binary classification? And why are there 4 outcomes?
为什么在 sklearn 中 train_test_split 有 4 个结果?测试数据没有y_data,为什么会有y_test?
查看 documentation,您可以看到第一个参数是
*arrays
,这意味着您可以在那里放置任意数量的数组。现在,它是什么 returns?
Returns: splitting : list, length=2 * len(arrays)
这意味着它 returns 是 train_test_split 函数中传递的数组数量的两倍。
所以,如果你已经有一个训练集和一个测试集,那么只有拆分训练集才有意义,这样你就可以有一个验证集来检查模型的性能。
例如:
train_data, validation_data, train_label, validation_label= train_test_split(original_train_data, original_train_label)
请注意,如果数据和标签位于分离的向量中,则还必须拆分标签。
您得到 4 个结果的原因是因为您得到:train_features、test_features、train_labels 和 test_labels (X_train, X_test, y_train, y_test
)。因此,它不仅将数据集拆分为训练集和测试集,还拆分了标签。 (所以 2 + 2 = 4 个结果)。
因为您已将原始数据拆分为训练和测试部分。所以会有四种结果。
1 (X_train, Y_train) 其中 X_train 是训练点,而 Y_train 是它们各自的 class 标签。现在这是您的训练数据,将用于使用任何 class 逻辑模型训练您的模型,例如 K-NN、逻辑回归、决策树。
2 (X_test,Y_test) 其中 X_test 代表您的测试数据点,y_train 是这些测试的各自 class 标签 points.Now 一旦你训练了你的模型并计算了你的训练 error/accuracy,那么你可以使用这些点来查看训练模型是否正确预测数据或 not.The 降低你的训练和测试错误之间的差异越多越好。
这就是为什么您会得到 4 个结果,每个结果都是 2 个对。
希望这对您有所帮助。
为什么在 sklearn 中 train_test_split 有 4 个结果?测试数据没有y_data,为什么会有y_test?
查看 documentation,您可以看到第一个参数是
*arrays
,这意味着您可以在那里放置任意数量的数组。现在,它是什么 returns?
Returns: splitting : list, length=2 * len(arrays)
这意味着它 returns 是 train_test_split 函数中传递的数组数量的两倍。
所以,如果你已经有一个训练集和一个测试集,那么只有拆分训练集才有意义,这样你就可以有一个验证集来检查模型的性能。
例如:
train_data, validation_data, train_label, validation_label= train_test_split(original_train_data, original_train_label)
请注意,如果数据和标签位于分离的向量中,则还必须拆分标签。
您得到 4 个结果的原因是因为您得到:train_features、test_features、train_labels 和 test_labels (X_train, X_test, y_train, y_test
)。因此,它不仅将数据集拆分为训练集和测试集,还拆分了标签。 (所以 2 + 2 = 4 个结果)。
因为您已将原始数据拆分为训练和测试部分。所以会有四种结果。
1 (X_train, Y_train) 其中 X_train 是训练点,而 Y_train 是它们各自的 class 标签。现在这是您的训练数据,将用于使用任何 class 逻辑模型训练您的模型,例如 K-NN、逻辑回归、决策树。
2 (X_test,Y_test) 其中 X_test 代表您的测试数据点,y_train 是这些测试的各自 class 标签 points.Now 一旦你训练了你的模型并计算了你的训练 error/accuracy,那么你可以使用这些点来查看训练模型是否正确预测数据或 not.The 降低你的训练和测试错误之间的差异越多越好。
这就是为什么您会得到 4 个结果,每个结果都是 2 个对。
希望这对您有所帮助。