如何正确验证机器学习模型？

How to correctly validate a machine learning model?

我对模型验证感到困惑。

我为 6 种不同的算法做了什么：

--> 将我的数据集分隔为 75/25 (training/test) --> 我保持原样的测试。

-->我对训练集做了以下操作：

现在的问题是：

我还有一个未触及的测试集（从一开始的拆分），我应该如何处理它？直接应用于最佳模型并查看性能？或使用整个训练集重新训练具有最佳参数的最佳模型，然后应用测试集？

还是这里一切都错了？

你明白了。这是一般规则：