如何在 Flux.jl 中将自定义数据集拆分为训练和测试数据集?

How do I split a custom dataset into training and test datasets in Flux.jl?

我有一个自定义数据集,我想将该数据集拆分为“训练”和“测试”集(如果可能,也可能是“验证”集)。我如何使用 Flux.jl 或其他 Julia 机器学习包实现此目的?

您可以从 Lathe 包中导入 TrainTestSplit 函数,如:

using Lathe.preprocess: TrainTestSplit

然后在您的代码中实现它,例如:

dataset_id = TrainTestSplit(datasetmap[:], 0.8); #datasetmap is your label encoded matrix

我假设您使用的是 Pluto notebook,但它应该也可以在任何其他环境中工作,例如 jupyter、atom 等。