如何在 Flux.jl 中将自定义数据集拆分为训练和测试数据集?
How do I split a custom dataset into training and test datasets in Flux.jl?
我有一个自定义数据集,我想将该数据集拆分为“训练”和“测试”集(如果可能,也可能是“验证”集)。我如何使用 Flux.jl 或其他 Julia 机器学习包实现此目的?
您可以从 Lathe 包中导入 TrainTestSplit
函数,如:
using Lathe.preprocess: TrainTestSplit
然后在您的代码中实现它,例如:
dataset_id = TrainTestSplit(datasetmap[:], 0.8); #datasetmap is your label encoded matrix
我假设您使用的是 Pluto notebook,但它应该也可以在任何其他环境中工作,例如 jupyter、atom 等。
我有一个自定义数据集,我想将该数据集拆分为“训练”和“测试”集(如果可能,也可能是“验证”集)。我如何使用 Flux.jl 或其他 Julia 机器学习包实现此目的?
您可以从 Lathe 包中导入 TrainTestSplit
函数,如:
using Lathe.preprocess: TrainTestSplit
然后在您的代码中实现它,例如:
dataset_id = TrainTestSplit(datasetmap[:], 0.8); #datasetmap is your label encoded matrix
我假设您使用的是 Pluto notebook,但它应该也可以在任何其他环境中工作,例如 jupyter、atom 等。