ALS.train() 中的 rank、numIteraions 和 lambda 是什么?
What is rank, numIteraions and lambda in ALS.train()?
我是 Spark 机器学习的新手。我正在使用 ALS 算法 试验协同过滤。在此算法中,我需要对用于训练算法的 rank、numIterations 和 lambda 参数进行一些说明。而且我需要知道如何针对最小和最大的数据集调整此算法以产生改进的预测。有人可以解释一下吗?
来自文档:
numBlocks is the number of blocks used to parallelize computation (set
to -1 to auto-configure).
rank is the number of features to use (also referred to as the number of latent factors).
iterations is the number of iterations of ALS to run. ALS typically converges to a reasonable solution in 20 iterations or less.
numBlocks
与矩阵的块有关。
rank
是隐藏因素,您想要使用的功能数量。阅读更多 .
iterations 是您要执行的重复次数。参数名称是 not numIterations.
阅读更多关于肌萎缩侧索硬化的信息here。
I need to know how to tune the training parameters to increase the prediction with the less and high number of datas?
这总是取决于数据。使用交叉验证来选择这些。
我是 Spark 机器学习的新手。我正在使用 ALS 算法 试验协同过滤。在此算法中,我需要对用于训练算法的 rank、numIterations 和 lambda 参数进行一些说明。而且我需要知道如何针对最小和最大的数据集调整此算法以产生改进的预测。有人可以解释一下吗?
来自文档:
numBlocks is the number of blocks used to parallelize computation (set to -1 to auto-configure).
rank is the number of features to use (also referred to as the number of latent factors).
iterations is the number of iterations of ALS to run. ALS typically converges to a reasonable solution in 20 iterations or less.
numBlocks
与矩阵的块有关。
rank
是隐藏因素,您想要使用的功能数量。阅读更多
iterations 是您要执行的重复次数。参数名称是 not numIterations.
阅读更多关于肌萎缩侧索硬化的信息here。
I need to know how to tune the training parameters to increase the prediction with the less and high number of datas?
这总是取决于数据。使用交叉验证来选择这些。