预测方法如何在 scikit-learn 上工作?

How does the predict method work on scikit-learn?

scikit-learn 中的 predict() 方法是如何工作的?它是 return 随机值还是在后台进行计算?

predict() 必须跟在 fit() 之后。 fit() 建立一个模型,试图找到将输入数据映射到标签的模式。在此阶段,输入数据称为训练集。 predict() 只是要求您训练的模型使用这些模式将新输入映射到它们的标签。它们是模型的最佳猜测,考虑到它之前接受过的训练,而不是随机的。优化这些模式的质量以使预测尽可能准确是机器学习的全部艺术和科学。

想象一下,我想让你成为识别猫品种的专家。起初你可能不知道。所以首先我得训练你。我给你看一堆图片,告诉你每只猫的品种是什么(标签)。一段时间后,您开始看到模式并做笔记。最终,您开始觉得自己获得了更细微的区别,并准备好识别展示给您的任何猫的品种。您的新知识称为模型。这就是 fit() 所做的。它通过训练建立模型。

现在我开始给你看猫的照片,但不告诉你品种(标签)。使用您的新知识、笔记和模式(即您的模型),您现在可以“预测”您以前从未见过的猫的品种(前提是它是您在训练期间了解的品种之一)。这就是 predict() 所做的。它通过模型运行数据以获得预测。

没有训练就无法预测猫的品种,没有 fit() 就无法获得 predict(),因为 fit() 建立了 predict() 使用的模型。

我强烈建议您关注 this tutorial,这将帮助您了解它们是如何组合在一起的。