回归与分类的准确一般描述

Accurate general description of Regression versus Classification

所以我有以下问题:我意识到(在写我的硕士论文时)我仍然没有sure/have对一些机器学习原理的模糊描述。

比如,我依稀记得在某个时候听到过如下描述:

The output (label) of a classification task is discrete and finite while the output (label) of a regression task is continuous and can be infinite

我不确定的一个词是 无限 用于此描述中的回归。

例如,如果您假设(无论出于何种原因)您拥有几乎像正弦波一样分布的二维数据点(带有一些噪声)并且您使用 polyfit 来拟合其上的 k 次多项式(见图 here 这里 k = 8)。现在你有一些特定范围内的数据,例如,这里 x 方向上可用点的范围是 [0,12],它用于拟合多项式。

然而,您是否能够快速获得值 x = 1M(或任意大的数字)的 y 结果,因为您具有多项式的一般形状?这不就是无限标签的意思吗?

也许我只是记错了几年前学到的东西 ;)。

此致

首先,这个问题更适合 StackExchange 更倾向于理论的网站,比如 Stats Stackexchange Math Stackexchange, or the Data Science Stackexchange, which conveniently also provide answers to your question
但不完全是。无论如何,您的问题似乎与 inputoutput 之间的区别有关。任务类型(即分类或回归)完全基于模型的 输出 ,但与 输入 无关。

你可以有大量的 "continuous input variables"(或者甚至是不同的混合),如果它有不同数量的输出值,仍然称它为分类任务。

此外,infinite 只是指这些值不受限制的事实,即您不能轻易将回归任务限制在特定范围内。如果您突然输入一个完全超出您的训练值范围的值(如您的示例),您可能会得到一个 "infinite" y 值,因为您的网络只会在这个特定范围内接受训练;多项式拟合也会出现这个问题,如下例所示:

红线可能是您网络的学习函数,因此如果您突然远远超出已知值,您可能会得到一些极值(除非您训练得很好)。
与此相反,分类网络仍会预测任何给定的 类。我喜欢把它想象成一种Voronoi diagram:即使你的观点与之前的任何观点相去甚远,它仍然属于某个类别。