回归与分类的准确一般描述
Accurate general description of Regression versus Classification
所以我有以下问题:我意识到(在写我的硕士论文时)我仍然没有sure/have对一些机器学习原理的模糊描述。
比如,我依稀记得在某个时候听到过如下描述:
The output (label) of a classification task is discrete and finite while the output (label) of a regression task is continuous and can be infinite
我不确定的一个词是 无限 用于此描述中的回归。
例如,如果您假设(无论出于何种原因)您拥有几乎像正弦波一样分布的二维数据点(带有一些噪声)并且您使用 polyfit 来拟合其上的 k 次多项式(见图 here 这里 k = 8)。现在你有一些特定范围内的数据,例如,这里 x 方向上可用点的范围是 [0,12],它用于拟合多项式。
然而,您是否能够快速获得值 x = 1M(或任意大的数字)的 y 结果,因为您具有多项式的一般形状?这不就是无限标签的意思吗?
也许我只是记错了几年前学到的东西 ;)。
此致
首先,这个问题更适合 StackExchange 更倾向于理论的网站,比如 Stats Stackexchange Math Stackexchange, or the Data Science Stackexchange, which conveniently also provide answers to your question。
但不完全是。无论如何,您的问题似乎与 input 和 output 之间的区别有关。任务类型(即分类或回归)完全基于模型的 输出 ,但与 输入 无关。
你可以有大量的 "continuous input variables"(或者甚至是不同的混合),如果它有不同数量的输出值,仍然称它为分类任务。
此外,infinite 只是指这些值不受限制的事实,即您不能轻易将回归任务限制在特定范围内。如果您突然输入一个完全超出您的训练值范围的值(如您的示例),您可能会得到一个 "infinite" y
值,因为您的网络只会在这个特定范围内接受训练;多项式拟合也会出现这个问题,如下例所示:
红线可能是您网络的学习函数,因此如果您突然远远超出已知值,您可能会得到一些极值(除非您训练得很好)。
与此相反,分类网络仍会预测任何给定的 类。我喜欢把它想象成一种Voronoi diagram:即使你的观点与之前的任何观点相去甚远,它仍然属于某个类别。
所以我有以下问题:我意识到(在写我的硕士论文时)我仍然没有sure/have对一些机器学习原理的模糊描述。
比如,我依稀记得在某个时候听到过如下描述:
The output (label) of a classification task is discrete and finite while the output (label) of a regression task is continuous and can be infinite
我不确定的一个词是 无限 用于此描述中的回归。
例如,如果您假设(无论出于何种原因)您拥有几乎像正弦波一样分布的二维数据点(带有一些噪声)并且您使用 polyfit 来拟合其上的 k 次多项式(见图 here 这里 k = 8)。现在你有一些特定范围内的数据,例如,这里 x 方向上可用点的范围是 [0,12],它用于拟合多项式。
然而,您是否能够快速获得值 x = 1M(或任意大的数字)的 y 结果,因为您具有多项式的一般形状?这不就是无限标签的意思吗?
也许我只是记错了几年前学到的东西 ;)。
此致
首先,这个问题更适合 StackExchange 更倾向于理论的网站,比如 Stats Stackexchange Math Stackexchange, or the Data Science Stackexchange, which conveniently also provide answers to your question。
但不完全是。无论如何,您的问题似乎与 input 和 output 之间的区别有关。任务类型(即分类或回归)完全基于模型的 输出 ,但与 输入 无关。
你可以有大量的 "continuous input variables"(或者甚至是不同的混合),如果它有不同数量的输出值,仍然称它为分类任务。
此外,infinite 只是指这些值不受限制的事实,即您不能轻易将回归任务限制在特定范围内。如果您突然输入一个完全超出您的训练值范围的值(如您的示例),您可能会得到一个 "infinite" y
值,因为您的网络只会在这个特定范围内接受训练;多项式拟合也会出现这个问题,如下例所示:
红线可能是您网络的学习函数,因此如果您突然远远超出已知值,您可能会得到一些极值(除非您训练得很好)。
与此相反,分类网络仍会预测任何给定的 类。我喜欢把它想象成一种Voronoi diagram:即使你的观点与之前的任何观点相去甚远,它仍然属于某个类别。