预测销售数量是回归问题还是分类问题?

Is predicting number of sales a Regression or Classification problem?

我是一名机器学习初学者,目前正在 Coursera 上学习 Andrew Ng 的机器学习课程。在讲座中,他问了一个简单的问题:你会把下面的问题称为分类问题还是回归问题?

您有大量相同物品的库存。你想预测有多少 的这些商品将在未来 3 个月内售出

我选择分类是因为我认为我们只是预测会卖 (1) 或不会卖 (0)。但他说这是一个回归问题,因为有成千上万个相同的项目,而且它是一个连续的输出。我不明白它是如何连续输出的。在我看来就像一个具有数千个值的离散输出。有人可以给我解释一下吗?

I don't understand how it is a continuous output. Looks to me like a discrete output having thousands of values.

嗯,continuous这里的输出没有正式的数学意义;严格来说,您的输出(某个整数值)是离散的,这是正确的,但这不是本文的重点。

使它成为回归问题而不是分类问题的关键区别在于,在分类中,输出仅限于一些(通常 很少预定义 values/levels;很容易看出这里不是这种情况,因为售出的数量原则上可以是任何(整数)值,并且将值 18 和 19 视为不同的 .

尝试将分类输出视为 类别 可能也很有用,一般来说,它们之间可能没有 序数 关系他们;从这个角度来看,18和19的区别可以认为和18和856的区别是一样的(它们只是不同的类别);直觉上,很明显,因为我们对确切的销售量感兴趣,所以这些差异在它们之间非常不同,我们更愿意将“18”错误预测为“19”而不是作为“856”...