房屋建造年份图像分类:回归还是分类?

Image classification of house build year: regression or classification?

假设我想通过使用以下映射在房屋图像训练集上训练 CNN 来了解房屋的建造时间:

Input Pictures [244, 244, 3] -> Output Year [1850, 1850, ... , 2018] 

这是一个监督学习问题,所以标签是已知的(从 1850 年到 2018 年)。

我会构建分类或回归分类器来解决这个问题吗?我不确定,因为我没有 1850-2018 年的每一年的输入,但我希望分类器输出训练完成后我提供给分类器的新图片的所有值。所以这会指向一个回归分类器。

另一方面,我不希望分类器输出连续的 Y,因为我对建筑物建造的具体年份感兴趣。不是中间值。

这个问题的答案可能超级简单,但我想不出来。

这显然是一个回归问题。如果您将每年视为 单独的 class,classes 19002017 将同样接近 2018(数值在class化中无关紧要)。但很明显,当真实标签为 2018 时,两个预测 - 20171900 - 非常不同。正如您自己所说,回归问题也将使您能够概括到看不见的年份。如果这些 classes 不存在于训练中,这在 classification 中几乎是不可能的。

如果您的最终结果必须是整数,我建议您实施回归输出的解释。例如,它可以 return 一个整数值,如果它在一定范围内或两年内(当模型不确定时):

regression_output=2000.23 -> result_year=2000
regression_output=2000.96 -> result_year=2001
regression_output=2000.45 -> result_year=2000/2001

这样您就可以多调整一个参数。例如,tolerance=0.5 将使您的模型始终确定。