机器学习中自我监督学习的缺点是什么?

What are the disadvantages of self-supervised learning in ML?

自监督学习在过去几年中一直在兴起。与监督和半监督等其他学习方法相比,它确实具有优势,因为它不需要标记数据。

我想知道自监督学习是否有任何缺点,半监督学习在哪些方面比它更好。

我认为最好的说明这个问题的方法是引用伟大的 Yann LeCun:

If intelligence is a cake, the bulk of the cake is unsupervised learning, the icing on the cake is supervised learning, and the cherry on the cake is reinforcement learning (RL).

不同类型的 ML 可能非常好,也可能不好,视情况而定。例如,对于机器人或自动驾驶问题,鉴于这些算法的性质,RL 将是理想的解决方案。但是,对于推荐系统或股票价格预测器,您可能会在有监督和无监督学习中找到更好(和更简单)的解决方案。

监督学习与监督学习和无监督学习有很大不同,因为它需要根据代理、状态和环境来定义,而不是简单的数据(以及监督学习情况下的标签)。因此,您将需要这些元素并非常仔细地定义它们之间的交互,以训练一个良好且可靠的系统,正如我上面提到的,对于您要解决的问题,该系统可能不是最佳(甚至可行)的解决方案。