已经是 0 和 1 的二进制文本分类的单热编码标签?
One-hot encoding labels for binary text classification that are already 0s and 1s?
我正在做一个简单的二进制文本分类,我的标签数据已经是格式 0 和 1。我想知道我是否还需要执行一次性编码以便它们处于 [0 ,1] 和 [1,0] 格式?
当我将标签输入我的 Keras Sequential()
模型作为 <class 'numpy.ndarray'>
时,它适用于模型并且我获得了不错的准确性。但我还是想知道我是否应该预先对它们进行单热编码?
它对二进制情况应该没有帮助,因为二进制列已经有两个值。如果您将一个二进制编码为两列,您将向没有信息的列添加一个额外的二进制列。
因此,hot-encode 二进制列没有意义,并且在您的上下文中会导致无用的冗余。
我正在做一个简单的二进制文本分类,我的标签数据已经是格式 0 和 1。我想知道我是否还需要执行一次性编码以便它们处于 [0 ,1] 和 [1,0] 格式?
当我将标签输入我的 Keras Sequential()
模型作为 <class 'numpy.ndarray'>
时,它适用于模型并且我获得了不错的准确性。但我还是想知道我是否应该预先对它们进行单热编码?
它对二进制情况应该没有帮助,因为二进制列已经有两个值。如果您将一个二进制编码为两列,您将向没有信息的列添加一个额外的二进制列。
因此,hot-encode 二进制列没有意义,并且在您的上下文中会导致无用的冗余。