二进制相关性和一次热编码之间的区别?
Difference between binary relevance and one hot encoding?
二元相关性是一种众所周知的处理多标签分类问题的技术,我们在其中为特征的每个可能值训练一个二元分类器:
http://link.springer.com/article/10.1007%2Fs10994-011-5256-5
另一方面,在自然语言处理中通常使用一个热编码器(OHE)来编码将多个值作为二进制向量的分类特征:
http://cs224d.stanford.edu/lecture_notes/LectureNotes1.pdf
我们可以认为这两个概念是同一个概念吗?还是存在技术差异?
两种方法不同。
1. One-Hot 编码
在one-hot编码中,考虑向量。
上图表示二进制class化问题。
2。二元相关性
在二进制相关性中,我们不考虑向量。下图表示使用使用标量值的二进制相关方法的 class 标签生成。
二元相关性是一种众所周知的处理多标签分类问题的技术,我们在其中为特征的每个可能值训练一个二元分类器:
http://link.springer.com/article/10.1007%2Fs10994-011-5256-5
另一方面,在自然语言处理中通常使用一个热编码器(OHE)来编码将多个值作为二进制向量的分类特征:
http://cs224d.stanford.edu/lecture_notes/LectureNotes1.pdf
我们可以认为这两个概念是同一个概念吗?还是存在技术差异?
两种方法不同。
1. One-Hot 编码
在one-hot编码中,考虑向量。
上图表示二进制class化问题。
2。二元相关性
在二进制相关性中,我们不考虑向量。下图表示使用使用标量值的二进制相关方法的 class 标签生成。