文本分类和特征选择有什么区别

what is the difference between text classification and feature selection

我们可以 select 没有分类的特征吗?如果我有文本,我怎么知道要选择哪些特征?我需要关于文本而不是真实单词对象示例的示例。如果有人可以解释一下吗?

文本分类是根据文本的特征对文本进行分类。例如,您可以将一个句子分类为具有正面 ("I am so happy") 或负面 ("I am so sad") 情绪。

文本特征选择有效地决定了您希望如何对文本进行编码,以便您可以 运行 通过分类器。有很多方法可以做到这一点。例如,您可以使用一袋单词表示,其中每一列代表您词汇表中的一个单词,每个单元格代表该单词在文档中出现的次数。

如果你有两个句子,"I am so happy, so very happy" 和 "I am so sad",你对句子的编码可能是

|我||我 |所以 |快乐 |非常 |悲伤 |

            1. 0。
            1. 1.