从负面数据集中分别识别正面和负面
Identifying positivity and negativity separately from a negative dataset
首先,我想让您知道我是机器学习 (ML) 的新手。我正在从事一个项目,该项目检测一组单词的 正面或负面 可以如何,因此我创建了一个包含可能的 负面 单词的数据库。这样 ML 就可以发生并预测整个词组 正面或负面 的总体得分。
我的问题是是否可以在数据集中仅用 negative 词对 positive 词进行分类?如果可以的话会影响预测的准确性吗?
不,这通常是不可能的。该模型将无法区分(1)新的否定短语; (2) 中性词组; (3)积极的短语。事实上,只有否定短语,模型将很难学习 "bad" 和 "not bad" 是相反的,因为它已经在否定文献中看到了大量的 "not" 引用,例如"not worth watching, even for free."
首先,我想让您知道我是机器学习 (ML) 的新手。我正在从事一个项目,该项目检测一组单词的 正面或负面 可以如何,因此我创建了一个包含可能的 负面 单词的数据库。这样 ML 就可以发生并预测整个词组 正面或负面 的总体得分。 我的问题是是否可以在数据集中仅用 negative 词对 positive 词进行分类?如果可以的话会影响预测的准确性吗?
不,这通常是不可能的。该模型将无法区分(1)新的否定短语; (2) 中性词组; (3)积极的短语。事实上,只有否定短语,模型将很难学习 "bad" 和 "not bad" 是相反的,因为它已经在否定文献中看到了大量的 "not" 引用,例如"not worth watching, even for free."