与文本分类中的 LSTM 相比,CNN 给我更好的准确性是正常的吗?
it is normal that CNN give me better accuracy compared to LSTM in text classification?
For a text classification, I have data of 1000 reviews and I tried different neural networks. For the CNN I got an accuracy of 0.94 but with the LSTM I got a lower accuracy (0.88) is this normal because as far as I know the LSTM is specialized for text classification and it preserves the order of the word sequence?
是的,这并不反常,很多研究都表明了这一点。
这些模型的性能取决于许多因素,例如您拥有的数据和您处理的任务。
例如,如果您的任务更关心检测一些实质性特征(如情绪),CNN 可以表现良好。
但是,当数据的顺序方面很重要时,基于 RNN 的模型可以显示出它们的优势,例如在机器翻译和文本摘要任务中。
我不相信“专门用于文本分类的 LSTM”是真的。最好说 LSTM 专门学习顺序数据。 LSTM 可以很好地学习文本和标记之间的关系,但是您定义的任务可能并不关心这些语言特征。例如,在情感分类中,模型(如 CNN)可以只关心某些词的存在并取得良好的结果。
For a text classification, I have data of 1000 reviews and I tried different neural networks. For the CNN I got an accuracy of 0.94 but with the LSTM I got a lower accuracy (0.88) is this normal because as far as I know the LSTM is specialized for text classification and it preserves the order of the word sequence?
是的,这并不反常,很多研究都表明了这一点。
这些模型的性能取决于许多因素,例如您拥有的数据和您处理的任务。
例如,如果您的任务更关心检测一些实质性特征(如情绪),CNN 可以表现良好。
但是,当数据的顺序方面很重要时,基于 RNN 的模型可以显示出它们的优势,例如在机器翻译和文本摘要任务中。
我不相信“专门用于文本分类的 LSTM”是真的。最好说 LSTM 专门学习顺序数据。 LSTM 可以很好地学习文本和标记之间的关系,但是您定义的任务可能并不关心这些语言特征。例如,在情感分类中,模型(如 CNN)可以只关心某些词的存在并取得良好的结果。