文本挖掘和机器学习
Text mining and Machine learning
我有一个单词和文本的数据集,我想创建聚类(通过 K 均值)或任何其他 unsupervised/supervised 学习方法来区分单词,例如,单词 'John' 将是分类为姓名(并将与其他人名聚类),'brazil' 作为地点等...
有没有我可以用来解决问题的模型。
我听说过 N-gram,但我不知道如何在 x、y 图等上绘制 Ngram 概率
P.S如果你有任何例子会很棒
word2vec 和嵌入怎么样?
https://deeplearning4j.org/word2vec
我有一个单词和文本的数据集,我想创建聚类(通过 K 均值)或任何其他 unsupervised/supervised 学习方法来区分单词,例如,单词 'John' 将是分类为姓名(并将与其他人名聚类),'brazil' 作为地点等...
有没有我可以用来解决问题的模型。
我听说过 N-gram,但我不知道如何在 x、y 图等上绘制 Ngram 概率
P.S如果你有任何例子会很棒
word2vec 和嵌入怎么样?
https://deeplearning4j.org/word2vec