文本挖掘和机器学习

Text mining and Machine learning

我有一个单词和文本的数据集,我想创建聚类(通过 K 均值)或任何其他 unsupervised/supervised 学习方法来区分单词,例如,单词 'John' 将是分类为姓名(并将与其他人名聚类),'brazil' 作为地点等... 有没有我可以用来解决问题的模型。 我听说过 N-gram,但我不知道如何在 x、y 图等上绘制 Ngram 概率
P.S如果你有任何例子会很棒

word2vec 和嵌入怎么样?
https://deeplearning4j.org/word2vec