文本挖掘和机器学习

Text mining and Machine learning

nlp
cluster-analysis
machine-learning
named-entity-recognition
text-mining

我有一个单词和文本的数据集，我想创建聚类（通过 K 均值）或任何其他 unsupervised/supervised 学习方法来区分单词，例如，单词 'John' 将是分类为姓名（并将与其他人名聚类），'brazil' 作为地点等... 有没有我可以用来解决问题的模型。我听说过 N-gram，但我不知道如何在 x、y 图等上绘制 Ngram 概率
P.S如果你有任何例子会很棒

word2vec 和嵌入怎么样？
https://deeplearning4j.org/word2vec

文本挖掘和机器学习

Text mining and Machine learning

nlp

cluster-analysis

machine-learning

named-entity-recognition

text-mining