使用 python 及其库从给定的短文本中提取 keywords/phrases

Extract keywords/phrases from a given short text using python and its libraries

从用户给定的职位描述输入中,我需要使用 python 及其库提取关键字或短语。我乐于从社区中获得关于哪些图书馆最有效的建议和指导,如果以防万一,它很简单,请指导。

用户输入示例:

user_input = "i want a full stack developer. Specialization in python is a must".

预期输出:

keywords = ['full stack developer', 'python']

好吧,我回答了我自己的问题。无论如何感谢那些回复的人。

keys = ['python', 'full stack developer','java','machine learning']
keywords = []
for i in range(len(keys)):
    word = keys[i]
    if word in keys:
        keywords.append(word)
    else:
        continue
print(keywords) 

输出符合预期!

嗯,好的关键词设置是个好方法。但是,关键是如何构建它。有很多方法可以做到。

首先,最简单的就是搜索网络中设置的开放关键词。这取决于你的运气和你的知识。您的关键字(喜欢 "python, java, machine learing")是 Whosebug、招聘网站中的常见标签。不要违法!

第二个是IR(Information Extraction),比上一个复杂。算法有很多,比如"TextRank"、"Entropy"、"Apriori"、"HMM"、"Tf-IDF"、"Conditional Random Fields"等等。

祝你好运。

对于匹配keywords/phases,Trie Tree更快。