创建同义词并使用正则表达式查找关键字

Create synonyms and use regular expressions to find keyword

背景:

我想用正则表达式来搜索关键字。但是,我的关键字有多个同义词。例如,关键字 positive 可以包含以下我认为等于 positive 的词: "+", "pos", "POS", "Positive", "POSITIVE"

我试过寻找 and http://www.nltk.org/howto/wordnet.html 但我认为这不是我要找的东西

目标:

1) 为给定关键字创建同义词(例如 positive

2) 使用正则表达式在语料库中搜索关键字(例如positive

示例:

toy_corpus = 'patient is POS which makes them ideal to treatment '

我认为获得它的步骤如下所示:

1) 定义 positive 的同义词 例如positive = ["pos", "POS", "Positive", "POSITIVE", "+"]

2) 使用正则表达式查找关键字POS

问题

我该如何实现这一目标?

试一试:

import re
question = "patient is POS which makes them ideal to treatment. And the the positive"
find=["pos","POS","positive"]

words=re.findall("\n+",question)
result = [words   for words in find if words in question.split()]
print(result)
['POS', 'positive']

其中 \n 是单词边界。 维基:word boundary 更多示例:whosebug.com 最好的问候!