创建同义词并使用正则表达式查找关键字
Create synonyms and use regular expressions to find keyword
背景:
我想用正则表达式来搜索关键字。但是,我的关键字有多个同义词。例如,关键字 positive
可以包含以下我认为等于 positive
的词: "+", "pos", "POS", "Positive", "POSITIVE"
我试过寻找 and http://www.nltk.org/howto/wordnet.html 但我认为这不是我要找的东西
目标:
1) 为给定关键字创建同义词(例如 positive
)
2) 使用正则表达式在语料库中搜索关键字(例如positive
)
示例:
toy_corpus = 'patient is POS which makes them ideal to treatment '
我认为获得它的步骤如下所示:
1) 定义 positive
的同义词
例如positive
= ["pos", "POS", "Positive", "POSITIVE", "+"]
2) 使用正则表达式查找关键字POS
问题
我该如何实现这一目标?
试一试:
import re
question = "patient is POS which makes them ideal to treatment. And the the positive"
find=["pos","POS","positive"]
words=re.findall("\n+",question)
result = [words for words in find if words in question.split()]
print(result)
['POS', 'positive']
其中 \n 是单词边界。
维基:word boundary
更多示例:whosebug.com
最好的问候!
背景:
我想用正则表达式来搜索关键字。但是,我的关键字有多个同义词。例如,关键字 positive
可以包含以下我认为等于 positive
的词: "+", "pos", "POS", "Positive", "POSITIVE"
我试过寻找
目标:
1) 为给定关键字创建同义词(例如 positive
)
2) 使用正则表达式在语料库中搜索关键字(例如positive
)
示例:
toy_corpus = 'patient is POS which makes them ideal to treatment '
我认为获得它的步骤如下所示:
1) 定义 positive
的同义词
例如positive
= ["pos", "POS", "Positive", "POSITIVE", "+"]
2) 使用正则表达式查找关键字POS
问题
我该如何实现这一目标?
试一试:
import re
question = "patient is POS which makes them ideal to treatment. And the the positive"
find=["pos","POS","positive"]
words=re.findall("\n+",question)
result = [words for words in find if words in question.split()]
print(result)
['POS', 'positive']
其中 \n 是单词边界。 维基:word boundary 更多示例:whosebug.com 最好的问候!