使用 nltk 从文本中删除同义词
remove synonym words from text using nltk
所以这可能是一个业余问题,但是有没有办法使用 nltk 从文本(或与此相关的列表)中删除同义词?
通过同义词,我也指相同的词以不同的方式写成:
70 年代和 70 年代和 70_s
或者狗和猎犬
我真的很感激一些通用指南或指向我的教程(我找不到任何教程)。
提前致谢
我设法使用 wordnet.synsets
删除重复项以获取同义词,然后遍历列表以删除重复项。我确信有比遍历列表更复杂的方法,但它对我来说效果很好。
所以这可能是一个业余问题,但是有没有办法使用 nltk 从文本(或与此相关的列表)中删除同义词?
通过同义词,我也指相同的词以不同的方式写成:
70 年代和 70 年代和 70_s
或者狗和猎犬
我真的很感激一些通用指南或指向我的教程(我找不到任何教程)。
提前致谢
我设法使用 wordnet.synsets
删除重复项以获取同义词,然后遍历列表以删除重复项。我确信有比遍历列表更复杂的方法,但它对我来说效果很好。