使用阿拉伯语 WordNet 作为 python 中的同义词?
Using Arabic WordNet for synonyms in python?
我正在尝试获取句子中阿拉伯语单词的同义词
如果这个单词是英文的,它可以完美地工作,并且结果以阿拉伯语显示,我想知道是否可以立即获得阿拉伯语单词的同义词而不用先用英语写它。
我试过了,但没有用,我更喜欢没有塔什干 انتظار 而不是 اِцْتِظار
from nltk.corpus import wordnet as omw
jan = omw.synsets('انتظار ')[0]
print(jan)
print(jan.lemma_names(lang='arb'))
nltk 中使用的 Wordnet 不支持阿拉伯语。如果您正在寻找 那么这是完全不同的事情。
对于阿拉伯语 wordnet,下载:
你运行它与:
$ python AWNDatabaseManagement.py -i upc_db.xml
现在得到类似 wn.synset('إنتظار')
的东西。 Arabic Wordnet 有一个函数 wn.get_synsets_from_word(word)
,但它给出了偏移量。它还只接受数据库中发出的单词。例如,您应该将 جَمِيل
用于 جميل
:
>> wn.get_synsets_from_word(u"جَمِيل")
[(u'a', u'300218842')]
300218842
是 جميل 同义词集的偏移量。
我检查了 إنتظار 这个词,它似乎不存在于 AWN 中。
有关使用 AWN 获取同义词的更多详细信息。
我正在尝试获取句子中阿拉伯语单词的同义词
如果这个单词是英文的,它可以完美地工作,并且结果以阿拉伯语显示,我想知道是否可以立即获得阿拉伯语单词的同义词而不用先用英语写它。
我试过了,但没有用,我更喜欢没有塔什干 انتظار 而不是 اِцْتِظار
from nltk.corpus import wordnet as omw
jan = omw.synsets('انتظار ')[0]
print(jan)
print(jan.lemma_names(lang='arb'))
nltk 中使用的 Wordnet 不支持阿拉伯语。如果您正在寻找
对于阿拉伯语 wordnet,下载:
你运行它与:
$ python AWNDatabaseManagement.py -i upc_db.xml
现在得到类似 wn.synset('إنتظار')
的东西。 Arabic Wordnet 有一个函数 wn.get_synsets_from_word(word)
,但它给出了偏移量。它还只接受数据库中发出的单词。例如,您应该将 جَمِيل
用于 جميل
:
>> wn.get_synsets_from_word(u"جَمِيل")
[(u'a', u'300218842')]
300218842
是 جميل 同义词集的偏移量。
我检查了 إنتظار 这个词,它似乎不存在于 AWN 中。
有关使用 AWN 获取同义词的更多详细信息