Python 词形还原输入列表,return 输出列表

Python Lemmatizing input list, return output list

我有一个列表,其中包含要进行词形还原的字符串。尽管我可以对所有字符串进行词形还原,但我很难以输入到词形还原器的相同列表格式返回词形还原后的字符串。

对每个输出进行类型化,我得到一个 unicode 和 str 对象。我尝试将 unicode 转换为字符串并尝试将字符串连接到列表但没有成功。

下面是可重现的代码:

typea = ['colors', 'caresses', 'ponies', 'presumably', 'owed', 'says']
for i in xrange(0,len(typea)):
    # Lemmatize the words
    lemmatized_words = lmtzr.lemmatize(typea[i])
    print lemmatized_words

    #Output obtained: 
    color
    caress
    pony
    presumably
    owed
    say
    #Desired output
    #['color', 'caress', 'pony', 'presumably', 'owed', 'say']

lmtzr.lemmatize 接受单个字符串,returns 接受单个字符串。所以 lemmatized_words 一次将是一个字符串。

要对所有单词进行词形还原并将它们存储在列表中,您需要这样的东西:

typea = ['colors', 'caresses', 'ponies', 'presumably', 'owed', 'says']
lemmatized_words = [lmtzr.lemmatize(x) for x in typea]
print lemmatized_words