Spacy - 将令牌类型转换为列表

Spacy - Convert Token type into list

我在具有类型的 spacy 中执行操作后得到的元素很少 输入-

li = ['India', 'Australia', 'Brazil']
for i in li:
    print(type(i))

输出:

<class 'spacy.tokens.token.Token'>

<class 'spacy.tokens.token.Token'>

<class 'spacy.tokens.token.Token'>

我想将列表中的所有元素都设为str类型进行迭代。 预期输出 -

li = ['India', 'Australia', 'Brazil']
for i in li:
    print(type(i))

输出

<class 'str'>

<class 'str'>

<class 'str'>

请推荐一些优化方法..

Spacy 令牌有 attribute called text。 这是一个完整的例子:

import spacy
nlp = spacy.load('en_core_web_sm')
t = (u"India Australia Brazil")
li = nlp(t)
for i in li:
    print(i.text)

或者如果您希望将标记列表作为字符串列表:

list_of_strings  = [i.text for i in li]