Spacy - 将令牌类型转换为列表
Spacy - Convert Token type into list
我在具有类型的 spacy 中执行操作后得到的元素很少
输入-
li = ['India', 'Australia', 'Brazil']
for i in li:
print(type(i))
输出:
<class 'spacy.tokens.token.Token'>
<class 'spacy.tokens.token.Token'>
<class 'spacy.tokens.token.Token'>
我想将列表中的所有元素都设为str类型进行迭代。
预期输出 -
li = ['India', 'Australia', 'Brazil']
for i in li:
print(type(i))
输出
<class 'str'>
<class 'str'>
<class 'str'>
请推荐一些优化方法..
Spacy 令牌有 attribute called text
。
这是一个完整的例子:
import spacy
nlp = spacy.load('en_core_web_sm')
t = (u"India Australia Brazil")
li = nlp(t)
for i in li:
print(i.text)
或者如果您希望将标记列表作为字符串列表:
list_of_strings = [i.text for i in li]
我在具有类型的 spacy 中执行操作后得到的元素很少 输入-
li = ['India', 'Australia', 'Brazil']
for i in li:
print(type(i))
输出:
<class 'spacy.tokens.token.Token'>
<class 'spacy.tokens.token.Token'>
<class 'spacy.tokens.token.Token'>
我想将列表中的所有元素都设为str类型进行迭代。 预期输出 -
li = ['India', 'Australia', 'Brazil']
for i in li:
print(type(i))
输出
<class 'str'>
<class 'str'>
<class 'str'>
请推荐一些优化方法..
Spacy 令牌有 attribute called text
。
这是一个完整的例子:
import spacy
nlp = spacy.load('en_core_web_sm')
t = (u"India Australia Brazil")
li = nlp(t)
for i in li:
print(i.text)
或者如果您希望将标记列表作为字符串列表:
list_of_strings = [i.text for i in li]