为什么Spacy api 版和网页版结果不一样?
Why Spacy api version and web version results are different?
我对 pos_ 标签(词性标签)使用 spacy,这是我非常简单的方法:
import spacy
model=spacy.load('en_core_web_sm')
for i in model('I want so sit on Dining table set.'):
print((i,i.pos_))
输出为:
(I, 'PRON')
(want, 'VERB')
(so, 'ADV')
(sit, 'VERB')
(on, 'ADP')
(Dining, 'PROPN')
(table, 'NOUN')
(set, 'VERB')
(., 'PUNCT')
现在,如果我转到 spacy 的 web version 并给出相同的查询,那么我会得到这样的结果:
为什么 Dining
在导入版本模型中是 PROPN
而在网络版本中是 Noun
.
当两个模型相同时,我的困惑就在这里,为什么我没有得到网络版本的结果?网络版结果更正确,这是我的预期输出。
如果我没看错,那是因为网络版每天都在经历许多查询,这就是为什么它会根据这些查询更新其权重,这就是为什么它更智能?或者我的假设没有任何意义?
我想使用 bs4 或 selenium 和 phanthon 来使用网络版本的结果,但这不是正确的方法。我如何才能获得网页版结果?
en_core_web_sm
是默认的最小英文模型。
Web 版本可能使用更大的模型
en_core_web_md
。
试试看,你会得到类似的结果。模型越大,准确率越高。
此处可用型号列表:
https://spacy.io/usage/models#available
只需点击右上角的设置并禁用折叠短语和折叠标点符号,您就会得到相同的结果
我对 pos_ 标签(词性标签)使用 spacy,这是我非常简单的方法:
import spacy
model=spacy.load('en_core_web_sm')
for i in model('I want so sit on Dining table set.'):
print((i,i.pos_))
输出为:
(I, 'PRON')
(want, 'VERB')
(so, 'ADV')
(sit, 'VERB')
(on, 'ADP')
(Dining, 'PROPN')
(table, 'NOUN')
(set, 'VERB')
(., 'PUNCT')
现在,如果我转到 spacy 的 web version 并给出相同的查询,那么我会得到这样的结果:
为什么 Dining
在导入版本模型中是 PROPN
而在网络版本中是 Noun
.
当两个模型相同时,我的困惑就在这里,为什么我没有得到网络版本的结果?网络版结果更正确,这是我的预期输出。
如果我没看错,那是因为网络版每天都在经历许多查询,这就是为什么它会根据这些查询更新其权重,这就是为什么它更智能?或者我的假设没有任何意义?
我想使用 bs4 或 selenium 和 phanthon 来使用网络版本的结果,但这不是正确的方法。我如何才能获得网页版结果?
en_core_web_sm
是默认的最小英文模型。
Web 版本可能使用更大的模型
en_core_web_md
。
试试看,你会得到类似的结果。模型越大,准确率越高。
此处可用型号列表:
https://spacy.io/usage/models#available
只需点击右上角的设置并禁用折叠短语和折叠标点符号,您就会得到相同的结果