为什么Spacy api 版和网页版结果不一样?

Why Spacy api version and web version results are different?

我对 pos_ 标签(词性标签)使用 spacy,这是我非常简单的方法:

import spacy
model=spacy.load('en_core_web_sm')

for i in model('I want so sit on Dining table set.'):
    print((i,i.pos_))

输出为:

(I, 'PRON')
(want, 'VERB')
(so, 'ADV')
(sit, 'VERB')
(on, 'ADP')
(Dining, 'PROPN')
(table, 'NOUN')
(set, 'VERB')
(., 'PUNCT')

现在,如果我转到 spacy 的 web version 并给出相同的查询,那么我会得到这样的结果:

为什么 Dining 在导入版本模型中是 PROPN 而在网络版本中是 Noun .

当两个模型相同时,我的困惑就在这里,为什么我没有得到网络版本的结果?网络版结果更正确,这是我的预期输出。

如果我没看错,那是因为网络版每天都在经历许多查询,这就是为什么它会根据这些查询更新其权重,这就是为什么它更智能?或者我的假设没有任何意义?

我想使用 bs4 或 selenium 和 phanthon 来使用网络版本的结果,但这不是正确的方法。我如何才能获得网页版结果?

en_core_web_sm 是默认的最小英文模型。 Web 版本可能使用更大的模型 en_core_web_md。 试试看,你会得到类似的结果。模型越大,准确率越高。 此处可用型号列表: https://spacy.io/usage/models#available

只需点击右上角的设置并禁用折叠短语和折叠标点符号,您就会得到相同的结果