为什么Spacy api 版和网页版结果不一样？

Question

我对 pos_ 标签（词性标签）使用 spacy，这是我非常简单的方法：

import spacy
model=spacy.load('en_core_web_sm')

for i in model('I want so sit on Dining table set.'):
    print((i,i.pos_))

输出为：

(I, 'PRON')
(want, 'VERB')
(so, 'ADV')
(sit, 'VERB')
(on, 'ADP')
(Dining, 'PROPN')
(table, 'NOUN')
(set, 'VERB')
(., 'PUNCT')

现在，如果我转到 spacy 的 web version 并给出相同的查询，那么我会得到这样的结果：

为什么 Dining 在导入版本模型中是 PROPN 而在网络版本中是 Noun .

当两个模型相同时，我的困惑就在这里，为什么我没有得到网络版本的结果？网络版结果更正确，这是我的预期输出。

如果我没看错，那是因为网络版每天都在经历许多查询，这就是为什么它会根据这些查询更新其权重，这就是为什么它更智能？或者我的假设没有任何意义？

我想使用 bs4 或 selenium 和 phanthon 来使用网络版本的结果，但这不是正确的方法。我如何才能获得网页版结果？

Answer 1

en_core_web_sm 是默认的最小英文模型。 Web 版本可能使用更大的模型 en_core_web_md。试试看，你会得到类似的结果。模型越大，准确率越高。此处可用型号列表： https://spacy.io/usage/models#available

Answer 2

只需点击右上角的设置并禁用折叠短语和折叠标点符号，您就会得到相同的结果

Why Spacy api version and web version results are different?