Spacy 中按语言分类的标签方案

Label schemes by language in Spacy

来自Spacy documentation

For a list of the fine-grained and coarse-grained part-of-speech tags assigned by spaCy’s models across different languages, see the label schemes documented in the models directory.

我假设这是指 parts of speech tags,例如:VERBNOUNNUM 等,并且此列表对于每种语言都不同.

这是一个正确的假设吗?

我遵循文档 to the models directory 中的 link,但找不到每种语言的有效 POS 标签列表。

https://spacy.io/usage/linguistic-features#pos-tagging

回答

感谢@polm23 的回答,这是导航的屏幕截图,以防其他人找不到它。

在页面上查找任何一种语言的“标签方案”。

.pos 属性中的 VERB NOUN 类型标签来自 Universal Dependencies,并且在不同语言之间基本相同。 .tag 属性的粗粒度标签可以是任何东西,据我所知,每种语言都是唯一的。