spacy 的 token vectors 中使用的模型架构是什么(英文)

What is the model architecture used in spacy's token vectors (english)

我很可能遗漏了一些明显的东西,但是 approach/model 是用来在 spacy 的英文媒体模型中训练 Token 向量的吗?是word2vec吗?深度学习架构?只是好奇用什么来估计这些嵌入。

英文向量为GloVe Common Crawl向量。大多数其他语言都有来自 OSCAR Common Crawl + Wikipedia 的自定义 fastText 向量。这些来源应该包含在模型元数据中,但看起来 3.0.0 模型发布中不小心遗漏了矢量信息。