将 bert 作为子模块添加到我的 git 存储库后找不到错误 "version"

Error "version" not found after adding bert as a submodule to my git repo

将BERT添加为子模块后,无法使用,配置文件中缺少版本信息。这些是主要步骤:

1- 我使用 git submodule add https://huggingface.co/bert-base-multilingual-uncased 命令将其作为子模块添加到我的存储库中 2- 我把它放在一个名为:pretrained/mbert/ 的目录中 3- 我使用以下代码来使用它:

from sentence_transformers import SentenceTransformer


def embed_text(sentences, pretrained="../pretrained/mbert/bert-base-multilingual-cased"): 
    """
    Computes the embeddings of the different sentences in input.
    :param sentences: list, of sentences
    :param pretrained: str, the pretrained bert model
    :return: list, of list
    """

    model = SentenceTransformer(pretrained) 
    sentence_embeddings = model.encode(sentences)

    return [arr.tolist() for arr in sentence_embeddings]

我遇到以下错误:

model = SentenceTransformer(pretrained)  
  File "C:\ProgramData\Anaconda3\lib\site-packages\sentence_transformers\SentenceTransformer.py", line 104, in __init__
    if config['__version__'] > __version__:
KeyError: '__version__'

不能直接使用,模型从huggingface.co下载。看到这个 issue,模型文件夹框架在使用 transformer 训练的 PTM 和使用 sentence-transformer 训练的 PTM 之间是不同的。

对于使用句子变换器训练的 PTM,

The folder should consist these files:
0_Transformer/
1_Pooling/
config.json
modules.json