将 bert 作为子模块添加到我的 git 存储库后找不到错误 "version"
Error "version" not found after adding bert as a submodule to my git repo
将BERT添加为子模块后,无法使用,配置文件中缺少版本信息。这些是主要步骤:
1- 我使用 git submodule add https://huggingface.co/bert-base-multilingual-uncased
命令将其作为子模块添加到我的存储库中
2- 我把它放在一个名为:pretrained/mbert/
的目录中
3- 我使用以下代码来使用它:
from sentence_transformers import SentenceTransformer
def embed_text(sentences, pretrained="../pretrained/mbert/bert-base-multilingual-cased"):
"""
Computes the embeddings of the different sentences in input.
:param sentences: list, of sentences
:param pretrained: str, the pretrained bert model
:return: list, of list
"""
model = SentenceTransformer(pretrained)
sentence_embeddings = model.encode(sentences)
return [arr.tolist() for arr in sentence_embeddings]
我遇到以下错误:
model = SentenceTransformer(pretrained)
File "C:\ProgramData\Anaconda3\lib\site-packages\sentence_transformers\SentenceTransformer.py", line 104, in __init__
if config['__version__'] > __version__:
KeyError: '__version__'
不能直接使用,模型从huggingface.co下载。看到这个 issue,模型文件夹框架在使用 transformer 训练的 PTM 和使用 sentence-transformer 训练的 PTM 之间是不同的。
对于使用句子变换器训练的 PTM,
The folder should consist these files:
0_Transformer/
1_Pooling/
config.json
modules.json
将BERT添加为子模块后,无法使用,配置文件中缺少版本信息。这些是主要步骤:
1- 我使用 git submodule add https://huggingface.co/bert-base-multilingual-uncased
命令将其作为子模块添加到我的存储库中
2- 我把它放在一个名为:pretrained/mbert/
的目录中
3- 我使用以下代码来使用它:
from sentence_transformers import SentenceTransformer
def embed_text(sentences, pretrained="../pretrained/mbert/bert-base-multilingual-cased"):
"""
Computes the embeddings of the different sentences in input.
:param sentences: list, of sentences
:param pretrained: str, the pretrained bert model
:return: list, of list
"""
model = SentenceTransformer(pretrained)
sentence_embeddings = model.encode(sentences)
return [arr.tolist() for arr in sentence_embeddings]
我遇到以下错误:
model = SentenceTransformer(pretrained)
File "C:\ProgramData\Anaconda3\lib\site-packages\sentence_transformers\SentenceTransformer.py", line 104, in __init__
if config['__version__'] > __version__:
KeyError: '__version__'
不能直接使用,模型从huggingface.co下载。看到这个 issue,模型文件夹框架在使用 transformer 训练的 PTM 和使用 sentence-transformer 训练的 PTM 之间是不同的。
对于使用句子变换器训练的 PTM,
The folder should consist these files:
0_Transformer/
1_Pooling/
config.json
modules.json