AutoModelForSequenceClassification 与 AutoModel 之间有什么区别
What are differences between AutoModelForSequenceClassification vs AutoModel
我们可以从 AutoModel(TFAutoModel) 函数创建模型:
from transformers import AutoModel
model = AutoModel.from_pretrained('distilbert-base-uncase')
另一方面,模型由 AutoModelForSequenceClassification(TFAutoModelForSequenceClassification) 创建:
from transformers import AutoModelForSequenceClassification
model = AutoModelForSequenceClassification('distilbert-base-uncase')
据我所知,这两个模型都使用 distilbert-base-uncase 库来创建模型。
根据方法名称,第二个 class( AutoModelForSequenceClassification ) 是为序列分类创建的。
但是 2 classes 的真正区别是什么?以及如何正确使用它们?
(我在huggingface里面搜过,不清楚)
AutoModel 和 AutoModelForSequenceClassification 模型的区别在于 AutoModelForSequenceClassification 在模型输出之上有一个分类头,可以很容易地用基础模型进行训练
我们可以从 AutoModel(TFAutoModel) 函数创建模型:
from transformers import AutoModel
model = AutoModel.from_pretrained('distilbert-base-uncase')
另一方面,模型由 AutoModelForSequenceClassification(TFAutoModelForSequenceClassification) 创建:
from transformers import AutoModelForSequenceClassification
model = AutoModelForSequenceClassification('distilbert-base-uncase')
据我所知,这两个模型都使用 distilbert-base-uncase 库来创建模型。 根据方法名称,第二个 class( AutoModelForSequenceClassification ) 是为序列分类创建的。
但是 2 classes 的真正区别是什么?以及如何正确使用它们?
(我在huggingface里面搜过,不清楚)
AutoModel 和 AutoModelForSequenceClassification 模型的区别在于 AutoModelForSequenceClassification 在模型输出之上有一个分类头,可以很容易地用基础模型进行训练