AutoModelForSequenceClassification 与 AutoModel 之间有什么区别

What are differences between AutoModelForSequenceClassification vs AutoModel

我们可以从 AutoModel(TFAutoModel) 函数创建模型:

from transformers import AutoModel 
model = AutoModel.from_pretrained('distilbert-base-uncase')

另一方面,模型由 AutoModelForSequenceClassification(TFAutoModelForSequenceClassification) 创建:

from transformers import AutoModelForSequenceClassification
model = AutoModelForSequenceClassification('distilbert-base-uncase')

据我所知,这两个模型都使用 distilbert-base-uncase 库来创建模型。 根据方法名称,第二个 class( AutoModelForSequenceClassification ) 是为序列分类创建的。

但是 2 classes 的真正区别是什么?以及如何正确使用它们?

(我在huggingface里面搜过,不清楚)

AutoModel 和 AutoModelForSequenceClassification 模型的区别在于 AutoModelForSequenceClassification 在模型输出之上有一个分类头,可以很容易地用基础模型进行训练