BERT:Question-Answering - 允许的训练总数 words/tokens

Question

假设我想针对某个二进制标签 (1,0) 用 2 个句子（查询-答案）对训练 BERT，以获得答案的正确性，BERT 会让我每个使用 512 words/tokens对于查询和答案或一起（查询+答案组合）它们应该是 512？ [510 忽略 [start] 和 [sep] 标记]

提前致谢！

Answer 1

在一起，实际上应该是 509，因为有两个 [SEP]，一个在问题之后，另一个在答案之后：

[CLS] q_word1 q_word2 ... [SEP] a_word1 a_word2 ... [SEP]

其中 q_word 指的是问题中的词，a_word 指的是答案中的词

BERT:Question-Answering - Total number of permissible words/tokens for training