CTC:space 和空白有什么区别?
CTC: What is the difference between space and blank?
在 2006 年 article 关于联结主义时间分类的文章中,Alex Graves & co。引入了一种带有 27 标签的解码语音模型:26 个用于字母表字母,一个用于 blank,意思是没有标签(我理解为 沉默).
但是,我看到很多使用 28 标签的 CTC 实现,一个是 blank,另一个是 space。到目前为止,我还没有找到需要使用这两个标签的解释,对我来说,它们代表同一件事。
您能否解释一下 CTC 上下文中空白和 space 之间的区别以及为什么需要这两种标签?
In Connectionist Temporal Classification space is just a
whitespace and blank is '-' which we use to solve the repeated
reoccurrence of the data. for example "pizza" will be encoded as
"piz-za".
TLDR;
参考:https://towardsdatascience.com/beam-search-decoding-in-ctc-trained-neural-networks-5a889a3d85a7
CTC 中存在如何对重复字符进行编码的问题。它通过引入一个伪字符(称为空白,但不要将它与“真正的”空白混淆,即白色-space 字符)来解决。该特殊字符在文中将以“-”表示。我们使用巧妙的编码模式来解决重复字符问题:在对文本进行编码时,我们可以在任何位置插入任意多个空格,在解码时将删除这些空格。但是,我们必须在重复字符之间插入一个空格,例如“hello”。此外,我们可以根据需要重复每个字符。
让我们看一些例子:
“到”→“---tttttooo”,或“-t-o-”,或“到”
“too”→“---ttttto-o”,或“-t-o-o-”,或“to-o”,但不是“too”
如您所见,此模式还允许我们轻松地为同一文本创建不同的对齐方式,例如“t-o”、“too”和“-to”都代表相同的文本(“to”),但与图像的对齐方式不同。 NN 被训练为输出编码文本(在 NN 输出矩阵中编码)。
在 2006 年 article 关于联结主义时间分类的文章中,Alex Graves & co。引入了一种带有 27 标签的解码语音模型:26 个用于字母表字母,一个用于 blank,意思是没有标签(我理解为 沉默).
但是,我看到很多使用 28 标签的 CTC 实现,一个是 blank,另一个是 space。到目前为止,我还没有找到需要使用这两个标签的解释,对我来说,它们代表同一件事。
您能否解释一下 CTC 上下文中空白和 space 之间的区别以及为什么需要这两种标签?
In Connectionist Temporal Classification space is just a whitespace and blank is '-' which we use to solve the repeated reoccurrence of the data. for example "pizza" will be encoded as "piz-za".
TLDR;
参考:https://towardsdatascience.com/beam-search-decoding-in-ctc-trained-neural-networks-5a889a3d85a7
CTC 中存在如何对重复字符进行编码的问题。它通过引入一个伪字符(称为空白,但不要将它与“真正的”空白混淆,即白色-space 字符)来解决。该特殊字符在文中将以“-”表示。我们使用巧妙的编码模式来解决重复字符问题:在对文本进行编码时,我们可以在任何位置插入任意多个空格,在解码时将删除这些空格。但是,我们必须在重复字符之间插入一个空格,例如“hello”。此外,我们可以根据需要重复每个字符。 让我们看一些例子: “到”→“---tttttooo”,或“-t-o-”,或“到” “too”→“---ttttto-o”,或“-t-o-o-”,或“to-o”,但不是“too” 如您所见,此模式还允许我们轻松地为同一文本创建不同的对齐方式,例如“t-o”、“too”和“-to”都代表相同的文本(“to”),但与图像的对齐方式不同。 NN 被训练为输出编码文本(在 NN 输出矩阵中编码)。