LibriSpeecch 数据集的 dev-clean 文件夹

dev-clean folder of LibriSpeecch Dataset

我正在研究 LibriSpeech Dev-Clean 数据集。 我无法理解数据集的结构。 我确实知道 dev-clean 文件夹下的 84、1272 等目录代表扬声器的 ID。 但是子文件夹代表什么?

我的意思是如果我们查看 dev-clean 文件夹下的 1272 目录,它又分为 3 个文件夹,即 - 128104、135031、141231。

这对我来说似乎是模棱两可的。有什么想法吗?

Librispeech 是由一定数量的演讲者从有声读物中制作出来的。 1272 是发言人 ID。 128104、135031、141231 是图书 ID。 每个文件夹内都有与某本书相关的录音。