为自定义数据集训练 Wav2Vec-U

Train Wav2Vec-U for a custom dataset

我找到了 Wav2Vec-U 的 github 回购协议,但没有详细记录。我想知道是否有任何火车程序。我正在尝试使用普通语音音频对其进行训练。但它需要 wrd、ltr 和 phn 文件,我无法访问这些文件。

目前最好(唯一?)相关的文章是 this notebook hosted on Kaggle. In the comments section of that notebook, there is a link to another notebook,它与您问题的 wrd, ltr, and phn files 部分特别相关。