我如何 运行 Mozilla TTS/Coqui 在 Windows 系统上使用 CUDA 进行 TTS 训练?

How can I run Mozilla TTS/Coqui TTS training with CUDA on a Windows system?

我有一台Quadro P5000显卡的机器,运行 Windows 10.我想在这个系统上训练TTS语音。我需要安装什么才能使它正常工作?

install/do:

  1. Download 并为 Windows 安装 Python 3.8( 而不是 3.9+)。在安装过程中,确保您:
  • 选择为所有用户安装。
  • 选择将 Python 添加到 PATH。
  1. Download 并安装 CUDA Toolkit 10.1(不是 11.0+)。
  2. Download "cuDNN v7.6.5 (November 5th, 2019), for CUDA 10.1" (not cuDNN v8+),解压,然后复制里面的内容cuda 文件夹到 C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v10.1.
  3. Download eSpeak NG 的最新 64 位版本(无版本限制:-))。
  4. Download Windows 的 Git 的最新 64 位版本(无版本限制:-))。
  5. 打开 PowerShell 提示符到您要安装 Coqui TTS 的文件夹。
  6. 运行 git clone https://github.com/coqui-ai/TTS.git.
  7. 运行 cd TTS.
  8. 运行 python -m venv ..
  9. 运行 .\Scripts\pip install -e ..
  10. 运行 以下命令(这与您从 the PyTorch website because of a known issue 获得的命令不同):
.\Scripts\pip install torch==1.8.0+cu101 torchvision==0.9.0+cu101 torchaudio===0.8.0 -f https://download.pytorch.org/whl/torch_stable.html
  1. 将以下内容放入 TTS 文件夹中名为“test_cuda.py”的脚本中:
import torch
x = torch.rand(5, 3)
print(x)
print(torch.cuda.is_available())
  1. 运行 通过 .\Scripts\python ./test_cuda.py 的脚本并确认输出看起来像这样(第一部分应该只有随机数,但最后一行必须读作 True;如果是不是,CUDA 没有正确安装):
tensor([[0.2141, 0.7808, 0.9298],
        [0.3107, 0.8569, 0.9562],
        [0.2878, 0.7515, 0.5547],
        [0.5007, 0.6904, 0.4136],
        [0.2443, 0.4158, 0.4245]])
True
  1. 将以下内容放入 TTS 文件夹中名为“train.bat”的脚本中,然后为您的配置文件自定义它:
set PYTHONIOENCODING=UTF-8
set PYTHONLEGACYWINDOWSSTDIO=UTF-8
set PHONEMIZER_ESPEAK_PATH=C:/Program Files/eSpeak NG/espeak-ng.exe

.\Scripts\python.exe ./TTS/bin/train_tacotron.py --config_path "C:/path/to/your/config.json"
  1. 运行 脚本来自 .\train.bat.

如果您使用的模型与 Tacotron 不同,或者需要将其他参数传递到训练脚本中,请随时进一步自定义 train.bat

如果您刚刚开始一般的 TTS 培训,请查看