为 Windows 设置 kenlm

Set up kenlm for Windows

官方 website makes it pretty clear that there is no support for kenlm in Windows. There is a Windows tag at the github repository 但它似乎由当时和那里的少数随机贡献者维护。

那么Windows如何设置kenlm呢?

解决方案是通过 Windows 子系统在 Windows 中使用 Ubuntu Linux

  1. Get WSL Windows
  2. 从您的 ubuntu bash 导航到您要进行设置的文件夹。您可以从 /mnt/c/ 文件夹访问 Windows 文件系统,您可以在根目录中找到该文件夹​​。
  3. 从那里只需遵循 official instructions,即克隆 git 存储库,然后 运行 cmake .. & make -j2 以构建项目(首先在您的 Ubuntu 系统中进行必要的安装之后)。

显然,您必须训练模型或 scorers using the Linux bash. You can also use these models from Windows using the kenlm python library

例如

deepspeech-model 构建记分器的两个步骤 here 应该从您的 Ubuntu 系统执行。但是在你有了记分员之后你应该能够运行命令

deepspeech --model deepspeech-0.9.3-models.pbmm --scorer kenlm.scorer --audio audio.wav

来自 Windows。但是,一旦您拥有 WSL,就无需从 Windows 执行此工作。 @your Ubuntu 系统会很好地工作。

新的 DeepSpeech PlayBook 还包含有关在 Docker 容器中设置 Docker 图像和 运行 训练的说明。如果 Windows 上有 Docker,这可能是另一种解决方案。

构建新 Scorer 的信息是 still in a PR,但也可能有用。

我遇到了同样的问题,并通过从 Cygwin 终端构建 kenlm wheel 作为主页建议解决了这个问题 (pip wheel pypi-kenlm)。

我也上传了一个名为 kenlm-cygwin 的 wheel 到 pypi,但它只是 python3.7.