您如何实施 SVoice?

How do you implement SVoice?

我正在尝试使用 Facebook 的 SVoice 在我的音频文件中使用 python 拆分不同的扬声器。我在这里找到了一个实现它的库:

https://github.com/facebookresearch/svoice

但是,我在 运行 上遇到了麻烦。自述文件讨论了如何训练我自己的数据集,这是我无法真正做到的,因为我没有在我自己的音频文件中解析出噪音。它还讨论了如何使用模型文件夹中的模型之一分离我自己的文件,但是当我尝试按照自述文件并从玩具数据集创建模型时出现以下错误:

File "/mnt/c/Users/imrea/PycharmProjects/svoice/svoice/data/audio.py", line 34, in find_audio_files
    siginfo, _ = torchaudio.info(file)
TypeError: cannot unpack non-iterable AudioMetaData object

我如何运行测试我自己的音频文件的输出?有人用过这个吗?任何指导将不胜感激!

您需要 torchaudio 版本 0.6.0 尝试: pip 安装 torch==1.6.0+cu101 torchvision==0.7.0+cu101 torchaudio==0.6.0 -f https://download.pytorch.org/whl/torch_stable.html 这对我有用。