解析播客文件

Parse through Podcast Files

我正在进行一个可以从 Podcast 中提取信息的项目。我想下载所有可用的 .mp3 或 .wav 播客,这样我就可以分析它们并通过语音识别传递它,这样我就可以从每一集中提取我需要的内容。

我一直在寻找从播客下载文件的选项,但似乎所有可能的方式都不是 'legal' 或者不确定是否有办法让我下载每个文件可用文件而不违反任何规则。在 python 中有没有简单的方法来做到这一点?我正在寻找的 Podcast 可在 Spotify、Apple Podcast 和 Google Podcast 上找到。

此外,如果您有一个很好的语音识别库或将音频转换为文字,将不胜感激。

谢谢!

有一个库叫做:spotify-dl

https://pypi.org/project/spotify-dl/

这应该可以帮助您开始解析播客文件:

https://github.com/SathyaBhat/spotify-dl#how-do-i-get-this-thing-running