教程tensorflow音频音调分析

Tutorial tensorflow audio pitch analysis

我是 tensorflow 和 Python 的初学者,我正在尝试构建一个自动检测的应用程序,在足球(足球)比赛中一些关键时刻(yellow/red 卡,目标等)。

我开始了解如何在我构建的数据集上对程序进行视频分析训练,从 Web 下载图像并标记它们。为了获得更好的分析结果,我想知道是否有人对教程有一些建议可以遵循,以便了解如何在音频文件上训练我的应用程序,使程序能够理解何时有音高变化在视频的音频中结合视频和音频分析以获得更好的结果。

提前致谢

由于您是 Python 和 tensorflow 的新手,我建议您现在只关注音频,特别是因为它是足球比赛中重要事件的有力指标(red/yellow 卡片、严重犯规、进球、绝好机会、精彩比赛等)。

非常简单,根本不需要使用太多 ML,您可以使用一个时间段的平均体积来推断显着性。如果您想更复杂一点,可以考虑使用语音转文本库来查找评论员语音中的关键字。

使用视频来尝试确定重要事件何时发生是非常非常具有挑战性的。

此页面可以帮助您开始处理 Python 中的音频信号。

https://bastibe.de/2012-11-02-real-time-signal-processing-in-python.html