C 或 Python 中的声音识别和分类库

Sound recognition and categorization library in C or Python

...

大家好!

我是一名学生,正在尝试制作有关声音识别的 DIY 设备。没有语音识别那么精确和复杂,我只是想为我的小应用程序采用和使用一些简单的识别库。

我要做的,换句话说,就是"wide-range"的声音识别。也就是说,如果有声音 "Boom! Boom!" 那么我真的不必识别,例如, "Okay, that is a certain engine sound from Chevrolet Corvette Z06. Nice machine, huh?" (X) 而是将其识别为类似的东西, "Car. Coming to me. Loud and Noisy." (O) 够了

或者,如果有声音 "Ka-boom!" "Bang!",我不必将其识别为, "Firework play at the north bridge. In this winter? Maybe some retarded are out there." (X) 但, "Fire boom. I would never go there. Strange." (O) 这就够了。 ... 等等。也就是说,我想 'categorize' 声音与匿名库一起使用,并将其用作我的应用程序提供的指南的有用信息。

是否有任何有用的信息或推荐的库可供我参考?我会等待你的好建议。谢谢。

此致,

J。公园

如果您愿意使用 C++ 库(不是真正的 C):

Aquila

但是您需要自己开发 reco,这是通过使用标记为噪声的样本库来完成的。这是一个很长的项目,你熟悉傅里叶、DTW 等信号处理吗?有执行此操作的标准流程。