C 或 Python 中的声音识别和分类库
Sound recognition and categorization library in C or Python
...
大家好!
我是一名学生,正在尝试制作有关声音识别的 DIY 设备。没有语音识别那么精确和复杂,我只是想为我的小应用程序采用和使用一些简单的识别库。
我要做的,换句话说,就是"wide-range"的声音识别。也就是说,如果有声音 "Boom! Boom!" 那么我真的不必识别,例如,
"Okay, that is a certain engine sound from Chevrolet Corvette Z06. Nice machine, huh?" (X)
而是将其识别为类似的东西,
"Car. Coming to me. Loud and Noisy." (O) 够了
或者,如果有声音 "Ka-boom!" "Bang!",我不必将其识别为,
"Firework play at the north bridge. In this winter? Maybe some retarded are out there." (X)
但,
"Fire boom. I would never go there. Strange." (O)
这就够了。
...
等等。也就是说,我想 'categorize' 声音与匿名库一起使用,并将其用作我的应用程序提供的指南的有用信息。
是否有任何有用的信息或推荐的库可供我参考?我会等待你的好建议。谢谢。
此致,
J。公园
如果您愿意使用 C++ 库(不是真正的 C):
但是您需要自己开发 reco,这是通过使用标记为噪声的样本库来完成的。这是一个很长的项目,你熟悉傅里叶、DTW 等信号处理吗?有执行此操作的标准流程。
...
大家好!
我是一名学生,正在尝试制作有关声音识别的 DIY 设备。没有语音识别那么精确和复杂,我只是想为我的小应用程序采用和使用一些简单的识别库。
我要做的,换句话说,就是"wide-range"的声音识别。也就是说,如果有声音 "Boom! Boom!" 那么我真的不必识别,例如, "Okay, that is a certain engine sound from Chevrolet Corvette Z06. Nice machine, huh?" (X) 而是将其识别为类似的东西, "Car. Coming to me. Loud and Noisy." (O) 够了
或者,如果有声音 "Ka-boom!" "Bang!",我不必将其识别为, "Firework play at the north bridge. In this winter? Maybe some retarded are out there." (X) 但, "Fire boom. I would never go there. Strange." (O) 这就够了。 ... 等等。也就是说,我想 'categorize' 声音与匿名库一起使用,并将其用作我的应用程序提供的指南的有用信息。
是否有任何有用的信息或推荐的库可供我参考?我会等待你的好建议。谢谢。
此致,
J。公园
如果您愿意使用 C++ 库(不是真正的 C):
但是您需要自己开发 reco,这是通过使用标记为噪声的样本库来完成的。这是一个很长的项目,你熟悉傅里叶、DTW 等信号处理吗?有执行此操作的标准流程。