"Sound" 在 Swift 中得到认可?
"Sound" Recognition in Swift?
我正在 Swift 开发一个应用程序,我正在考虑在我的项目中获得 非语音 声音识别的方法。
我的意思是有没有一种方法可以接收声音输入并将它们与项目中已经包含的一些预定义声音进行匹配,如果匹配发生,它应该执行一些特定的操作?
有没有办法做到以上几点?我正在考虑分解声音并进行检查,但似乎没有比这更进一步的了。
我的个人经验遵循马特上面的评论:需要认真的技术知识。
有几种方法可以做到这一点,其中一种通常是:从感兴趣的声音片段中提取一些属性(音频特征提取),并使用某种机器学习技术对该音频特征向量进行分类。这通常需要一些训练阶段,在这个阶段,机器学习技术会得到一些示例,以了解您想要识别的声音(您预定义的声音),以便它可以根据该数据构建模型。
在不知道您想要识别什么类型的声音的情况下,也许我们的 C/C++ SDK 可以在此处提供给您:http://www.samplesumo.com/percussive-sound-recognition
该页面上有一个技术演示,您可以下载并尝试使用您的声音。这是一个 C/C++ 库,并且有 Mac、Windows 和 iOS 版本,因此您应该能够将它与 Swift 应用程序集成在 iOS 上。也许这会让你做你想做的事?
如果您想开发自己的技术,您可能需要先使用关键字 "sound classification"、"audio recognition"、"machine listening"、[=22 查找和阅读一些科学论文=], ...
马特,
我们一直在开发一系列很酷的工具来加速 iOS 开发,特别是在 Swift 中。其中一个工具就是我们所说的 TLSphinx:一个围绕 Pocketsphinx 的 Swift 包装器,它 可以在音频不离开设备的情况下执行语音识别 。
我认为 TLSphinx 可以帮助您解决问题,因为它是一个完全开源的库。在 Github ('TLSphinx') 上搜索它,您还可以下载我们的 iOS 应用程序 ('Tryolabs Mobile Showcase') 并实时试用该模块以了解其工作原理。
希望有用!
最好!
我正在 Swift 开发一个应用程序,我正在考虑在我的项目中获得 非语音 声音识别的方法。
我的意思是有没有一种方法可以接收声音输入并将它们与项目中已经包含的一些预定义声音进行匹配,如果匹配发生,它应该执行一些特定的操作?
有没有办法做到以上几点?我正在考虑分解声音并进行检查,但似乎没有比这更进一步的了。
我的个人经验遵循马特上面的评论:需要认真的技术知识。
有几种方法可以做到这一点,其中一种通常是:从感兴趣的声音片段中提取一些属性(音频特征提取),并使用某种机器学习技术对该音频特征向量进行分类。这通常需要一些训练阶段,在这个阶段,机器学习技术会得到一些示例,以了解您想要识别的声音(您预定义的声音),以便它可以根据该数据构建模型。
在不知道您想要识别什么类型的声音的情况下,也许我们的 C/C++ SDK 可以在此处提供给您:http://www.samplesumo.com/percussive-sound-recognition 该页面上有一个技术演示,您可以下载并尝试使用您的声音。这是一个 C/C++ 库,并且有 Mac、Windows 和 iOS 版本,因此您应该能够将它与 Swift 应用程序集成在 iOS 上。也许这会让你做你想做的事?
如果您想开发自己的技术,您可能需要先使用关键字 "sound classification"、"audio recognition"、"machine listening"、[=22 查找和阅读一些科学论文=], ...
马特,
我们一直在开发一系列很酷的工具来加速 iOS 开发,特别是在 Swift 中。其中一个工具就是我们所说的 TLSphinx:一个围绕 Pocketsphinx 的 Swift 包装器,它 可以在音频不离开设备的情况下执行语音识别 。
我认为 TLSphinx 可以帮助您解决问题,因为它是一个完全开源的库。在 Github ('TLSphinx') 上搜索它,您还可以下载我们的 iOS 应用程序 ('Tryolabs Mobile Showcase') 并实时试用该模块以了解其工作原理。 希望有用!
最好!