如何识别语音中的形容词?

How to recognize adjectives in speech?

对于一个项目,我想让人们在 Kinect (v1) 前交谈,他们说的每一个形容词都应该出现在屏幕上。
不幸的是,我是 Kinect 开发的新手,很难找到好的文档和教程。

我对这个想法做了一些测试,但我能做的最好的事情就是修改一个用于基本语音识别的 Kinect SDK 示例,并在语法中加入一些形容词。
问题是,当在 Kinect 前说完整的句子时,这种方法效果不佳,而且您必须大声说话并靠近 Kinect。我将无法将 Kinect 放置在靠近扬声器的位置。

我也尝试过使用 System.Speech 和(如示例)Microsoft.Speech。但是,其中 none 似乎支持 Dictation 语法。我对错误 (Grammar referenced by grammar not found) 的含义做了一些研究,这似乎表明我的系统上没有安装听写功能,或类似的东西。我不知道如何从这里开始。

你能告诉我其他一些我可以尝试识别人们在 Kinect(或其他麦克风)前所说的形容词吗?

我最终使用了基于语法的语音识别,我只是预先填充了很多形容词。用户一次只能说一个词,不能自由发言,但我无法让它发挥作用。