如何在 Microsoft.Speech 中使用 DTMFRecognitionEngine class
How to use the DTMFRecognitionEngine class in Microsoft.Speech
Microsoft.Speech SDK 有一个 DTMFRecognitionEngine class,我想试验一下 - 我们需要检测 WAV 文件中的 DTMF 音调(我知道还有其他方法,但我正在评估所有可能的方法)。
关于如何实际使用 class 的文档并不清楚:它是伴侣 class、SpeechRecognitionEngine
,有大量示例和清晰的方法,例如 SetInputToWaveFile
. DTMFRecognitionEngine
没有任何此类方法。
有人可以提供有关如何在我自己的代码中使用此组件的见解吗?
编辑: 似乎没有任何方法可以将此 class 用于……好吧,真的。我正在寻找一个库,它可以让我检测音频文件中 DTMF 数字的位置和持续时间。我查看了 TapiEx,但他们没有回复电子邮件。如果有人有任何其他建议,将不胜感激...
看来这是不可能的。我什至获得了 DtmfRecognitionEngine 的私有 _engine,它是 SpeechRecognitionEngine 的包装器,并在没有运气的情况下调用它的 SetInputToWaveFile。显然,将音调输入 DtmfRecognitionEngine 的唯一方法是调用 AddTone()。我已经包含了一个示例语法文件和一些您可以使用的源代码。有趣的是,如果您取消对 dre.AddTone() 的注释,您会看到 sre 的事件和 dre 的事件都被触发了。
将调用切换到 sre.RecognizeAsync() 没有帮助。
看来您需要一个不同的库...
PinGrammar.xml
<?xml version="1.0"?>
<grammar mode="dtmf" version="1.0"
xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"
xsi:schemaLocation="http://www.w3.org/2001/06/grammar
http://www.w3.org/TR/speech-grammar/grammar.xsd"
xmlns="http://www.w3.org/2001/06/grammar"
root="pin">
<rule id="digit">
<one-of>
<item> 0 </item>
<item> 1 </item>
<item> 2 </item>
<item> 3 </item>
<item> 4 </item>
<item> 5 </item>
<item> 6 </item>
<item> 7 </item>
<item> 8 </item>
<item> 9 </item>
</one-of>
</rule>
<rule id="pin" scope="public">
<one-of>
<item>
<item repeat="4">
<ruleref uri="#digit"/>
</item>
#
</item>
<item>
* 9
</item>
</one-of>
</rule>
</grammar>
来源:
using Microsoft.Speech.Recognition;
using System.Reflection;
namespace DTMF_Recognition
{
class Program
{
static void Main(string[] args)
{
Grammar grammar = null;
grammar = new Grammar("PinGrammar.xml");
DtmfRecognitionEngine dre = new DtmfRecognitionEngine();
dre.DtmfRecognized += dre_DtmfRecognized;
FieldInfo field = typeof(DtmfRecognitionEngine).GetField("_engine", BindingFlags.NonPublic | BindingFlags.GetField | BindingFlags.Instance);
var wrapper = field.GetValue(dre);
FieldInfo engineField = wrapper.GetType().GetField("_engine", BindingFlags.NonPublic | BindingFlags.GetField | BindingFlags.Instance);
SpeechRecognitionEngine sre = (SpeechRecognitionEngine)engineField.GetValue(wrapper);
dre.DtmfHypothesized += dre_DtmfHypothesized;
dre.DtmfRecognitionRejected += dre_DtmfRecognitionRejected;
dre.RecognizeCompleted += dre_RecognizeCompleted;
dre.LoadGrammar(grammar);
//dre.AddTone(DtmfTone.One);
//dre.AddTone(DtmfTone.Two);
//dre.AddTone(DtmfTone.Three);
//dre.AddTone(DtmfTone.Four);
//dre.AddTone(DtmfTone.Hash);
sre.SetInputToWaveFile(@"C:\Users\Clay Ver Valen\Desktop.wav");
sre.SpeechHypothesized += sre_SpeechHypothesized;
sre.SpeechDetected += sre_SpeechDetected;
sre.SpeechRecognitionRejected += sre_SpeechRecognitionRejected;
dre.RecognizeAsync();
System.Threading.Thread.Sleep(30000);
}
static void sre_SpeechRecognitionRejected(object sender, SpeechRecognitionRejectedEventArgs e)
{
int i = 1;
}
static void sre_SpeechHypothesized(object sender, SpeechHypothesizedEventArgs e)
{
int i = 1;
}
static void sre_SpeechDetected(object sender, SpeechDetectedEventArgs e)
{
int i = 1;
}
static void dre_DtmfRecognitionRejected(object sender, DtmfRecognitionRejectedEventArgs e)
{
int i = 1;
}
static void dre_DtmfHypothesized(object sender, DtmfHypothesizedEventArgs e)
{
int i = 1;
}
static void dre_RecognizeCompleted(object sender, DtmfRecognizeCompletedEventArgs e)
{
int i = 1;
}
static void dre_DtmfRecognized(object sender, DtmfRecognizedEventArgs e)
{
int i = 1;
}
}
}
Microsoft.Speech SDK 有一个 DTMFRecognitionEngine class,我想试验一下 - 我们需要检测 WAV 文件中的 DTMF 音调(我知道还有其他方法,但我正在评估所有可能的方法)。
关于如何实际使用 class 的文档并不清楚:它是伴侣 class、SpeechRecognitionEngine
,有大量示例和清晰的方法,例如 SetInputToWaveFile
. DTMFRecognitionEngine
没有任何此类方法。
有人可以提供有关如何在我自己的代码中使用此组件的见解吗?
编辑: 似乎没有任何方法可以将此 class 用于……好吧,真的。我正在寻找一个库,它可以让我检测音频文件中 DTMF 数字的位置和持续时间。我查看了 TapiEx,但他们没有回复电子邮件。如果有人有任何其他建议,将不胜感激...
看来这是不可能的。我什至获得了 DtmfRecognitionEngine 的私有 _engine,它是 SpeechRecognitionEngine 的包装器,并在没有运气的情况下调用它的 SetInputToWaveFile。显然,将音调输入 DtmfRecognitionEngine 的唯一方法是调用 AddTone()。我已经包含了一个示例语法文件和一些您可以使用的源代码。有趣的是,如果您取消对 dre.AddTone() 的注释,您会看到 sre 的事件和 dre 的事件都被触发了。
将调用切换到 sre.RecognizeAsync() 没有帮助。
看来您需要一个不同的库...
PinGrammar.xml
<?xml version="1.0"?>
<grammar mode="dtmf" version="1.0"
xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"
xsi:schemaLocation="http://www.w3.org/2001/06/grammar
http://www.w3.org/TR/speech-grammar/grammar.xsd"
xmlns="http://www.w3.org/2001/06/grammar"
root="pin">
<rule id="digit">
<one-of>
<item> 0 </item>
<item> 1 </item>
<item> 2 </item>
<item> 3 </item>
<item> 4 </item>
<item> 5 </item>
<item> 6 </item>
<item> 7 </item>
<item> 8 </item>
<item> 9 </item>
</one-of>
</rule>
<rule id="pin" scope="public">
<one-of>
<item>
<item repeat="4">
<ruleref uri="#digit"/>
</item>
#
</item>
<item>
* 9
</item>
</one-of>
</rule>
</grammar>
来源:
using Microsoft.Speech.Recognition;
using System.Reflection;
namespace DTMF_Recognition
{
class Program
{
static void Main(string[] args)
{
Grammar grammar = null;
grammar = new Grammar("PinGrammar.xml");
DtmfRecognitionEngine dre = new DtmfRecognitionEngine();
dre.DtmfRecognized += dre_DtmfRecognized;
FieldInfo field = typeof(DtmfRecognitionEngine).GetField("_engine", BindingFlags.NonPublic | BindingFlags.GetField | BindingFlags.Instance);
var wrapper = field.GetValue(dre);
FieldInfo engineField = wrapper.GetType().GetField("_engine", BindingFlags.NonPublic | BindingFlags.GetField | BindingFlags.Instance);
SpeechRecognitionEngine sre = (SpeechRecognitionEngine)engineField.GetValue(wrapper);
dre.DtmfHypothesized += dre_DtmfHypothesized;
dre.DtmfRecognitionRejected += dre_DtmfRecognitionRejected;
dre.RecognizeCompleted += dre_RecognizeCompleted;
dre.LoadGrammar(grammar);
//dre.AddTone(DtmfTone.One);
//dre.AddTone(DtmfTone.Two);
//dre.AddTone(DtmfTone.Three);
//dre.AddTone(DtmfTone.Four);
//dre.AddTone(DtmfTone.Hash);
sre.SetInputToWaveFile(@"C:\Users\Clay Ver Valen\Desktop.wav");
sre.SpeechHypothesized += sre_SpeechHypothesized;
sre.SpeechDetected += sre_SpeechDetected;
sre.SpeechRecognitionRejected += sre_SpeechRecognitionRejected;
dre.RecognizeAsync();
System.Threading.Thread.Sleep(30000);
}
static void sre_SpeechRecognitionRejected(object sender, SpeechRecognitionRejectedEventArgs e)
{
int i = 1;
}
static void sre_SpeechHypothesized(object sender, SpeechHypothesizedEventArgs e)
{
int i = 1;
}
static void sre_SpeechDetected(object sender, SpeechDetectedEventArgs e)
{
int i = 1;
}
static void dre_DtmfRecognitionRejected(object sender, DtmfRecognitionRejectedEventArgs e)
{
int i = 1;
}
static void dre_DtmfHypothesized(object sender, DtmfHypothesizedEventArgs e)
{
int i = 1;
}
static void dre_RecognizeCompleted(object sender, DtmfRecognizeCompletedEventArgs e)
{
int i = 1;
}
static void dre_DtmfRecognized(object sender, DtmfRecognizedEventArgs e)
{
int i = 1;
}
}
}