CMU 词典中未包含反向音素
Reverse phonemes not included in the CMU dictionary
卡内基梅隆大学发音词典允许从单词中获取音素。我在 Internet 上做了一些研究,似乎有一些扩展作为 LOGIOS Lexicon Tool,它可以为原始 CMU 词典 (http://www.speech.cs.cmu.edu/tools/lextool.html). The same can be obtained by using a neural network model (https://github.com/cmusphinx/g2p-seq2seq) 中可能不包含的任意单词导出音素,所以基本上每个word我们可以得到对应的音素。
但是每个单词的过程都是可逆的吗?显然,对于已经包含在 CMU 词典中的单词,不需要进行反转,因为该单词已附加到相应的音素上。但是我怎样才能从任意音素中得到这个词呢?这是一个工具吗(可能在 Python 中)或者我应该自己实现相反的操作,也许查看源代码进行词到音素解析并尝试恢复它(如果可能)?
最自然的方法是训练一些 seq2seq 神经网络模型来执行音素到字素的转换。
g2p-seq2seq 用于支持音素转字素模式,参见github issue,但最近升级中丢失了此功能。带回来就好了
卡内基梅隆大学发音词典允许从单词中获取音素。我在 Internet 上做了一些研究,似乎有一些扩展作为 LOGIOS Lexicon Tool,它可以为原始 CMU 词典 (http://www.speech.cs.cmu.edu/tools/lextool.html). The same can be obtained by using a neural network model (https://github.com/cmusphinx/g2p-seq2seq) 中可能不包含的任意单词导出音素,所以基本上每个word我们可以得到对应的音素。
但是每个单词的过程都是可逆的吗?显然,对于已经包含在 CMU 词典中的单词,不需要进行反转,因为该单词已附加到相应的音素上。但是我怎样才能从任意音素中得到这个词呢?这是一个工具吗(可能在 Python 中)或者我应该自己实现相反的操作,也许查看源代码进行词到音素解析并尝试恢复它(如果可能)?
最自然的方法是训练一些 seq2seq 神经网络模型来执行音素到字素的转换。
g2p-seq2seq 用于支持音素转字素模式,参见github issue,但最近升级中丢失了此功能。带回来就好了