如何识别中文文本中的声调?
How to identify the tones in Chinese text?
有没有程序化的方法来识别中文文本中的声调?
对于像 苹果
这样的输入字符串,我需要将音调提取为 2
和 3
,因为它会在拼音音译 píng guǒ
或 ping2 guo3
.
我想一个可能的解决方法是将中文汉字文本转换为拼音(例如使用 pinyin4j),然后从拼音中提取声调,但我认为必须有更好、更直接的方法来做到这一点。
上下文
问题是关于是否有某种算法方法来识别音调,或者如果唯一的方法是针对权威来源的地图查找,例如公开可用 CEDICT database.
我是母语人士,我怀疑这是否可能。根据上下文,汉字可以有多个声调。唯一可靠的方法是使用完整上下文调用一些 API。
由于无法通过单独判断来确定角色是什么音调,因此没有这样的“算法”可以将它们映射到他们的音调。
例如,“一”可以是声调 1、2、4 或中声,具体取决于上下文。
有没有程序化的方法来识别中文文本中的声调?
对于像 苹果
这样的输入字符串,我需要将音调提取为 2
和 3
,因为它会在拼音音译 píng guǒ
或 ping2 guo3
.
我想一个可能的解决方法是将中文汉字文本转换为拼音(例如使用 pinyin4j),然后从拼音中提取声调,但我认为必须有更好、更直接的方法来做到这一点。
上下文
问题是关于是否有某种算法方法来识别音调,或者如果唯一的方法是针对权威来源的地图查找,例如公开可用 CEDICT database.
我是母语人士,我怀疑这是否可能。根据上下文,汉字可以有多个声调。唯一可靠的方法是使用完整上下文调用一些 API。
由于无法通过单独判断来确定角色是什么音调,因此没有这样的“算法”可以将它们映射到他们的音调。
例如,“一”可以是声调 1、2、4 或中声,具体取决于上下文。