如何识别中文文本中的声调?

How to identify the tones in Chinese text?

有没有程序化的方法来识别中文文本中的声调?

对于像 苹果 这样的输入字符串,我需要将音调提取为 23,因为它会在拼音音译 píng guǒping2 guo3.

我想一个可能的解决方法是将中文汉字文本转换为拼音(例如使用 pinyin4j),然后从拼音中提取声调,但我认为必须有更好、更直接的方法来做到这一点。

上下文

问题是关于是否有某种算法方法来识别音调,或者如果唯一的方法是针对权威来源的地图查找,例如公开可用 CEDICT database.

我是母语人士,我怀疑这是否可能。根据上下文,汉字可以有多个声调。唯一可靠的方法是使用完整上下文调用一些 API。

由于无法通过单独判断来确定角色是什么音调,因此没有这样的“算法”可以将它们映射到他们的音调。

例如,“一”可以是声调 1、2、4 或中声,具体取决于上下文。