如何识别中文文本中的声调？

How to identify the tones in Chinese text?

有没有程序化的方法来识别中文文本中的声调？

对于像 苹果 这样的输入字符串，我需要将音调提取为 2 和 3，因为它会在拼音音译 píng guǒ 或 ping2 guo3.

我想一个可能的解决方法是将中文汉字文本转换为拼音（例如使用 pinyin4j），然后从拼音中提取声调，但我认为必须有更好、更直接的方法来做到这一点。

问题是关于是否有某种算法方法来识别音调，或者如果唯一的方法是针对权威来源的地图查找，例如公开可用 CEDICT database.

我是母语人士，我怀疑这是否可能。根据上下文，汉字可以有多个声调。唯一可靠的方法是使用完整上下文调用一些 API。

由于无法通过单独判断来确定角色是什么音调，因此没有这样的“算法”可以将它们映射到他们的音调。

例如，“一”可以是声调 1、2、4 或中声，具体取决于上下文。