ANTLR3 词法分析器中的 UTF-32 代码点(代理对)?

UTF-32 code points (surrogate pairs) in ANTLR3 lexer?

有什么方法可以在 ANTLR3 词法分析器中指定 UTF-32 代码点吗?更具体地说,我有一个像 0xAEC35 这样的值是从 UTF16LA 编辑的 return(因为我使用了代理对),但我不知道如何在词法分析器中指定这种类型的字符(大于 0xFFFF)。照原样,词法分析器抛出错误,因为该字符不匹配任何内容。

我正在使用 ANTLR 3.5.2,内部处理已更改为 return UTF-32,但词法分析器似乎不能很好地处理这些值,这似乎很不寻常。

ANTLR3 不支持 BMP 以外的 Unicode。你真的应该升级到 ANTLR4,它已经存在多年了。