检查 unicode 引号是打开还是关闭

Checking if a unicode quotation mark is opening or closing

我正在编写一个需要查找字符串边界的词法分析器。这些字符串可以使用 Unicode 字符(即左 和右 双引号)引用,可以区分字符串中的字符串。

为了测试 Unicode 字符属性,我使用了 ICU4C 库。

我目前使用 u_hasBinaryProperty(cp, UCHAR_QUOTATION_MARK) 测试引号。

这对于查找引号本身很有效,但无法区分开引号和闭引号。

是否有一些我可以测试的 属性 值或我可以用来测试引号方向的其他功能,而无需针对每种可能的引号类型明确测试它?

引号是打开还是关闭是 language/locale 相关的,因此超出了 Unicode 的范围。 Unicode 只处理脚本。示例:

  • «瑞士人»
  • »波兰语«
  • »芬兰语»

看看别处。