从 java 中的 json 文件中读取唯一字符:'あ'

read unique char: 'あ' from json file in java

我正在使用以下代码读取 Java 中的 JSON 文件:

String data = Files.readFile(jsonFile)
    .trim()
    .replaceAll("[^\x00-\x7F]", "")
    .replaceAll("[\p{Cntrl}&&[^\r\n\t]]", "")
    .replaceAll("\p{C}", "");

在我的 JSON 文件中,有一个独特的字符:'あ' (12354) 在读取文件时被解释为:""(无)。

如何让这个字符显示在我的变量“数据”中?


根据我得到的答案,我了解到数据是通过添加 replaceAll("[^\x00-\x7F]", "") 从高 ASCII 字符中清除的。但是如果我想要清除除这个'あ'之外的所有高位ASCII字符,我该怎么办?

您想要的字符是 unicode 字符 HIRAGANA LETTER A,代码为 U+3042。

您只需将其添加到有效字符列表即可:

...
.replaceAll("[^\x00-\x7F\u3042]", "")
...