将字符串内容解析为二进制,然后在 Java 中转换为字符串

Parse String content to Binary and Then Convert to String in Java

我需要将字符串内容解析为二进制序列并将它们转换为其 UTF-8 等效字符串。

例如,UTF-8 等价于 BAR如下:
B = 01000010
A = 01000001
R = 01010010


现在,我需要将字符串 "010000100100000101010010" 转换为字符串 "BAR"
对于上述情况,将 24 个字符的输入字符串分成三个相等的部分(每个部分 8 个字符)并翻译成它的 UTF-8 相当于字符串值。

示例代码:

public static void main(String args[]) {
    String B = "01000010";
    String A = "01000001";
    String R = "01010010";
    String BAR = "010000100100000101010010";

    String utfEquiv = toUTF8(BAR);//expecting to get "BAR"
    System.out.println(utfEquiv);
}

private static String toUTF8(String str) {
    // TODO 
    return "";
}

方法 toUTF8(String str){}

的实现应该是什么

你应该把它分成两个问题:

  • 通过解析二进制值将字符串转换为字节数组
  • 使用 UTF-8 将字节数组转换回字符串

后者很直接,使用new String(bytes, StandardCharsets.UTF_8)

对于第一部分,棘手的部分是 Byte.parseByte 不会自动处理前导 1...所以我可能会将每个 8 位字符串解析为 short 并且然后转换为 byte:

public static byte[] binaryToBytes(String input) {
    // TODO: Argument validation (nullity, length)
    byte[] ret = new byte[input.length() / 8];
    for (int i = 0; i < ret.length; i++) {
        String chunk = input.substring(i * 8, i * 8 + 8);
        ret[i] = (byte) Short.parseShort(chunk, 2);
    }
    return ret;
}