GZIPInputStream 无法在接收方解码(设置的代码长度无效)

GZIPInputStream unable to decode at receiver side (invalid code lengths set)

我正在尝试使用 GZIPOutputStream 在客户端中对字符串进行编码,然后在服务器中使用 GZIPOutputStream 对字符串进行解码。

客户端代码(在初始套接字连接建立之后)是:

// ... Establishing connection, getting a socket object.
// ... Now proceeding to send data using that socket:

DataOutputStream out = new DataOutputStream(socket.getOutputStream());
String message = "Hello World!";

ByteArrayOutputStream out = new ByteArrayOutputStream();
GZIPOutputStream gzip = new GZIPOutputStream(out);
gzip.write(message);
gzip.close();
String encMessage = out.toString();

out.writeInt(encMessage.getBytes().length);
out.write(encMessage.getBytes());
out.flush();

和服务器端代码(再次,建立连接后):

DataInputStream input = new DataInputStream(socket.getInputStream());

int length = input.readInt();
byte[] buffer = new byte[length];
input.readFully(buffer);

GZIPInputStream gz = new GZIPInputStream(new ByteArrayInputStream(buffer));
BufferedReader r = new BufferedReader(new InputStreamReader(gz));
String s = "";
String line;
while ((line = r.readLine()) != null) 
{
    s += line;
}

我检查了缓冲区长度(即编码消息的大小)是否正确传递,因此传输了正确的字节数。 但是,我得到这个:

java.util.zip.ZipException: invalid code lengths set
at java.util.zip.InflaterInputStream.read(InflaterInputStream.java:164)
at java.util.zip.GZIPInputStream.read(GZIPInputStream.java:117)
at java.util.zip.InflaterInputStream.read(InflaterInputStream.java:122)
at parsing.ReceiveResponsesTest$TestReceiver.run(ReceiveResponsesTest.java:147)
at java.lang.Thread.run(Thread.java:745)

有什么想法吗?

在此先感谢您的帮助!

您在 ByteArrayOutputStream 上调用 toString() - 这是不正确的,它会引发各种可能困扰您的字符编码问题。您需要改为调用 toByteArray

byte[] encMessage = out.toByteArray();

out.writeInt(encMessage.length);
out.write(encMessage);

详情:

如果您使用 toString(),Java 将以您的平台默认字符编码对您的字节进行编码。这可能是一些 Windows 代码页、UTF-8 或诸如此类的东西。 然而,并非所有字符都可以正确编码,有些字符将被替换为替代字符 - 也许是问号。在不了解详情的情况下,很难说清。

但无论如何,把字节数组编码成String,写出来的时候再解码成字节数组,很有可能改变字节数组中的数据。并且不需要这样做,直接获取字节数组即可,如上代码所示。

你到底为什么沉迷于所有这些复杂的事情?您可以将其全部简化为:

GZIPOutputStream gzip = new GZIPOutputStream(socket.getOutputStream());
DataOutputStream out = new DataOutputStream(gzip);
String message = "Hello World!";    
out.writeUTF(message);
out.close();

// ...    

GZIPInputStream gz = new GZIPInputStream(new ByteArrayInputStream(socket.getInputStream()));
DataInputStream input = new DataInputStream(gz);
String line = input.readUTF();

我进一步注意到您的代码实际上并没有编译。我会进一步指出,除非消息大几个数量级,否则 GZipping 没有任何好处。