迭代散列 returns Python 和 Java 中的不同值

Iterative hashing returns different values in Python and Java

我正在尝试将 python (2.7) 脚本移植到 Java。它多次迭代 sha256 哈希,但最终得到不同的结果。我注意到他们第一次 return 结果相同,但从那以后就不一样了。

这里是 Python 实现:

import hashlib

def to_hex(s):
  print " ".join(hex(ord(i)) for i in s)

d = hashlib.sha256()

print "Entry:"
r = chr(1)
to_hex(r)

for i in range(2):
  print "Loop", i
  d.update(r)
  r = d.digest()
  to_hex(r)

在Java中:

import java.security.MessageDigest;
import java.security.NoSuchAlgorithmException;

public class LoopTest {

  public static void main(String[] args) {
    MessageDigest d;
    try {
      d = MessageDigest.getInstance("SHA-256");
    } catch (NoSuchAlgorithmException e) {
      System.out.println("NoSuchAlgorithmException");
      return;
    }

    System.out.println("Entry:");
    byte[] r = new byte[] {1};
    System.out.println(toHex(r));

    for(int i = 0; i < 2; i++) {
      System.out.printf("Loop %d\n", i);
      d.update(r);
      r = d.digest();
      System.out.println(toHex(r));
    }
  }

  private static String toHex(byte[] bytes) {
    StringBuilder sb = new StringBuilder(bytes.length);
    for (byte b: bytes) {
       sb.append(String.format("0x%02X ", b));
    }
    return sb.toString();
  }
}

python 的输出是:

$ python looptest.py
Entry:
0x1
Loop 0
0x4b 0xf5 0x12 0x2f 0x34 0x45 0x54 0xc5 0x3b 0xde 0x2e 0xbb 0x8c 0xd2 0xb7 0xe3 0xd1 0x60 0xa 0xd6 0x31 0xc3 0x85 0xa5 0xd7 0xcc 0xe2 0x3c 0x77 0x85 0x45 0x9a
Loop 1
0x98 0x1f 0xc8 0xd4 0x71 0xa8 0xb0 0x19 0x32 0xe3 0x84 0xac 0x1c 0xd0 0xa0 0x62 0xc4 0xdb 0x2c 0xe 0x13 0x58 0x61 0x9a 0x83 0xd1 0x67 0xf5 0xe8 0x4e 0x6a 0x17

对于java:

$ java LoopTest
Entry:
0x01
Loop 0
0x4B 0xF5 0x12 0x2F 0x34 0x45 0x54 0xC5 0x3B 0xDE 0x2E 0xBB 0x8C 0xD2 0xB7 0xE3 0xD1 0x60 0x0A 0xD6 0x31 0xC3 0x85 0xA5 0xD7 0xCC 0xE2 0x3C 0x77 0x85 0x45 0x9A
Loop 1
0x9C 0x12 0xCF 0xDC 0x04 0xC7 0x45 0x84 0xD7 0x87 0xAC 0x3D 0x23 0x77 0x21 0x32 0xC1 0x85 0x24 0xBC 0x7A 0xB2 0x8D 0xEC 0x42 0x19 0xB8 0xFC 0x5B 0x42 0x5F 0x70

造成这种差异的原因是什么?

编辑:

感谢@dcsohl 和@Alik 的回答我现在明白原因了。因为我要将 Python 脚本移植到 Java,所以我必须保留 Python 脚本,所以我修改了 Java 程序,如下所示:

byte[] r2 = new byte[]{};
for(int i = 0; i < 2; i++) {
  System.out.printf("Loop %d\n", i);
  d.update(r);
  r2 = d.digest();
  System.out.println(toHex(r2));
  byte[] c = new byte[r.length + r2.length];
  System.arraycopy(r, 0, c, 0, r.length);
  System.arraycopy(r2, 0, c, r.length, r2.length);
  r = c;
}

两种语言运行update()digest()不同。

update() 的 python 文档说

Update the hash object with the string arg. Repeated calls are equivalent to a single call with the concatenation of all the arguments: m.update(a); m.update(b) is equivalent to m.update(a+b).

我使用 shell sha256sum 命令对此进行了测试。

echo -n '[=10=]x01[=10=]x4b[=10=]xf5[=10=]x12[=10=]x2f[=10=]x34[=10=]x45[=10=]x54[=10=]xc5[=10=]x3b[=10=]xde[=10=]x2e[=10=]xbb[=10=]x8c[=10=]xd2[=10=]xb7[=10=]xe3[=10=]xd1[=10=]x60[=10=]xa[=10=]xd6[=10=]x31[=10=]xc3[=10=]x85[=10=]xa5[=10=]xd7[=10=]xcc[=10=]xe2[=10=]x3c[=10=]x77[=10=]x85[=10=]x45[=10=]x9a' | sha256sum
981fc8d471a8b01932e384ac1cd0a062c4db2c0e1358619a83d167f5e84e6a17 *-

您从 \0x01 开始,所以这是第一个字节,其余字节是 0x01 的哈希值。生成的哈希值与您的 Python 输出匹配。

现在看看这个 - 我省略了初始的 \0x01 并取回了散列 - 它与你的 Java 输出匹配。

> echo -n '[=11=]x4b[=11=]xf5[=11=]x12[=11=]x2f[=11=]x34[=11=]x45[=11=]x54[=11=]xc5[=11=]x3b[=11=]xde[=11=]x2e[=11=]xbb[=11=]x8c[=11=]xd2[=11=]xb7[=11=]xe3[=11=]xd1[=11=]x60[=11=]xa[=11=]xd6[=11=]x31[=11=]xc3[=11=]x85[=11=]xa5[=11=]xd7[=11=]xcc[=11=]xe2[=11=]x3c[=11=]x77[=11=]x85[=11=]x45[=11=]x9a' | sha256sum
9c12cfdc04c74584d787ac3d23772132c18524bc7ab28dec4219b8fc5b425f70 *-

但是为什么呢?不应该包含初始的 \0x01 吗?应该是,除了 javadoc for digest() 说:

Completes the hash computation by performing final operations such as padding. The digest is reset after this call is made.

因此,当您在 java 中调用 digest() 时,您的初始 \0x01 会被删除,您只是在消化没有初始 \0x01 条目的旧摘要。

在Javad.digestreturns消息摘要最后重置摘要。

在 Python d.digest 中不重置摘要。因此,重复调用 d.update 实际上与之前调用

传递的内容连接在一起

您可以简单地将 d = hashlib.sha256() 放入循环

import hashlib

def to_hex(s):
  print " ".join(hex(ord(i)) for i in s)



print "Entry:"
r = chr(1)
to_hex(r)

for i in range(2):
  print "Loop", i
  d = hashlib.sha256()
  d.update(r)
  r = d.digest()
  to_hex(r)

获得与您java程序相同的结果

Entry:
0x1
Loop 0
0x4b 0xf5 0x12 0x2f 0x34 0x45 0x54 0xc5 0x3b 0xde 0x2e 0xbb 0x8c 0xd2 0xb7 0xe3 0xd1 0x60 0xa 0xd6 0x31 0xc3 0x85 0xa5 0xd7 0xcc 0xe2 0x3c 0x77 0x85 0x45 0x9a
Loop 1
0x9c 0x12 0xcf 0xdc 0x4 0xc7 0x45 0x84 0xd7 0x87 0xac 0x3d 0x23 0x77 0x21 0x32 0xc1 0x85 0x24 0xbc 0x7a 0xb2 0x8d 0xec 0x42 0x19 0xb8 0xfc 0x5b 0x42 0x5f 0x70