文件与文件内容的不同 sha256 哈希值作为 WordArray

different sha256 hash value of file vs. file contents as WordArray

我做了一个测试文本文件,内容是: aaaaaaaabbbbbbbbccccccccddddddddeeeeeeeeffffffffgggggggghhhhhhhh

此值作为字符串的 sha256 十六进制摘要是: 75eef9680de51f6f70291057e9afc5975470960dfec5f37f83db69aa625786e5

我在 python 中使用 hashlib、js 使用 Crypto.js 或从命令行对文件使用 ssl 时得到相同的值。

然而,在js中,当我这样读取文件时:

var fr = new FileReader();
fr.readAsArrayBuffer(file);
console.log(fr.result.byteLength); // it's 64...
var input = CryptoJS.lib.WordArray.create(new Uint8Array(fr.result));
CryptoJS.SHA256(input).toString();

我得到: 8f76bf13468fb12ac4e59610adff70fd10282e8494a2749db4677f81e2c6e998

更新:来自 crypto.js 文档:

/**
 * cryptojs use WordArray (CryptoJS.lib.WordArray) as parameter/result frequently.
 *    A WordArray object represents an array of 32-bit words. When you pass a string,
 * it's automatically converted to a WordArray encoded as UTF-8.
 */

怀疑它可能是 utf-8 vs ascii 之类的东西,但不知道如何检查。

我发现 asmCrypto.js 接受 ArrayBuffers 和 Uint8Arrays 作为输入 - 我现在得到了预期的结果(它也非常快)。我是这样使用的:

var fr = new FileReader();
fr.readAsArrayBuffer(file);
console.log(fr.result.byteLength); // it's still 64...
asmCrypto.SHA256.hex(new Uint8Array(fr.result));
asmCrypto.SHA256.hex(fr.result); // this also works