是否可以通过小块计算哈希?

Is it possible to compute a hash by small chunks?

我目前正在研究低内存嵌入式系统的固件更新机制。

部分系统要求在发送文件之前对二进制文件进行哈希处理(使用 SHA-256)(添加了其他安全功能但不影响此问题)。设备必须先验证此哈希,然后再验证它,但内存非常低。它将以小块的形式接收数据,我想知道是否可以“即时”计算部分哈希值,以避免在完全传输后再次加载整个二进制文件。

例如,假设要散列的数据是“part1part2part3”。全量数据的哈希为“hash”,“part1”的哈希为“hash1”,“part2”的哈希为“hash2”,“part3”的哈希为“hash3”。

有什么数学运算可以将部分哈希值转换为完整哈希值吗?像

hashReceived = hash
tempHash = operation(hash1,hash2)
tempHash = operation(tempHash, hash3)
if(hashReceived == tempHash)
... continue
else
... fail

我正在寻找 SHA-256 的数学 属性(类似于分配 属性),它可以在不破坏任何 SHA-256 属性的情况下允许此类行为。

您描述的方式是不可能的。您不能组合“子哈希”来确定完整的哈希。如果你能做到这一点,散列将受到 length-extension attacks 的约束并且不安全。 (此处的“安全”以相当精确和技术性的方式定义。请参阅 Stef 的 link 关于放宽此要求的其他散列方法。)

但是,正如问题的评论所指出的,完全有可能将数据流式传输到 SHA256,而无需将所有数据都保存在内存中。这是计算散列函数的正常方式。 SHA256 适用于 64 字节的块大小。这就是您一次需要保存的所有数据,加上 32 个字节的状态。

最常见的哈希库将此作为 API 的一部分。它通常看起来像:

hasher = create_hasher()
update_hash(hasher, data1)
update_hash(hasher, data2)
update_hash(hasher, data3)
final_hash = compute_hash(hasher)

本例中的hasher每次调用update_hash时都会改变其内部状态,然后在调用compute_hash时完成哈希。调用 update_hash() 不会分配任何新内存,并且在使用数据包更新哈希后无需保留数据包。