是否可以通过小块计算哈希？

Question

我目前正在研究低内存嵌入式系统的固件更新机制。

部分系统要求在发送文件之前对二进制文件进行哈希处理（使用 SHA-256）（添加了其他安全功能但不影响此问题）。设备必须先验证此哈希，然后再验证它，但内存非常低。它将以小块的形式接收数据，我想知道是否可以“即时”计算部分哈希值，以避免在完全传输后再次加载整个二进制文件。

例如，假设要散列的数据是“part1part2part3”。全量数据的哈希为“hash”，“part1”的哈希为“hash1”，“part2”的哈希为“hash2”，“part3”的哈希为“hash3”。

有什么数学运算可以将部分哈希值转换为完整哈希值吗？像

hashReceived = hash
tempHash = operation(hash1,hash2)
tempHash = operation(tempHash, hash3)
if(hashReceived == tempHash)
... continue
else
... fail

我正在寻找 SHA-256 的数学属性（类似于分配属性），它可以在不破坏任何 SHA-256 属性的情况下允许此类行为。

Answer 1

您描述的方式是不可能的。您不能组合“子哈希”来确定完整的哈希。如果你能做到这一点，散列将受到 length-extension attacks 的约束并且不安全。（此处的“安全”以相当精确和技术性的方式定义。请参阅 Stef 的 link 关于放宽此要求的其他散列方法。）

但是，正如问题的评论所指出的，完全有可能将数据流式传输到 SHA256，而无需将所有数据都保存在内存中。这是计算散列函数的正常方式。 SHA256 适用于 64 字节的块大小。这就是您一次需要保存的所有数据，加上 32 个字节的状态。

最常见的哈希库将此作为 API 的一部分。它通常看起来像：

hasher = create_hasher()
update_hash(hasher, data1)
update_hash(hasher, data2)
update_hash(hasher, data3)
final_hash = compute_hash(hasher)

本例中的hasher每次调用update_hash时都会改变其内部状态，然后在调用compute_hash时完成哈希。调用 update_hash() 不会分配任何新内存，并且在使用数据包更新哈希后无需保留数据包。

Is it possible to compute a hash by small chunks?