Python 与 Go 哈希差异

Question

我有围棋程序

package main

import (
    "crypto/hmac"
    "crypto/sha1"
    "fmt"
)

func main() {
    val := []byte("nJ1m4Cc3")
    hasher := hmac.New(sha1.New, val)
    fmt.Printf("%x\n", hasher.Sum(nil))
    // f7c0aebfb7db2c15f1945a6b7b5286d173df894d
}

还有一个 Python (2.7) 程序试图重现 Go 代码（使用 crypto/hmac）

import hashlib
val =  u'nJ1m4Cc3'
hasher = hashlib.new("sha1", val)
print hasher.hexdigest()
# d67c1f445987c52bceb8d6475c30a8b0e9a3365d

使用 hmac 模块得到了不同的结果，但仍然与 Go 代码不同。

import hmac
val = 'nJ1m4Cc3'
h = hmac.new("sha1", val)
print h.hexdigest()
# d34435851209e463deeeb40cba7b75ef

当它们对相同的输入使用相同的散列时，为什么它们打印出不同的值？

Answer 1

你必须确保

两种情况下的输入是等价的
两种场景下的处理方式是等同的

在这两种情况下，输入都应该是相同的二进制 blob。在您的 Python 程序中，您定义了一个 unicode 对象，并且您没有控制它的二进制表示。将 u 前缀替换为 b，就可以了（这是在 Python 2.7 和 3 中定义字节序列的显式方法）。这不是实际问题，但最好在这里明确说明。

问题是您在 Go 和 Python 实现中应用了不同的方法。

鉴于Python是参考

在 Go 中，根本不需要导入 "crypto/hmac"，在 Python 中，您只需构建数据的 SHA1 哈希。在 Go 中，等价的是：

package main

import (
    "crypto/sha1"
    "fmt"
)

func main() {
    data := []byte("nJ1m4Cc3")
    fmt.Printf("%x", sha1.Sum(data))
}

测试并输出：

go run hashit.go
d67c1f445987c52bceb8d6475c30a8b0e9a3365d

这将重现您的第一个 Python 片段创建的内容。

编辑：我稍微简化了 Go 代码，不让 Python 看起来更优雅。 Go 在这里也很优雅 :-).

以Go为参考

import hmac
import hashlib

data = b'nJ1m4Cc3'
h = hmac.new(key=data, digestmod=hashlib.sha1)
print h.hexdigest()

测试&输出：

python hashit.py
f7c0aebfb7db2c15f1945a6b7b5286d173df894d

这会重现您的 Go 代码段创建的内容。但是，当确实使用空消息时，我不确定 HMAC 的加密意义。

Python 与 Go 哈希差异

Python vs Go Hashing Differences

python

hash

cryptography

sha1

go

鉴于Python是参考

以Go为参考