哈希值不匹配
Hashes Are Not Matching
我对相同的值进行哈希处理,但得到的结果不同。
这里有一个简单的例子来解释我遇到的情况:
我的尺寸 table 看起来像这样:
gender
gender_id
Male
1
Female
0
性别的数据类型是 NVARCHAR(6),gender_id 是 INT
当我执行以下任何查询时,我得到相同的哈希值:
**Scenario 1:**
SELECT
CONVERT(BINARY(20), HASHBYTES('Md5', Concat(Gender, cast(gender_id as int))))
FROM demographic
WHERE gender = 'Male';
输出:'0x6B216D8BB993AA263265CCF645C282B100000000'
**Scenario 2:**
SELECT
CONVERT(BINARY(20), HASHBYTES('Md5', Concat(Gender, CAST(gender_id AS NVARCHAR(1)))))
FROM demographic
WHERE gender = 'Male';
输出:'0x6B216D8BB993AA263265CCF645C282B100000000'
在场景 1 中,我将 gender_id 转换为 INT,在场景 2 中,我将 gender_id 转换为 NVARCHAR。在这两种情况下,哈希都是相同的。
当我执行调用维度中的特定值而不是列的查询时,我的哈希不同:
**Scenario 3:**
SELECT CONVERT(BINARY(20), HASHBYTES('MD5', Concat('Male', CAST(1 as INT))));
输出:'0x048A5F0EE2D2B4070CFF8A38CB6DAC7100000000'
**Scenario 4:**
SELECT CONVERT(BINARY(20), HASHBYTES('MD5', Concat('Male', CAST(1 as NVARCHAR(1)))));
输出:'0x6B216D8BB993AA263265CCF645C282B100000000'
在场景 3 中,我像在场景 1 中一样将 1 转换为 INT。在场景 4 中,我像在场景 2 中一样将 1 转换为 NVARCHAR。但是,场景 3 和 4 具有不同的哈希值。除此之外,场景 4 的哈希与场景 1 和 2 中的哈希一致。
我无法理解为什么方案 1、2 和 4 的哈希值相同,但方案 3 的哈希值不同。在我的维度中,gender_id 是一个 INT。当我查询我的维度时,无论我如何转换它,哈希总是相同的。在方案 3 和 4 中,当我用实际值替换列名时,结果会发生变化。方案 3 中的哈希将不匹配方案 1 和 2,除非我将其转换为 NVARCHAR。为什么会这样,因为 gender_id 自然是一个 INT?
感谢您的任何见解,如果需要,我们很乐意提供更多说明。
谢谢!
'Male'
是一个 ANSI varchar
值,而不是 Unicode nvarchar
。对于 Unicode,您需要 N'Male'
例如,我得到以下查询结果:
select convert(varchar(20), cast('Male' as varbinary(20)), 1)
0x4D616C65
而这个,注意在文字前添加 N
:
select convert(varchar(20), cast(N'Male' as varbinary(20)), 1)
0x4D0061006C006500
我对相同的值进行哈希处理,但得到的结果不同。
这里有一个简单的例子来解释我遇到的情况:
我的尺寸 table 看起来像这样:
gender | gender_id |
---|---|
Male | 1 |
Female | 0 |
性别的数据类型是 NVARCHAR(6),gender_id 是 INT
当我执行以下任何查询时,我得到相同的哈希值:
**Scenario 1:**
SELECT
CONVERT(BINARY(20), HASHBYTES('Md5', Concat(Gender, cast(gender_id as int))))
FROM demographic
WHERE gender = 'Male';
输出:'0x6B216D8BB993AA263265CCF645C282B100000000'
**Scenario 2:**
SELECT
CONVERT(BINARY(20), HASHBYTES('Md5', Concat(Gender, CAST(gender_id AS NVARCHAR(1)))))
FROM demographic
WHERE gender = 'Male';
输出:'0x6B216D8BB993AA263265CCF645C282B100000000'
在场景 1 中,我将 gender_id 转换为 INT,在场景 2 中,我将 gender_id 转换为 NVARCHAR。在这两种情况下,哈希都是相同的。
当我执行调用维度中的特定值而不是列的查询时,我的哈希不同:
**Scenario 3:**
SELECT CONVERT(BINARY(20), HASHBYTES('MD5', Concat('Male', CAST(1 as INT))));
输出:'0x048A5F0EE2D2B4070CFF8A38CB6DAC7100000000'
**Scenario 4:**
SELECT CONVERT(BINARY(20), HASHBYTES('MD5', Concat('Male', CAST(1 as NVARCHAR(1)))));
输出:'0x6B216D8BB993AA263265CCF645C282B100000000'
在场景 3 中,我像在场景 1 中一样将 1 转换为 INT。在场景 4 中,我像在场景 2 中一样将 1 转换为 NVARCHAR。但是,场景 3 和 4 具有不同的哈希值。除此之外,场景 4 的哈希与场景 1 和 2 中的哈希一致。
我无法理解为什么方案 1、2 和 4 的哈希值相同,但方案 3 的哈希值不同。在我的维度中,gender_id 是一个 INT。当我查询我的维度时,无论我如何转换它,哈希总是相同的。在方案 3 和 4 中,当我用实际值替换列名时,结果会发生变化。方案 3 中的哈希将不匹配方案 1 和 2,除非我将其转换为 NVARCHAR。为什么会这样,因为 gender_id 自然是一个 INT?
感谢您的任何见解,如果需要,我们很乐意提供更多说明。
谢谢!
'Male'
是一个 ANSI varchar
值,而不是 Unicode nvarchar
。对于 Unicode,您需要 N'Male'
例如,我得到以下查询结果:
select convert(varchar(20), cast('Male' as varbinary(20)), 1)
0x4D616C65
而这个,注意在文字前添加 N
:
select convert(varchar(20), cast(N'Male' as varbinary(20)), 1)
0x4D0061006C006500