使用 Z3 库复制反编译的 C 代码

Replicate a decompiled C code with Z3 library

我正在学习 Z3 并尝试使用 Z3 对加密算法进行逆向工程,而不是用 C 编写它。我有以下由 IDA 反编译的伪代码:

int __cdecl main(int argc, const char **argv, const char **envp)
{
  char *v3; // rsi
  unsigned int v4; // eax
  int v5; // eax
  __m128i *v6; // rbx
  __int64 v7; // rdx
  char v9; // [rsp+0h] [rbp-80h]
  __int64 v10; // [rsp+10h] [rbp-70h]
  int v11; // [rsp+18h] [rbp-68h]
  __int16 v12; // [rsp+1Ch] [rbp-64h]
  char v13; // [rsp+1Eh] [rbp-62h]
  char v14; // [rsp+1Fh] [rbp-61h]
  __m128i v15; // [rsp+20h] [rbp-60h]
  __int64 v16; // [rsp+30h] [rbp-50h]
  __int64 v17; // [rsp+38h] [rbp-48h]

  _main(argc, argv, envp);
  strcpy(v15.m128i_i8, "THE SECRET HAS BEEN REMOVED LOL");
  v3 = &v9;
  v4 = _time64(0i64);
  srand(v4);
  do
  {
    v5 = rand();
    *(++v3 - 1) = v5 - ((unsigned __int64)((0x7F807F81i64 * v5) >> 39) - (v5 >> 31));
  }
  while ( v3 != &v14 );
  v6 = &v15;                                   
  v15 = _mm_xor_si128(_mm_loadu_si128((const __m128i *)&v9), v15);
  v16 ^= v10;
  LODWORD(v17) = v11 ^ v17;
  WORD2(v17) ^= v12;
  BYTE6(v17) ^= v13;
  do
  {
    v7 = LOBYTE(v6->m128i_i64[0]);
    v6 = (__m128i *)((char *)v6 + 1);
    printf("%.2x ", v7);
  }
  while ( v6 != (__m128i *)((char *)&v17 + 7) );
  return 0;
}

简而言之,它从 rand() 中获取一个随机数(以时间为种子)并将其与秘密消息异或。我有密文(我的 python 代码中的 ctext)。我试图用 Z3 暴力破解代码。它是坐着的,但秘密消息我弄错了。有什么问题吗?我可能犯了菜鸟错误,所以请不要太苛刻。这是 python 3 代码:

from z3 import *

# The ciphertext is:
ctext="9a 60 76 14 8b 36 5a 10 2b 91 \
c4 6c ab 27 92 99 f8 6a ec 5d 32 20 3d 61 8f c7 fb dd 02 72 bf"
ctext = ctext.split(' ')

S=Solver()

# We want a message with printable chars
def is_printable(x):
    x = BV2Int(x)
    return And((x>=0x20),
               (x<=0x7e))

key=[]
v5 = BitVec("v5",248) # key
for i in range(0, 248, 8):
    seed_byte = Extract(i + 7, i, v5)
    seed_byte = seed_byte - ((seed_byte * 2139127681) >> 39) - (seed_byte >> 31)
    seed_byte = Extract(7, 0, seed_byte)
    key.append(seed_byte)

message=[]
v15 = BitVec("v15",248) # message
for i in range(0, 248,8):
    message_byte = Extract(i+7,i,v15)
    S.add(is_printable(message_byte))
    message.append(message_byte)

j=0
for i in range(0, 248,8):
    secret = Extract(i+7,i,v15)
    S.add((key[j] ^ secret) == int(ctext[j],16))
    j+=1




print(S.check())
str = S.model()[v15].as_string()
result = hex(int(str,10))[2:]
f=""
for i in range(0,len(result),2):
    f+=chr(int(result[i:i+2],16))
print("The message is: \n" + f)

您的编码方式存在一些问题,但我认为您处理此问题的方式存在更根本的问题。最后,您所做的就是要求 Z3 为您找到两个长度为 31 的整数列表(因为 31*8 = 248),这样它们的元素异或就是密码。它做得非常好。看看,我在你的程序中添加了以下内容:

S.check()
m = S.model()

mesg   = [m.eval(i).as_long()  for i in message]
key    = [m.eval(i).as_long()  for i in key]
cipher = [int(i, 16) for i in ctext]
check  = [m ^ k for (m, k) in zip(mesg, key)]
print cipher == check

并打印:

True

所以,解决方案确实是 "correct," Z3 完全按照您的要求做了。

显然这不是你"wanted"该做的事!使用基于 XOR 的加密,您将获得每个密钥和每个密文的答案。您需要进一步的约束。 (您的 "ascii-only" 约束排除了一堆解决方案,但同样,这并没有真正关注实际问题。)

因此,您有两个选择:遍历所有解决方案,看看您喜欢哪个解决方案,或者以某种方式进一步限制问题以获得唯一的解决方案。但这两个 i 都不是真正可行的:首先,解决方案 space 太庞大了,你的计算机(和你)在你完成每一个之前就已经死了。其次,您只是没有从所描述的内容中获得足够的信息来获得独特的模型。

这一点也不奇怪:毕竟,从某种意义上说,这就是所谓的 "one-time pad" 加密,而且它是完美的:您无法从密文中收集到任何信息让你缩小搜索范围space.

希望这能让您走上正确的道路。一旦您有了一些其他可用的约束,我们就可以讨论如何在 z3py 中对其进行实际编码。 (特别是,您应该使用 BV 操作,不要将整数与位向量混合使用,并且尽量不要像您那样进行赋值。但是所有这些讨论都没有实际意义,因为您在这里使用的蛮力方法只是不可行。)