Script/Tool 将 "xxd -i" 编码的 C 源代码转换为 C 源代码?
Script/Tool to convert C source code encoded by "xxd -i" to C source code?
有没有Linux/Unix工具可以将C文件的十六进制转储数组(即xxd -i
的输出)转换成相应的源代码?
Boomerang Decompiler 免费,适用于 Linux,可在 SourceForge 上获得。
源文件 xyz.c
的 xxd -i xyz.c
输出如下所示:
unsigned char xyz_c[] = {
0x23, 0x69, 0x6e, 0x63, 0x6c, 0x75, 0x64, 0x65, 0x20, 0x3c, 0x73, 0x74,
0x64, 0x69, 0x6f, 0x2e, 0x68, 0x3e, 0x0a, 0x23, 0x69, 0x6e, 0x63, 0x6c,
0x75, 0x64, 0x65, 0x20, 0x3c, 0x73, 0x74, 0x64, 0x6c, 0x69, 0x62, 0x2e,
0x68, 0x3e, 0x0a, 0x23, 0x69, 0x6e, 0x63, 0x6c, 0x75, 0x64, 0x65, 0x20,
0x3c, 0x73, 0x74, 0x72, 0x69, 0x6e, 0x67, 0x2e, 0x68, 0x3e, 0x0a, 0x0a,
…
0x65, 0x5f, 0x6c, 0x69, 0x73, 0x74, 0x28, 0x73, 0x74, 0x61, 0x72, 0x74,
0x29, 0x3b, 0x0a, 0x20, 0x20, 0x20, 0x20, 0x7d, 0x0a, 0x0a, 0x20, 0x20,
0x20, 0x20, 0x72, 0x65, 0x74, 0x75, 0x72, 0x6e, 0x20, 0x30, 0x3b, 0x0a,
0x7d, 0x0a
};
unsigned int xyz_c_len = 4442;
假设存储在文件 xyz.xxd
.
在很多方面,重新生成原始代码的最简单方法是:
#include <stdio.h>
#include "xyz.xxd"
int main(void)
{
for (unsigned int i = 0; i < xyz_c_len; i++)
putchar(xyz_c[i]);
return 0;
}
如果多加注意并使用一些宏,您可以将其作为该工作的通用大纲程序 — 您需要提供文件名和要使用的两个 C 变量名。
如果您不能(或不想)使用 C 编译器来完成这项工作,那么使用 Python 或 Perl 编写工具是一个直接的练习。例如,一个不一定是最小的 Perl 脚本是:
#!/usr/bin/env perl -na
use strict;
use warnings;
# xxd -i drops the final comma - aargh (why?)!
foreach my $word (@F)
{
next unless $word =~ m/^0[Xx][[:xdigit:]]{2},?$/;
$word =~ s/,//;
printf "%c", hex($word);
}
它使用'auto-split'选项(-a
)和'automatic read but do not print'选项(-n
),然后处理输入中看起来像十六进制字符的任何单词,例如 0x0a(可选地后跟一个逗号,因为 xxd -i
在最后一个字节值之后有些不必要地省略了逗号)并将其转换为相应的字节。它是 Perl,TMTOWTDI — 实现它的方法不止一种。
有没有Linux/Unix工具可以将C文件的十六进制转储数组(即xxd -i
的输出)转换成相应的源代码?
Boomerang Decompiler 免费,适用于 Linux,可在 SourceForge 上获得。
源文件 xyz.c
的 xxd -i xyz.c
输出如下所示:
unsigned char xyz_c[] = {
0x23, 0x69, 0x6e, 0x63, 0x6c, 0x75, 0x64, 0x65, 0x20, 0x3c, 0x73, 0x74,
0x64, 0x69, 0x6f, 0x2e, 0x68, 0x3e, 0x0a, 0x23, 0x69, 0x6e, 0x63, 0x6c,
0x75, 0x64, 0x65, 0x20, 0x3c, 0x73, 0x74, 0x64, 0x6c, 0x69, 0x62, 0x2e,
0x68, 0x3e, 0x0a, 0x23, 0x69, 0x6e, 0x63, 0x6c, 0x75, 0x64, 0x65, 0x20,
0x3c, 0x73, 0x74, 0x72, 0x69, 0x6e, 0x67, 0x2e, 0x68, 0x3e, 0x0a, 0x0a,
…
0x65, 0x5f, 0x6c, 0x69, 0x73, 0x74, 0x28, 0x73, 0x74, 0x61, 0x72, 0x74,
0x29, 0x3b, 0x0a, 0x20, 0x20, 0x20, 0x20, 0x7d, 0x0a, 0x0a, 0x20, 0x20,
0x20, 0x20, 0x72, 0x65, 0x74, 0x75, 0x72, 0x6e, 0x20, 0x30, 0x3b, 0x0a,
0x7d, 0x0a
};
unsigned int xyz_c_len = 4442;
假设存储在文件 xyz.xxd
.
在很多方面,重新生成原始代码的最简单方法是:
#include <stdio.h>
#include "xyz.xxd"
int main(void)
{
for (unsigned int i = 0; i < xyz_c_len; i++)
putchar(xyz_c[i]);
return 0;
}
如果多加注意并使用一些宏,您可以将其作为该工作的通用大纲程序 — 您需要提供文件名和要使用的两个 C 变量名。
如果您不能(或不想)使用 C 编译器来完成这项工作,那么使用 Python 或 Perl 编写工具是一个直接的练习。例如,一个不一定是最小的 Perl 脚本是:
#!/usr/bin/env perl -na
use strict;
use warnings;
# xxd -i drops the final comma - aargh (why?)!
foreach my $word (@F)
{
next unless $word =~ m/^0[Xx][[:xdigit:]]{2},?$/;
$word =~ s/,//;
printf "%c", hex($word);
}
它使用'auto-split'选项(-a
)和'automatic read but do not print'选项(-n
),然后处理输入中看起来像十六进制字符的任何单词,例如 0x0a(可选地后跟一个逗号,因为 xxd -i
在最后一个字节值之后有些不必要地省略了逗号)并将其转换为相应的字节。它是 Perl,TMTOWTDI — 实现它的方法不止一种。