ARM、GNU 汇编程序:如何将 "array" 个参数传递给 execve()?
ARM, GNU assembler: how to pass "array" arguments to execve()?
我正在编写一个简单的 shell 代码,该代码会为 ARM 平台调用 execve()
(Raspberry PI 上的 Linux),但卡在了 [= =18=]。根据 documentation:
int execve(const char *filename, char *const argv[], char *const envp[]);
如果我调用 execve("/bin/sh", {NULL}, {NULL});
(从汇编的角度来看),这对我来说完全没有用:
.data
.section .rodata
.command:
.string "/bin/sh"
.text
.globl _start
_start:
mov r7, #11
ldr r0, =.command
eor r1, r1 @ temporarily forget about argv
eor r2, r2 @ don't mind envp too
svc #0
mov r7, #1
eor r0, r0
svc #0
上面的程序集编译得很好,并在我的测试机器上 运行 时调用 shell,它具有 true /bin/sh
。然而,我所有的麻烦是在特定的目标框 上没有 /bin/sh
本身,而只有 busybox
的符号链接,这需要我执行类似 execve("/bin/busybox", {"/bin/busybox", "sh", NULL}, {NULL})
.
据我了解,数组在内存中是连续的,所以我所要做的就是以连续的方式在内存中分配字节,然后将指针提供给我认为是这样的开始"array".考虑到这一点,我尝试了以下操作:
.data
.section .rodata
.command:
.string "/bin/busybox"
.args:
.ascii "/bin/busybox[=13=]"
.ascii "sh[=13=]"
.ascii "[=13=]"
.text
.globl _start
_start:
mov r7, #11
ldr r0, =.command
ldr r1, =.args
eor r2, r2
svc #0
mov r7, #1
eor r0, r0
svc #0
但是没有成功。尝试使用字节并创建一系列填充空字节以对齐到 4 字节的字节,这也没有用。如果 .args
标签如下所示:
.args:
.ascii "/bin/sh[=14=]"
.ascii "-c[=14=][=14=][=14=]"
.ascii "ls[=14=][=14=][=14=]"
.ascii "[=14=][=14=][=14=][=14=]"
则strace
正在执行的程序如下:
$ strace ./shell
execve("./shell", ["./shell"], [/* 19 vars */]) = 0
dup2(0, 4) = 4
dup2(1, 4) = 4
dup2(2, 4) = 4
execve("/bin/sh", [0x6e69622f, 0x68732f, 0x632d, 0x736c00], [/* 0 vars */]) = -1 EFAULT (Bad address)
exit(0) = ?
+++ exited with 0 +++
(尝试先在测试机上执行 /bin/sh -c ls
,然后再为 /bin/busybox sh
编码)。
我运行一个类似的C程序,然后调试了一下,看看效果如何。似乎传递给 r1
的位置包含一堆指向字符串的指针,然后自然地包含 0x00:
(gdb) x/4xw 0xbefff764
0xbefff764: 0x000105d0 0x000105d8 0x000105dc 0x00000000
... snip ...
(gdb) p argv
= {0x105d0 "/bin/sh", 0x105d8 "-c", 0x105dc "ls", 0x0}
问题
现在我弄清楚了内存是如何布局的,我如何在汇编中准备这样的布局并正确地将第二个参数传递给 execve()
作为 ARM 汇编语言中的 "array"?
天哪,我刚想出这个……几个小时的摆弄,然后在发布我自己的问题 2 分钟后,答案击中了我……橡皮鸭调试工作。
.data
.section .rodata
command:
.string "/bin/sh"
arg0:
.string "/bin/sh"
arg1:
.string "-c"
arg2:
.string "ls"
args:
.word arg0
.word arg1
.word arg2
.word 0
.text
.globl _start
_start:
mov r7, #11
ldr r0, =command
ldr r1, =args
eor r2, r2
svc #0
mov r7, #1
eor r0, r0
svc #0
您可以使用堆栈指针来传递参数。当程序启动时,第一个参数 (arg[1]) 将在 sp+8.
shell.s:
.text
.globl _start
_start:
.code 32
add r3,pc,#1
bx r3
.code 16
ldr r0, [sp, #8] @ load argv[1] to r0
add r1, sp, #8 @ set &argv[1] to r1
eor r2, r2 @ set NULL to r2
mov r7, #11
svc #1
此代码与下一个 C 代码的作用相同:
#include <unistd.h>
int main(int argc, char *argv[])
{
execve(argv[1], &argv[1], NULL);
return 0;
}
第三个参数envp,可以设为NULL。
开始/bin/sh:
shell /bin/sh
我希望这对某人有所帮助
我正在编写一个简单的 shell 代码,该代码会为 ARM 平台调用 execve()
(Raspberry PI 上的 Linux),但卡在了 [= =18=]。根据 documentation:
int execve(const char *filename, char *const argv[], char *const envp[]);
如果我调用 execve("/bin/sh", {NULL}, {NULL});
(从汇编的角度来看),这对我来说完全没有用:
.data
.section .rodata
.command:
.string "/bin/sh"
.text
.globl _start
_start:
mov r7, #11
ldr r0, =.command
eor r1, r1 @ temporarily forget about argv
eor r2, r2 @ don't mind envp too
svc #0
mov r7, #1
eor r0, r0
svc #0
上面的程序集编译得很好,并在我的测试机器上 运行 时调用 shell,它具有 true /bin/sh
。然而,我所有的麻烦是在特定的目标框 上没有 /bin/sh
本身,而只有 busybox
的符号链接,这需要我执行类似 execve("/bin/busybox", {"/bin/busybox", "sh", NULL}, {NULL})
.
据我了解,数组在内存中是连续的,所以我所要做的就是以连续的方式在内存中分配字节,然后将指针提供给我认为是这样的开始"array".考虑到这一点,我尝试了以下操作:
.data
.section .rodata
.command:
.string "/bin/busybox"
.args:
.ascii "/bin/busybox[=13=]"
.ascii "sh[=13=]"
.ascii "[=13=]"
.text
.globl _start
_start:
mov r7, #11
ldr r0, =.command
ldr r1, =.args
eor r2, r2
svc #0
mov r7, #1
eor r0, r0
svc #0
但是没有成功。尝试使用字节并创建一系列填充空字节以对齐到 4 字节的字节,这也没有用。如果 .args
标签如下所示:
.args:
.ascii "/bin/sh[=14=]"
.ascii "-c[=14=][=14=][=14=]"
.ascii "ls[=14=][=14=][=14=]"
.ascii "[=14=][=14=][=14=][=14=]"
则strace
正在执行的程序如下:
$ strace ./shell
execve("./shell", ["./shell"], [/* 19 vars */]) = 0
dup2(0, 4) = 4
dup2(1, 4) = 4
dup2(2, 4) = 4
execve("/bin/sh", [0x6e69622f, 0x68732f, 0x632d, 0x736c00], [/* 0 vars */]) = -1 EFAULT (Bad address)
exit(0) = ?
+++ exited with 0 +++
(尝试先在测试机上执行 /bin/sh -c ls
,然后再为 /bin/busybox sh
编码)。
我运行一个类似的C程序,然后调试了一下,看看效果如何。似乎传递给 r1
的位置包含一堆指向字符串的指针,然后自然地包含 0x00:
(gdb) x/4xw 0xbefff764
0xbefff764: 0x000105d0 0x000105d8 0x000105dc 0x00000000
... snip ...
(gdb) p argv
= {0x105d0 "/bin/sh", 0x105d8 "-c", 0x105dc "ls", 0x0}
问题
现在我弄清楚了内存是如何布局的,我如何在汇编中准备这样的布局并正确地将第二个参数传递给 execve()
作为 ARM 汇编语言中的 "array"?
天哪,我刚想出这个……几个小时的摆弄,然后在发布我自己的问题 2 分钟后,答案击中了我……橡皮鸭调试工作。
.data
.section .rodata
command:
.string "/bin/sh"
arg0:
.string "/bin/sh"
arg1:
.string "-c"
arg2:
.string "ls"
args:
.word arg0
.word arg1
.word arg2
.word 0
.text
.globl _start
_start:
mov r7, #11
ldr r0, =command
ldr r1, =args
eor r2, r2
svc #0
mov r7, #1
eor r0, r0
svc #0
您可以使用堆栈指针来传递参数。当程序启动时,第一个参数 (arg[1]) 将在 sp+8.
shell.s:
.text
.globl _start
_start:
.code 32
add r3,pc,#1
bx r3
.code 16
ldr r0, [sp, #8] @ load argv[1] to r0
add r1, sp, #8 @ set &argv[1] to r1
eor r2, r2 @ set NULL to r2
mov r7, #11
svc #1
此代码与下一个 C 代码的作用相同:
#include <unistd.h>
int main(int argc, char *argv[])
{
execve(argv[1], &argv[1], NULL);
return 0;
}
第三个参数envp,可以设为NULL。
开始/bin/sh:
shell /bin/sh
我希望这对某人有所帮助