ARM、GNU 汇编程序:如何将 "array" 个参数传递给 execve()?

ARM, GNU assembler: how to pass "array" arguments to execve()?

我正在编写一个简单的 shell 代码,该代码会为 ARM 平台调用 execve()(Raspberry PI 上的 Linux),但卡在了 [= =18=]。根据 documentation:

int execve(const char *filename, char *const argv[], char *const envp[]);

如果我调用 execve("/bin/sh", {NULL}, {NULL});(从汇编的角度来看),这对我来说完全没有用:

.data

.section .rodata

.command:
        .string "/bin/sh"

.text

.globl _start

_start: 
        mov r7, #11
        ldr r0, =.command
        eor r1, r1 @ temporarily forget about argv
        eor r2, r2 @ don't mind envp too
        svc #0

        mov r7, #1
        eor r0, r0
        svc #0

上面的程序集编译得很好,并在我的测试机器上 运行 时调用 shell,它具有 true /bin/sh。然而,我所有的麻烦是在特定的目标框 上没有 /bin/sh 本身,而只有 busybox 的符号链接,这需要我执行类似 execve("/bin/busybox", {"/bin/busybox", "sh", NULL}, {NULL}).

据我了解,数组在内存中是连续的,所以我所要做的就是以连续的方式在内存中分配字节,然后将指针提供给我认为是这样的开始"array".考虑到这一点,我尝试了以下操作:

.data

.section .rodata

.command:
        .string "/bin/busybox"

.args:  
        .ascii "/bin/busybox[=13=]"
        .ascii "sh[=13=]"
        .ascii "[=13=]"

.text

.globl _start

_start: 
        mov r7, #11
        ldr r0, =.command
        ldr r1, =.args
        eor r2, r2
        svc #0

        mov r7, #1
        eor r0, r0
        svc #0

但是没有成功。尝试使用字节并创建一系列填充空字节以对齐到 4 字节的字节,这也没有用。如果 .args 标签如下所示:

.args:  
        .ascii "/bin/sh[=14=]"
        .ascii "-c[=14=][=14=][=14=]"
        .ascii "ls[=14=][=14=][=14=]"
        .ascii "[=14=][=14=][=14=][=14=]"

strace正在执行的程序如下:

$ strace ./shell
execve("./shell", ["./shell"], [/* 19 vars */]) = 0
dup2(0, 4)                              = 4
dup2(1, 4)                              = 4
dup2(2, 4)                              = 4
execve("/bin/sh", [0x6e69622f, 0x68732f, 0x632d, 0x736c00], [/* 0 vars */]) = -1 EFAULT (Bad address)
exit(0)                                 = ?
+++ exited with 0 +++

(尝试先在测试机上执行 /bin/sh -c ls,然后再为 /bin/busybox sh 编码)。

我运行一个类似的C程序,然后调试了一下,看看效果如何。似乎传递给 r1 的位置包含一堆指向字符串的指针,然后自然地包含 0x00:

(gdb) x/4xw 0xbefff764
0xbefff764:     0x000105d0      0x000105d8      0x000105dc      0x00000000

... snip ...

(gdb) p argv
 = {0x105d0 "/bin/sh", 0x105d8 "-c", 0x105dc "ls", 0x0}

问题 现在我弄清楚了内存是如何布局的,我如何在汇编中准备这样的布局并正确地将第二个参数传递给 execve() 作为 ARM 汇编语言中的 "array"?

天哪,我刚想出这个……几个小时的摆弄,然后在发布我自己的问题 2 分钟后,答案击中了我……橡皮鸭调试工作。

.data

.section .rodata

command:
        .string "/bin/sh"

arg0:  
        .string "/bin/sh"

arg1:  
        .string "-c"

arg2:  
        .string "ls"

args:  
        .word arg0
        .word arg1
        .word arg2
        .word 0

.text

.globl _start

_start: 
        mov r7, #11
        ldr r0, =command
        ldr r1, =args
        eor r2, r2
        svc #0

        mov r7, #1
        eor r0, r0
        svc #0

您可以使用堆栈指针来传递参数。当程序启动时,第一个参数 (arg[1]) 将在 sp+8.

shell.s:

    .text
    .globl _start
    _start: 
        .code 32
            add r3,pc,#1
            bx r3
        .code 16
            ldr r0, [sp, #8] @ load argv[1] to r0
            add r1, sp, #8   @ set &argv[1] to r1
            eor r2, r2       @ set NULL to r2
            mov r7, #11
            svc #1

此代码与下一个 C 代码的作用相同:

#include <unistd.h>

int main(int argc, char *argv[])
{
    execve(argv[1], &argv[1], NULL);
    return 0;
}

第三个参数envp,可以设为NULL。

开始/bin/sh:

shell /bin/sh

我希望这对某人有所帮助