在 risc-v 中为数组初始化内存

Initialize Memory for array in risc-v

int a[10] = {1,2,3,4,5,6,7,8,9,10};

for (int i = 0;  i < 10; i++)
{
    if( a[i] > 5)
         //do something 

我想将上面的 C 代码翻译成 Risc-V 汇编。这是我目前所知道的,但我对数组的初始化、存储和访问有些困惑:

    #create stack
    addi sp, sp, -40
    #save s0
    sw s0, 40(sp)
    #update s0
    addi s0, sp, 40

    li x18, 1
    sw x18, -40(s0)
    li x18, 2
    sw x18, -36(s0)
    li x18, 3
    sw x18, -32(s0)
    li x18, 4
    sw x18, -28(s0)
    li x18, 5
    sw x18, -24(s0)
    li x18, 6
    sw x18, -20(s0)
    li x18, 7
    sw x18, -16(s0)
    li x18, 8
    sw x18, -12(s0)
    li x18, 9
    sw x18, -8(s0)
    li x18, 10
    sw x18, -4(s0)

    addi x5, x0, x0         //x5 = i = 0
    addi x31, x0, 10        //x31 = 10

    Func:
        //do something

    Loop: 
        lw x10, 0(s0)       //x10 = a[i] 
        bgt x10, 5, Func    //if(a[i] > 5)
        addi s0, s0, 4      //&a[i++]
        addi x5, x5, 1      //i = i + 1
        blt x5 x31, Loop    //if condition (i < 10)

这种方法正确吗?

  • if 语句的控制结构不太正确。代码不完整,所以很难说出你要去哪里。但是,鉴于您要向后分支到循环之前,您将不得不在这里和那里放置一些额外的分支。

请注意,在 C 代码中,if 语句嵌套在循环中,通常我们会在汇编中做同样的事情,而不是将 then 部分放在 if 循环之前和之前的语句。 C if 语句的意图是 then 部分有条件地执行,然后当 if 语句完成时,控制传递到 [=11= 之后的下一个顺序语句](这里是循环的剩余部分)是否 if 语句 runs/fires then 部分。如果您在其他地方恢复控制(或仅在其中一个条件下而不是在两个条件下——当 if 条件为真时与假时),您的汇编代码将不会 运行 像 C 代码。

    Loop:
        lw a0, 0(s0)
        ble a0, 5, if1IsDone  // if a[i] <= 5 then skip the "do something"

        // do something -- this is the "then" part, only runs when a[i] > 5

    if1IsDone:          // when the If is done control goes on to the rest of the loop
                        // whether the then-part executed or was skipped

        addi s0, s0, 4
        addi t0, t0, 1
        blt t0, 10, Loop

在上面,if 语句完全嵌套在循环中,就像在 C 代码中一样。

  • 您正在将 s0 保存在堆栈的顶部,您不拥有它,因为它属于调用者。换句话说,您正在为本地数组分配 40 个字节的堆栈 space,但您需要为数组分配 44 个字节的堆栈 space + 保存的 s0.

  • 您正在创建一个等于原始堆栈指针的基指针 (s0),然后使用负寻址访问数组。这既令人困惑又不必要。我们可以从 sp 本身访问数组,因为那只是另一个寄存器。所以,a[0] 在 sp+0,a[1] 在 sp+4。使用正寻址转发。

  • 由于您将 s0 设置为指向数组的末尾,因此在循环内取消引用的指针将不会像您在 C 代码中预期的那样访问元素。相反,它将访问调用者的堆栈内存。更改为指向数组的开头,然后将指针前进 4 将按您的预期访问连续的元素。 (您可以通过数组的大小将取消引用偏置为负偏移量,但与首先简单地指向数组的开头相比,这将是愚蠢的。)

  • 但是,在编写汇编代码之前先完成 C 代码。 C 代码中的一个小改动可能会导致汇编代码发生重大变化。例如,如果您在循环内有一个函数调用,您想要更改寄存器以获取在整个调用过程中有效的值,可能必须将额外的寄存器保存到堆栈中,这可能会移动您的数组并更改偏移量。

  • 编写符合 C 代码的汇编代码。在 C 语言到汇编语言的翻译过程中不要进行算法优化。

    • 如果您想使用指针而不是数组索引,请在将其用于汇编之前以这种方式编写 C 代码。
    • 如果您想使用 do .. while 循环而不是 for 循环,那么在将其用于汇编之前以这种方式编写 C 代码。
    • 嵌套控制结构与 C 中的相同。
    • 测试你的 C 代码以确保它能正常工作,因为当你还不知道汇编时调试汇编中的算法设计问题是很困难的。
  • 正如 Peter 所说,不要将友好的 (ABI: t0,s0,sp,a0, etc..) 注册名称与不友好的 (x10,x18,..) 混用 — 太棒了令人困惑。仅使用友好的 ABI 寄存器名称。不要使用 s 寄存器,除非你需要它们(这里你还不需要)。