卡在 do{} while(false) 循环中

Stuck in do{} while(false) loop

首先,这与作业有关。

这是一门 OS 课程,我们应该使用纤程,以便我们的系统在进行长时间计算时能够做出响应。为此,我们提供了保存和恢复堆栈等功能。我们的想法是,我们 运行 一次,而不是 for 循环 运行ning 100 次,保存堆栈并返回,做一些其他的事情,然后恢复函数的堆栈。

问题是提供的用于保存和恢复堆栈的宏陷入了无限循环。令人惊讶的是,它被写成一个 do{}while(false) 循环,所以这根本不应该发生。

什么可能导致它发生?这是宏:

#define stack_saverestore(from_stack,to_stack) do {                  \
 asm volatile(                                                       \
   "  pushl %%eax      \n\t"                                         \
   "  pushl %%ecx      \n\t"                                         \
   "  pushl %%ebp      \n\t"                                         \
   "  pushl f        \n\t"                                         \
   "                   \n\t"                                         \
   "  movl  %%esp,(%0) \n\t"                                         \
   "  movl  (%1),%%esp \n\t"                                         \
   "                   \n\t"                                         \
   "  ret              \n\t"                                         \
   "1:                 \n\t"                                         \
   "  popl %%ebp       \n\t"                                         \
   "  popl %%ecx       \n\t"                                         \
   "  popl %%eax       \n\t"                                         \
  :                                                                  \
  :"a" (&from_stack), "c"  (&to_stack)                               \
  :_ALL_REGISTERS, "memory"                                          \
 );                                                                  \
} while(false)

我很确定问题不在宏本身,因为我在另一个地方使用它,没有遇到任何问题。我在调试它时遇到问题,因为宏主要是汇编代码。

编辑:stack_saverestore、

背后的逻辑
//
// Switch stacks.
//
// Algo: 
//   1. Save _c's context to stack, 
//   2. push ip of _c's restore handler
//   3. switch stacks
//   4. execute ip of _n's restore handler to restore _n's context from stack.
//
//
// stack layout: 
//  teip[-1:-32]: continuation to restore, 
//  Stack layout expected by teip:
//     ebp[ -33: -64], 
//     ebx[ -65: -96], 
//     eax[ -97:-128], 
//     Stack layout expected by eip+4:
//        Preserved.

用法详细信息s:该宏用于实现非常基本的纤程 shell。我正在做的事情并不重要,但基本上我是在添加一个大数的除数。我知道这不是最佳方式,但这不是这里的问题。

void fiberFactor(addr_t* pmain_stack, addr_t* pf_stack,
        shellstate_t& shellstate) {

    addr_t & main_stack = main_stack; 
    addr_t & f_stack = f_stack;
    bool& done = shellstate.fiber_done;

    int n = shellstate.factorArg;
    int i = 1;
    int sum = 0;


    for (i = 1; i < n; i++) {
        for (int j = 0; j < 1000; j++) {
            if (n % i == 0) {
                sum = sum + i;
            }
            i++;
        }
        i--;
        shellstate.fiber_done = false;
        hoh_debug("about to switch stacks, i "<<i<<sum);
        stack_saverestore(f_stack, main_stack); //Never returns from here.
    }
//The hope is that with each iteration of the outer for loop, 
//we do some computation, and then yield execution. 
//Eventually, the computation is finished, and we set the flags here,   
//and switch out for the last time.
    for (;;) {
        shellstate.fiber_done = true;
        shellstate.fiber_do = false;
        shellstate.factorVal = sum;
        stack_saverestore(f_stack, main_stack);
    }

}


//This function is called by the shell as part of the main loop. 
//If we have to do something, as indicated by the booleans, do it.
void shell_step_fiber(shellstate_t& shellstate, addr_t& main_stack,
        addr_t& f_stack, addr_t f_array, uint32_t f_arraysize) {

    if (shellstate.resetFiber) {
        shellstate.resetFiber = false;
        stack_init3(f_stack, f_array, f_arraysize, &fiberFactor, &main_stack, &f_stack, &shellstate); //Reset the stacks.
    }

    if (shellstate.fiber_do){
        stack_saverestore(main_stack, f_stack); //Switch to fiberFactor. This works without a hitch.
    }
}

问题出在 fiberFactor 函数中,我在 for 循环中调用 stack_saverestore。

我突然想到了一些事情。

首先,您的堆栈需要 space 来存储它们的东西。如果我没看错的话,你的堆栈本质上是地址,可能相隔 4 个字节——而你正试图在堆栈上存储 16 个字节。最终结果是,当您写入一个堆栈时,您会破坏另一个堆栈。

要更正此问题,我建议您自己创建一个堆栈结构,明确包含 space 用于您想要从中 save/restore 的所有内容。

typedef struct {
    uint32_t  eip;
    uint32_t  ebp;
    uint32_t  ecx;
    uint32_t  eax;
} my_stacktype_t; 

随着 x86 上的堆栈向下增长,这些项目的顺序与您推送的顺序相反。

接下来我突然想到的是,您只保存了必要寄存器的一个子集。也许你的循环体只使用这些寄存器,但如果它发生变化,你将需要存储 more/different 寄存器。我推荐 saving/restoring 所有通用寄存器:eax、ebx、ecx、edx、esi、edi、ebp、esp 和 eip(希望我没有忘记一个——我在这里凭记忆)。

我必须考虑您的用例场景才能绝对确定,但将堆栈存储在堆栈上至少是一种代码味道。根据我的经验,堆栈通常存储为全局变量或从堆中动态分配。

希望对您有所帮助。

原来错误不在循环中,而是在我的代码中——特别是 fiberFactor 中的这一行:

addr_t & main_stack = main_stack; 

这没有意义,因为传递给函数的参数是 pmain_stack。更改为

addr_t & main_stack = *pmain_stack; 

与 f_stack 相同,问题已解决。

感谢@DavidWolfherd 发现它。虽然为什么这不是错误而是 stack_saverestore 的代码中的无限循环,但我不知道。