卡在 do{} while(false) 循环中
Stuck in do{} while(false) loop
首先,这与作业有关。
这是一门 OS 课程,我们应该使用纤程,以便我们的系统在进行长时间计算时能够做出响应。为此,我们提供了保存和恢复堆栈等功能。我们的想法是,我们 运行 一次,而不是 for 循环 运行ning 100 次,保存堆栈并返回,做一些其他的事情,然后恢复函数的堆栈。
问题是提供的用于保存和恢复堆栈的宏陷入了无限循环。令人惊讶的是,它被写成一个 do{}while(false) 循环,所以这根本不应该发生。
什么可能导致它发生?这是宏:
#define stack_saverestore(from_stack,to_stack) do { \
asm volatile( \
" pushl %%eax \n\t" \
" pushl %%ecx \n\t" \
" pushl %%ebp \n\t" \
" pushl f \n\t" \
" \n\t" \
" movl %%esp,(%0) \n\t" \
" movl (%1),%%esp \n\t" \
" \n\t" \
" ret \n\t" \
"1: \n\t" \
" popl %%ebp \n\t" \
" popl %%ecx \n\t" \
" popl %%eax \n\t" \
: \
:"a" (&from_stack), "c" (&to_stack) \
:_ALL_REGISTERS, "memory" \
); \
} while(false)
我很确定问题不在宏本身,因为我在另一个地方使用它,没有遇到任何问题。我在调试它时遇到问题,因为宏主要是汇编代码。
编辑:stack_saverestore、
背后的逻辑
//
// Switch stacks.
//
// Algo:
// 1. Save _c's context to stack,
// 2. push ip of _c's restore handler
// 3. switch stacks
// 4. execute ip of _n's restore handler to restore _n's context from stack.
//
//
// stack layout:
// teip[-1:-32]: continuation to restore,
// Stack layout expected by teip:
// ebp[ -33: -64],
// ebx[ -65: -96],
// eax[ -97:-128],
// Stack layout expected by eip+4:
// Preserved.
用法详细信息s:该宏用于实现非常基本的纤程 shell。我正在做的事情并不重要,但基本上我是在添加一个大数的除数。我知道这不是最佳方式,但这不是这里的问题。
void fiberFactor(addr_t* pmain_stack, addr_t* pf_stack,
shellstate_t& shellstate) {
addr_t & main_stack = main_stack;
addr_t & f_stack = f_stack;
bool& done = shellstate.fiber_done;
int n = shellstate.factorArg;
int i = 1;
int sum = 0;
for (i = 1; i < n; i++) {
for (int j = 0; j < 1000; j++) {
if (n % i == 0) {
sum = sum + i;
}
i++;
}
i--;
shellstate.fiber_done = false;
hoh_debug("about to switch stacks, i "<<i<<sum);
stack_saverestore(f_stack, main_stack); //Never returns from here.
}
//The hope is that with each iteration of the outer for loop,
//we do some computation, and then yield execution.
//Eventually, the computation is finished, and we set the flags here,
//and switch out for the last time.
for (;;) {
shellstate.fiber_done = true;
shellstate.fiber_do = false;
shellstate.factorVal = sum;
stack_saverestore(f_stack, main_stack);
}
}
//This function is called by the shell as part of the main loop.
//If we have to do something, as indicated by the booleans, do it.
void shell_step_fiber(shellstate_t& shellstate, addr_t& main_stack,
addr_t& f_stack, addr_t f_array, uint32_t f_arraysize) {
if (shellstate.resetFiber) {
shellstate.resetFiber = false;
stack_init3(f_stack, f_array, f_arraysize, &fiberFactor, &main_stack, &f_stack, &shellstate); //Reset the stacks.
}
if (shellstate.fiber_do){
stack_saverestore(main_stack, f_stack); //Switch to fiberFactor. This works without a hitch.
}
}
问题出在 fiberFactor 函数中,我在 for 循环中调用 stack_saverestore。
我突然想到了一些事情。
首先,您的堆栈需要 space 来存储它们的东西。如果我没看错的话,你的堆栈本质上是地址,可能相隔 4 个字节——而你正试图在堆栈上存储 16 个字节。最终结果是,当您写入一个堆栈时,您会破坏另一个堆栈。
要更正此问题,我建议您自己创建一个堆栈结构,明确包含 space 用于您想要从中 save/restore 的所有内容。
typedef struct {
uint32_t eip;
uint32_t ebp;
uint32_t ecx;
uint32_t eax;
} my_stacktype_t;
随着 x86 上的堆栈向下增长,这些项目的顺序与您推送的顺序相反。
接下来我突然想到的是,您只保存了必要寄存器的一个子集。也许你的循环体只使用这些寄存器,但如果它发生变化,你将需要存储 more/different 寄存器。我推荐 saving/restoring 所有通用寄存器:eax、ebx、ecx、edx、esi、edi、ebp、esp 和 eip(希望我没有忘记一个——我在这里凭记忆)。
我必须考虑您的用例场景才能绝对确定,但将堆栈存储在堆栈上至少是一种代码味道。根据我的经验,堆栈通常存储为全局变量或从堆中动态分配。
希望对您有所帮助。
原来错误不在循环中,而是在我的代码中——特别是 fiberFactor 中的这一行:
addr_t & main_stack = main_stack;
这没有意义,因为传递给函数的参数是 pmain_stack。更改为
addr_t & main_stack = *pmain_stack;
与 f_stack 相同,问题已解决。
感谢@DavidWolfherd 发现它。虽然为什么这不是错误而是 stack_saverestore 的代码中的无限循环,但我不知道。
首先,这与作业有关。
这是一门 OS 课程,我们应该使用纤程,以便我们的系统在进行长时间计算时能够做出响应。为此,我们提供了保存和恢复堆栈等功能。我们的想法是,我们 运行 一次,而不是 for 循环 运行ning 100 次,保存堆栈并返回,做一些其他的事情,然后恢复函数的堆栈。
问题是提供的用于保存和恢复堆栈的宏陷入了无限循环。令人惊讶的是,它被写成一个 do{}while(false) 循环,所以这根本不应该发生。
什么可能导致它发生?这是宏:
#define stack_saverestore(from_stack,to_stack) do { \
asm volatile( \
" pushl %%eax \n\t" \
" pushl %%ecx \n\t" \
" pushl %%ebp \n\t" \
" pushl f \n\t" \
" \n\t" \
" movl %%esp,(%0) \n\t" \
" movl (%1),%%esp \n\t" \
" \n\t" \
" ret \n\t" \
"1: \n\t" \
" popl %%ebp \n\t" \
" popl %%ecx \n\t" \
" popl %%eax \n\t" \
: \
:"a" (&from_stack), "c" (&to_stack) \
:_ALL_REGISTERS, "memory" \
); \
} while(false)
我很确定问题不在宏本身,因为我在另一个地方使用它,没有遇到任何问题。我在调试它时遇到问题,因为宏主要是汇编代码。
编辑:stack_saverestore、
背后的逻辑//
// Switch stacks.
//
// Algo:
// 1. Save _c's context to stack,
// 2. push ip of _c's restore handler
// 3. switch stacks
// 4. execute ip of _n's restore handler to restore _n's context from stack.
//
//
// stack layout:
// teip[-1:-32]: continuation to restore,
// Stack layout expected by teip:
// ebp[ -33: -64],
// ebx[ -65: -96],
// eax[ -97:-128],
// Stack layout expected by eip+4:
// Preserved.
用法详细信息s:该宏用于实现非常基本的纤程 shell。我正在做的事情并不重要,但基本上我是在添加一个大数的除数。我知道这不是最佳方式,但这不是这里的问题。
void fiberFactor(addr_t* pmain_stack, addr_t* pf_stack,
shellstate_t& shellstate) {
addr_t & main_stack = main_stack;
addr_t & f_stack = f_stack;
bool& done = shellstate.fiber_done;
int n = shellstate.factorArg;
int i = 1;
int sum = 0;
for (i = 1; i < n; i++) {
for (int j = 0; j < 1000; j++) {
if (n % i == 0) {
sum = sum + i;
}
i++;
}
i--;
shellstate.fiber_done = false;
hoh_debug("about to switch stacks, i "<<i<<sum);
stack_saverestore(f_stack, main_stack); //Never returns from here.
}
//The hope is that with each iteration of the outer for loop,
//we do some computation, and then yield execution.
//Eventually, the computation is finished, and we set the flags here,
//and switch out for the last time.
for (;;) {
shellstate.fiber_done = true;
shellstate.fiber_do = false;
shellstate.factorVal = sum;
stack_saverestore(f_stack, main_stack);
}
}
//This function is called by the shell as part of the main loop.
//If we have to do something, as indicated by the booleans, do it.
void shell_step_fiber(shellstate_t& shellstate, addr_t& main_stack,
addr_t& f_stack, addr_t f_array, uint32_t f_arraysize) {
if (shellstate.resetFiber) {
shellstate.resetFiber = false;
stack_init3(f_stack, f_array, f_arraysize, &fiberFactor, &main_stack, &f_stack, &shellstate); //Reset the stacks.
}
if (shellstate.fiber_do){
stack_saverestore(main_stack, f_stack); //Switch to fiberFactor. This works without a hitch.
}
}
问题出在 fiberFactor 函数中,我在 for 循环中调用 stack_saverestore。
我突然想到了一些事情。
首先,您的堆栈需要 space 来存储它们的东西。如果我没看错的话,你的堆栈本质上是地址,可能相隔 4 个字节——而你正试图在堆栈上存储 16 个字节。最终结果是,当您写入一个堆栈时,您会破坏另一个堆栈。
要更正此问题,我建议您自己创建一个堆栈结构,明确包含 space 用于您想要从中 save/restore 的所有内容。
typedef struct {
uint32_t eip;
uint32_t ebp;
uint32_t ecx;
uint32_t eax;
} my_stacktype_t;
随着 x86 上的堆栈向下增长,这些项目的顺序与您推送的顺序相反。
接下来我突然想到的是,您只保存了必要寄存器的一个子集。也许你的循环体只使用这些寄存器,但如果它发生变化,你将需要存储 more/different 寄存器。我推荐 saving/restoring 所有通用寄存器:eax、ebx、ecx、edx、esi、edi、ebp、esp 和 eip(希望我没有忘记一个——我在这里凭记忆)。
我必须考虑您的用例场景才能绝对确定,但将堆栈存储在堆栈上至少是一种代码味道。根据我的经验,堆栈通常存储为全局变量或从堆中动态分配。
希望对您有所帮助。
原来错误不在循环中,而是在我的代码中——特别是 fiberFactor 中的这一行:
addr_t & main_stack = main_stack;
这没有意义,因为传递给函数的参数是 pmain_stack。更改为
addr_t & main_stack = *pmain_stack;
与 f_stack 相同,问题已解决。
感谢@DavidWolfherd 发现它。虽然为什么这不是错误而是 stack_saverestore 的代码中的无限循环,但我不知道。