从终端输入缓冲区加载到参数堆栈

Load from the terminal input buffer to parameter stack

为什么此代码不起作用?

TIB 10 ACCEPT
TIB SP@ 1 cells - 10 cmove

在该代码中,我尝试输入一个字符串并将其存储在终端输入缓冲区中,然后将其存储在参数堆栈中。

但是我发现 .S 不起作用。

仔细考虑每个单词后堆栈发生了什么。我在下面复制了您的代码,并在每个点都用堆栈深度对其进行了注释。

( 0 ) TIB ( 1 ) 10 ( 2 ) ACCEPT ( 1 )
( 1 ) TIB ( 2 ) SP@ ( 3 ) 1 ( 4 ) cells ( 4 ) - ( 3 ) 10 ( 4 ) cmove ( 1 )

所以当SP@被执行时,它returns一个指向栈元素2的指针。然后指针递减一个单元格,导致指向栈元素3的指针(因为栈增长向下)。 cmove 然后覆盖 10 个字节,即 2 个堆栈元素(猜测你是 运行 64 位)。所以堆栈元素 3 和 2 发生了变化。最后,cmove 从栈中弹出三个元素,只留下一个。不变。

参数堆栈向低内存增长

示例代码的主要问题是参数堆栈向低内存增长。所以复制目标的起点应该在 更高的 内存地址(在 existing/defined 参数堆栈内)。所以而不是

TIB SP@ 1 cells - 10 cmove

应该是:

TIB SP@ 1 cells + 10 cmove

字符串的内存分配

下一个问题是参数堆栈上的字符串没有足够的存储空间。 ACCEPT 剩余一个单元格(在 32 位系统上为四个字节),即实际的字符数。使用示例输入 "user10181"(9 个字符),

TIB 10 ACCEPT

结果:

.S <1> 9  ok

暂时忘记那个额外的元素1,为了阐述的目的,我们在参数堆栈上分配四个单元格(实际值,例如,235,无所谓), 32 位系统上为 16 字节:

235 DUP DUP DUP

那么TIB SP@ 1 cells + 10 cmove的结果是:

.S <5> 9 235 8241 541085779 541215060  ok

我们看到四个单元格中的三个(每个单元格有四个字节)已被 cmove 覆盖(如预期)。

TIB 被来自终端的后续输入覆盖

不幸的是,我们复制的字节不是预期的。解码三个已更改单元格(十进制)的输出,首先来自

8241 541085779 541215060

转十六进制:

2031 20405053 20424954

然后解码为ASCII:

20 31 20 40 50 53 20 42 49 54
   1      @  P  S     B  I  T

并逆向(我们先有高端内存,测试平台是little endian):

 "TIB SP@ 1 "

这是我们第二行的前十个字符,TIB SP@ 1 cells + 10 cmove。因此很明显,终端输入缓冲区 (TIB) 太临时了,无法在这种情况下使用。

解决方案

第三个问题的解决方案是在我们要求用户输入之前编译所有代码。比如写成一个词,inputOnStack:

: inputOnStack TIB 10 ACCEPT 235 DUP DUP DUP TIB SP@ 1 cells + 10 cmove ;

那么结果是:

inputOnStack user10181  ok
.S <5> 9 235 24881 942747697 1919251317  ok

对应"user10181",第十个字符是"a"(最有可能来自inputOnStack中的"a")。

测试平台:

  • Raspberry Pi,模型B.
  • 操作系统:Raspbian, as installed by NOOBS 1.3.10,2014-09-09 发布。
  • Gforth:版本 0.7.0(与 sudo apt-get update; sudo apt-get install gforth 一起安装)

1.代码的更高级版本可以使用实际字符数。在任何情况下,如果将此代码集成到其他代码中,它应该以一种或另一种方式 DROP 来平衡堆栈。

MU!

基本上你在这里所做的是将 CMOVE 复制到堆栈区域,在 Forth 上定义了 SP@(它不是标准词)。所以你销毁堆栈。答案是:这样的代码不应该工作。

问题不应该是“为什么这行不通?”但是 "under what circumstance has this the intended effect?"
让我们假设:

  • 这个 Forth 有一个可寻址和可写的堆栈(如果您认为这相同,请阅读有关 Intel 段描述符以及 POP 和 MOV 指令的细节)

  • 调用时SP@指向栈顶

  • 堆栈变大了。 (如果往下长那就完全不一样了)

  • 调用开始时堆栈为空。

TIB 和 ACCEPT 是转移注意力的信息,将被忽略。

 1 cells -   \ The pointer to the stack is changed opening up one cell

100 cmove  \ you overwrite one cell below the stack, 

        \ then the (32-bit) cell place where the result of SP@ resides *and*

        \ then TIB and then a couple of more bytes 

假设 Forth 受保护,最后的字节超出堆栈,导致分段错误。

所以要想用Forth,就得把自己的思想调整到低层次。将内存想象成一堆信箱,然后从那里开始。