汇编中的 ROT13 密码
ROT13 Cipher in Assembly
所以我的 ROT13 密码几乎可以满足我的要求,但是最后命令提示符出现在与最后一行输出相同的行上。这是我在 Assembly 中的第一个项目,所以我不确定自己做错了什么。
您的程序不会在其输出末尾打印换行符,因此当它退出时光标位于非空行的末尾。 shell 不知道这一点,并在那里打印下一个提示。
echo foo
包含尾随换行符,因此当 shell 打印下一个提示时,光标已经在新行的开头。 echo -n foo
不包含尾随换行符,因此它会将光标留在以 foo
开头的行的末尾,并且您的提示会附加到该行上,就像您的程序一样。将这些 echo 命令通过管道传输到 hd
以查看它们打印的 ASCII 字符的十六进制转储。
因此解决方案是确保您的输出以换行符结尾(ASCII 代码 = 10)。您的 msg4: db 10, "Read error", 10
字符串中已经有了它。 (它以一个换行符开始,也以一个换行符结束。)在 C 中,你会写 `"\nRead error\n",但是 NASM 语法不能那样工作。它确实支持反引号字符串内的 C 风格转义,但人们通常使用数字常量编写换行符。
您的用户输入(从 sys_read 获得)通常应以换行符结尾,除非用户在一行中键入 256 个字符,或使用 ctrl-D 提前读取 return . (或者不以换行符结尾的类似管道输入,因此读取命中 EOF)。
我开始遵循比较的逻辑,但很快就厌倦了。我不确定您的输入中的换行符会发生什么,但是 我怀疑您的代码修改了缓冲区中的换行符。您可能应该避免这种情况,并保持不变。我想您只需将它们添加到您的比较列表中并为不修改的字符分支。
对于 rot13 程序来说,这可能比在缓冲区末尾添加一个额外的换行符或额外调用一次 sys_write 来自行打印一个换行符更有用。
您可以使用 strace
测试您的程序进行的系统调用。例如strace ./a.out
将解码您进行的 read() 和 write() 系统调用。
有关更多调试提示,请参阅 x86 标签 wiki 的底部。 (除此之外还有很多有用的东西)。
顺便说一句,您可以在 xmm 寄存器中并行执行所有这些 cmp al, '?'
比较,使用 SSE2(将 al 广播到 xmm 寄存器的每个元素,并使用常量 / PMOVMSKB / test/jnz).但在您很好地掌握标量代码之前,请不要担心这一点。
另一种避免 CMP/JCC 鼠窝的方法是将字母字符列入白名单,默认情况下不修改输入字符。
我不确定为什么你只将 '1'
列入黑名单,而不是其他号码,或者 '+'
而不是 '-'
,等等。
这是我实现循环的方式,使用一些 "advanced" 技巧将多个相似条件折叠成单个条件。有关 isalpha() 的无符号比较技巧的解释,请参阅我在 上的回答。
;; ROT13 alphabetic characters. Copy others unmodified.
;; Untested
L1_top:
movzx eax, [esi] ; get a character
inc esi ; update source pointer
mov edx, eax ; save a copy of the original
or al, 0x20 ; make it lower-case if it's a letter (but we can still detect non-letters after this)
sub al, 'a' ; chars below 'a' will wrap to a high value
cmp al, 'z'-'a'
ja .non_alpha ; jump if the sub wrapped, or the char was greater than 'z'
; input char was alphabetic
sub dl, 13 ; modify the original character
sub al, 13 ; check if that takes us out of the alphabet. Can be a CMP, not SUB if we want.
jnc .nocarry
add dl, 26 ; add 26 if the subtract wrapped
;add al, 26 ; we don't care about the value in al anymore
.nocarry:
; dl = the ROT13'ed character, with its original case
.non_alpha:
mov [edi], dl
inc edi
dec ecx ; I'm not sure what all the cmp ecx,0 in various branches was for. Just do it earlier if necessary.
jnz L1_top
本来我打算实际计算AL中的小写ROT13'ed字符,然后找到它与原始小写字符之间的差异,并将其应用于DL。但是后来我意识到我可以在早期的分支中有条件地修改DL。
;; after the or al,0x20: mov ah, al ; don't over-do it with upper-half byte registers. False dependencies on AMD, and partial-reg merging stalls or slowdowns on pre-Haswell Intel if you're not careful.
add al, 'a' ; 'a' + al is the lower-cased ROT13 of the input character
sub ah, al ; ah = lcase(orig) - lcase(rot13)
sub dl, ah ; apply that delta to the original in dl
; dl is the original character - 13 (plus 26 if necessary)
所以我的 ROT13 密码几乎可以满足我的要求,但是最后命令提示符出现在与最后一行输出相同的行上。这是我在 Assembly 中的第一个项目,所以我不确定自己做错了什么。
您的程序不会在其输出末尾打印换行符,因此当它退出时光标位于非空行的末尾。 shell 不知道这一点,并在那里打印下一个提示。
echo foo
包含尾随换行符,因此当 shell 打印下一个提示时,光标已经在新行的开头。 echo -n foo
不包含尾随换行符,因此它会将光标留在以 foo
开头的行的末尾,并且您的提示会附加到该行上,就像您的程序一样。将这些 echo 命令通过管道传输到 hd
以查看它们打印的 ASCII 字符的十六进制转储。
因此解决方案是确保您的输出以换行符结尾(ASCII 代码 = 10)。您的 msg4: db 10, "Read error", 10
字符串中已经有了它。 (它以一个换行符开始,也以一个换行符结束。)在 C 中,你会写 `"\nRead error\n",但是 NASM 语法不能那样工作。它确实支持反引号字符串内的 C 风格转义,但人们通常使用数字常量编写换行符。
您的用户输入(从 sys_read 获得)通常应以换行符结尾,除非用户在一行中键入 256 个字符,或使用 ctrl-D 提前读取 return . (或者不以换行符结尾的类似管道输入,因此读取命中 EOF)。
我开始遵循比较的逻辑,但很快就厌倦了。我不确定您的输入中的换行符会发生什么,但是 我怀疑您的代码修改了缓冲区中的换行符。您可能应该避免这种情况,并保持不变。我想您只需将它们添加到您的比较列表中并为不修改的字符分支。
对于 rot13 程序来说,这可能比在缓冲区末尾添加一个额外的换行符或额外调用一次 sys_write 来自行打印一个换行符更有用。
您可以使用 strace
测试您的程序进行的系统调用。例如strace ./a.out
将解码您进行的 read() 和 write() 系统调用。
有关更多调试提示,请参阅 x86 标签 wiki 的底部。 (除此之外还有很多有用的东西)。
顺便说一句,您可以在 xmm 寄存器中并行执行所有这些 cmp al, '?'
比较,使用 SSE2(将 al 广播到 xmm 寄存器的每个元素,并使用常量 / PMOVMSKB / test/jnz).但在您很好地掌握标量代码之前,请不要担心这一点。
另一种避免 CMP/JCC 鼠窝的方法是将字母字符列入白名单,默认情况下不修改输入字符。
我不确定为什么你只将 '1'
列入黑名单,而不是其他号码,或者 '+'
而不是 '-'
,等等。
这是我实现循环的方式,使用一些 "advanced" 技巧将多个相似条件折叠成单个条件。有关 isalpha() 的无符号比较技巧的解释,请参阅我在
;; ROT13 alphabetic characters. Copy others unmodified.
;; Untested
L1_top:
movzx eax, [esi] ; get a character
inc esi ; update source pointer
mov edx, eax ; save a copy of the original
or al, 0x20 ; make it lower-case if it's a letter (but we can still detect non-letters after this)
sub al, 'a' ; chars below 'a' will wrap to a high value
cmp al, 'z'-'a'
ja .non_alpha ; jump if the sub wrapped, or the char was greater than 'z'
; input char was alphabetic
sub dl, 13 ; modify the original character
sub al, 13 ; check if that takes us out of the alphabet. Can be a CMP, not SUB if we want.
jnc .nocarry
add dl, 26 ; add 26 if the subtract wrapped
;add al, 26 ; we don't care about the value in al anymore
.nocarry:
; dl = the ROT13'ed character, with its original case
.non_alpha:
mov [edi], dl
inc edi
dec ecx ; I'm not sure what all the cmp ecx,0 in various branches was for. Just do it earlier if necessary.
jnz L1_top
本来我打算实际计算AL中的小写ROT13'ed字符,然后找到它与原始小写字符之间的差异,并将其应用于DL。但是后来我意识到我可以在早期的分支中有条件地修改DL。
;; after the or al,0x20: mov ah, al ; don't over-do it with upper-half byte registers. False dependencies on AMD, and partial-reg merging stalls or slowdowns on pre-Haswell Intel if you're not careful.
add al, 'a' ; 'a' + al is the lower-cased ROT13 of the input character
sub ah, al ; ah = lcase(orig) - lcase(rot13)
sub dl, ah ; apply that delta to the original in dl
; dl is the original character - 13 (plus 26 if necessary)