处理器在 OpCodes 和 Data 之间有何不同？

How does the processor differ between OpCodes and Data?

我正在尝试编写一个反汇编程序，我想知道处理器如何区分 OpCodes 和 Data-Bytes。

例如，这是 "Hello World" 的字节表示： 0x48 0x65 0x6c 0x6c 0x6f 0x20 0x57 0x6f 0x72 0x6c 0x64 0x00

但是处理器 "know" 是如何说的 "Hello World" 而实际上不是这样的：_ _ INS INS OUTS AND _ OUTS JB INS _ ADD

非常欢迎解释。

不能。在哈沃德架构中，数据和代码的明确分离将防止这个问题，在冯诺依曼架构中，代码就是数据。

这取决于程序员 而不是 使 CPU 执行不需要的 code/data。

处理器知道，因为入口点是已知的。处理器按执行顺序解码，这也是您应该如何反汇编可变长度指令集的方式。固定长度你可以从入口点线性地遍历内存，但是可变长度你需要按执行顺序去。这当然不是万无一失的，很容易绊倒反汇编程序，所以请注意这是可能的，我建议您保持跟踪。我通常对指令的入口点（某些 ISA 中的操作码）和非入口字节做一个 table，这样如果我分支到指令的中间，我可以在那里停止反汇编程序的路径（当然你必须覆盖所有可能的路径）。

关于操作码与数据，只要工具链和程序员做了正确的工作，一条指令就会根据需要移交给另一条跳过数据区域的指令。

处理器非常愚蠢，它们没有很多真正的功能，一些 alu 的东西，从地址读取和写入，将数据移入和移出寄存器。一半的工作是为他们提供遵守规则的程序。

处理器在 OpCodes 和 Data 之间有何不同？

How does the processor differ between OpCodes and Data?

assembly

opcode