Python 虚拟机是否需要 CPU 来执行字节码?

Does Python Virtual Machine require a CPU to execute the bytecode?

Python 虚拟机是否需要 CPU 来执行字节码?是字节码转换成机器码然后CPU参与这个过程吗?

PVM 只不过是一种将字节码转换为给定操作系统的机器码的软件。因此,Python 被称为解释语言,PVM 是解释器。回答你的问题:是的,代码最终由 PVM 转换成机器码。 阅读更多 here.

为了 运行 任何计算机上的应用程序,其代码必须始终以某种方式转换为机器代码,然后由 CPU 执行。问题是这种情况何时以及如何发生。

让我试着向您展示 Python 如何有效地执行字节码。

编译器与解释器

想象一下,您计算机中的 CPU 只懂拉丁语。您想给它发送一封包含详细说明或请求的信件,但您不会说拉丁语。因此,您将聘请翻译人员:为您将您的“英文”字母(或您使用的任何语言)翻译成拉丁文的人。

C 或 Rust 等编译语言 把你的整封信都翻译成拉丁文,然后真正润色它。结果是一封极具诗意且使用复杂语言的翻译信件。另一方面,像 Python 这样的 口译员 一次翻译一个词或一个句子;它更像是你在新闻中遇到的翻译,翻译外语人士所说的内容。

字节码

从 C、Rust 或 Python 等语言到机器代码的完整翻译过程非常复杂,需要仔细分析原始程序代码。为了避免不得不一遍又一遍地分析你的程序代码,Python 解释器将只做一次,然后生成 bytecode 这是你的非常接近的表示Python 代码,但拆分为基本元素。

让我们来看一个非常简单的Python函数:

def f(x):
    y = (x + 1)*(x - 1)
    return y

此函数中的计算包含多个计算,所有计算都必须按正确的顺序执行。字节码反映了这一点:

    LOAD_VAR     x    # x+1
    LOAD_CONST   1
    ADD
    LOAD_VAR     x    # x-1
    LOAD_CONST   1
    SUBTRACT
    MULTIPLY          # ()*()
    STORE_VAR    y    # y = ...
    LOAD_VAR     y
    RETURN

事实上,Python 中的字节码通常是 Python 代码本身的非常接近的表示,只是分解成 'atomic' 简单操作的片段。

在内部,每个字节码指令都有一个数值(实际上适合一个字节,因此得名)。如LOAD_VAR = 124LOAD_CONST = 100ADD = 23等。局部变量和常量值也用数字表示。因此,如果我们分配x = 01y = 02,上面的代码就变成了:

  124,  01, 100,  01,  23, 124,  01, 100,  01,  
   24,  20, 125,  02, 124,  02,  83

正在执行字节码

您将在下面找到一个简单且简约的 'Python bytecode' 解释器,它能够执行我们在开始时定义的功能。 actual bytecode interpreter of Python 是用 C 编写的,因此可以编译为高效的机器代码。但是原理是完全一样的

它使用堆栈 来保存中间值。也就是说,每个操作的结果都附加到一个列表中。进一步处理这些结果的操作将它们从列表的末尾移除,做一些事情(比如将它们加在一起),然后将结果追加回列表(但是在做减法或除法等操作时必须小心以保持正确的顺序)。

将字节码安排成指令和参数对很方便。一些指令(如 ADD)没有参数,所以在这种情况下我们只使用 0。但是这里使用的代码还是上面给出的字节码。

def execute(bytecode, consts, vars):
    stack = []
    for (instr, arg) in bytecode:
        if instr == 20:
            stack.append(stack.pop() * stack.pop())
        elif instr == 23:
            stack.append(stack.pop() + stack.pop())
        elif instr == 24:
            second = stack.pop()
            first  = stack.pop()
            stack.append(first - second)
        elif instr == 83:
            return stack.pop()
        elif instr == 100:
            stack.append( consts[arg] )
        elif instr == 124:
            stack.append( vars[arg] )
        elif instr == 125:
            vars[arg] = stack.pop()

my_bytecode = [
  (124, 1), (100, 1), (23, 0), (124, 1), (100, 1), 
   (24, 0), (20, 0), (125, 2), (124, 2),  (83, 0)
]
my_consts = [ None, 1 ]   
my_vars   = [ x, 0 ]
execute(my_bytecode, my_consts, my_vars)

您实际上可以查看常量值列表(尽管它们实际上是元组,而不是列表),或者局部变量的定义顺序是:

print(f.__code__.co_code)      # prints the bytecode
print(f.__code__.co_consts)    # prints (None, 1)
print(f.__code__.co_varnames)  # prints ('x', 'y')

当然,使用 inspect and dis 模块更方便。