Python 虚拟机是否需要 CPU 来执行字节码?
Does Python Virtual Machine require a CPU to execute the bytecode?
Python 虚拟机是否需要 CPU 来执行字节码?是字节码转换成机器码然后CPU参与这个过程吗?
PVM 只不过是一种将字节码转换为给定操作系统的机器码的软件。因此,Python 被称为解释语言,PVM 是解释器。回答你的问题:是的,代码最终由 PVM 转换成机器码。
阅读更多 here.
为了 运行 任何计算机上的应用程序,其代码必须始终以某种方式转换为机器代码,然后由 CPU 执行。问题是这种情况何时以及如何发生。
让我试着向您展示 Python 如何有效地执行字节码。
编译器与解释器
想象一下,您计算机中的 CPU 只懂拉丁语。您想给它发送一封包含详细说明或请求的信件,但您不会说拉丁语。因此,您将聘请翻译人员:为您将您的“英文”字母(或您使用的任何语言)翻译成拉丁文的人。
C 或 Rust 等编译语言 把你的整封信都翻译成拉丁文,然后真正润色它。结果是一封极具诗意且使用复杂语言的翻译信件。另一方面,像 Python 这样的 口译员 一次翻译一个词或一个句子;它更像是你在新闻中遇到的翻译,翻译外语人士所说的内容。
字节码
从 C、Rust 或 Python 等语言到机器代码的完整翻译过程非常复杂,需要仔细分析原始程序代码。为了避免不得不一遍又一遍地分析你的程序代码,Python 解释器将只做一次,然后生成 bytecode 这是你的非常接近的表示Python 代码,但拆分为基本元素。
让我们来看一个非常简单的Python函数:
def f(x):
y = (x + 1)*(x - 1)
return y
此函数中的计算包含多个计算,所有计算都必须按正确的顺序执行。字节码反映了这一点:
LOAD_VAR x # x+1
LOAD_CONST 1
ADD
LOAD_VAR x # x-1
LOAD_CONST 1
SUBTRACT
MULTIPLY # ()*()
STORE_VAR y # y = ...
LOAD_VAR y
RETURN
事实上,Python 中的字节码通常是 Python 代码本身的非常接近的表示,只是分解成 'atomic' 简单操作的片段。
在内部,每个字节码指令都有一个数值(实际上适合一个字节,因此得名)。如LOAD_VAR = 124
、LOAD_CONST = 100
、ADD = 23
等。局部变量和常量值也用数字表示。因此,如果我们分配x = 01
和y = 02
,上面的代码就变成了:
124, 01, 100, 01, 23, 124, 01, 100, 01,
24, 20, 125, 02, 124, 02, 83
正在执行字节码
您将在下面找到一个简单且简约的 'Python bytecode' 解释器,它能够执行我们在开始时定义的功能。 actual bytecode interpreter of Python 是用 C 编写的,因此可以编译为高效的机器代码。但是原理是完全一样的
它使用堆栈 来保存中间值。也就是说,每个操作的结果都附加到一个列表中。进一步处理这些结果的操作将它们从列表的末尾移除,做一些事情(比如将它们加在一起),然后将结果追加回列表(但是在做减法或除法等操作时必须小心以保持正确的顺序)。
将字节码安排成指令和参数对很方便。一些指令(如 ADD)没有参数,所以在这种情况下我们只使用 0
。但是这里使用的代码还是上面给出的字节码。
def execute(bytecode, consts, vars):
stack = []
for (instr, arg) in bytecode:
if instr == 20:
stack.append(stack.pop() * stack.pop())
elif instr == 23:
stack.append(stack.pop() + stack.pop())
elif instr == 24:
second = stack.pop()
first = stack.pop()
stack.append(first - second)
elif instr == 83:
return stack.pop()
elif instr == 100:
stack.append( consts[arg] )
elif instr == 124:
stack.append( vars[arg] )
elif instr == 125:
vars[arg] = stack.pop()
my_bytecode = [
(124, 1), (100, 1), (23, 0), (124, 1), (100, 1),
(24, 0), (20, 0), (125, 2), (124, 2), (83, 0)
]
my_consts = [ None, 1 ]
my_vars = [ x, 0 ]
execute(my_bytecode, my_consts, my_vars)
您实际上可以查看常量值列表(尽管它们实际上是元组,而不是列表),或者局部变量的定义顺序是:
print(f.__code__.co_code) # prints the bytecode
print(f.__code__.co_consts) # prints (None, 1)
print(f.__code__.co_varnames) # prints ('x', 'y')
Python 虚拟机是否需要 CPU 来执行字节码?是字节码转换成机器码然后CPU参与这个过程吗?
PVM 只不过是一种将字节码转换为给定操作系统的机器码的软件。因此,Python 被称为解释语言,PVM 是解释器。回答你的问题:是的,代码最终由 PVM 转换成机器码。 阅读更多 here.
为了 运行 任何计算机上的应用程序,其代码必须始终以某种方式转换为机器代码,然后由 CPU 执行。问题是这种情况何时以及如何发生。
让我试着向您展示 Python 如何有效地执行字节码。
编译器与解释器
想象一下,您计算机中的 CPU 只懂拉丁语。您想给它发送一封包含详细说明或请求的信件,但您不会说拉丁语。因此,您将聘请翻译人员:为您将您的“英文”字母(或您使用的任何语言)翻译成拉丁文的人。
C 或 Rust 等编译语言 把你的整封信都翻译成拉丁文,然后真正润色它。结果是一封极具诗意且使用复杂语言的翻译信件。另一方面,像 Python 这样的 口译员 一次翻译一个词或一个句子;它更像是你在新闻中遇到的翻译,翻译外语人士所说的内容。
字节码
从 C、Rust 或 Python 等语言到机器代码的完整翻译过程非常复杂,需要仔细分析原始程序代码。为了避免不得不一遍又一遍地分析你的程序代码,Python 解释器将只做一次,然后生成 bytecode 这是你的非常接近的表示Python 代码,但拆分为基本元素。
让我们来看一个非常简单的Python函数:
def f(x):
y = (x + 1)*(x - 1)
return y
此函数中的计算包含多个计算,所有计算都必须按正确的顺序执行。字节码反映了这一点:
LOAD_VAR x # x+1
LOAD_CONST 1
ADD
LOAD_VAR x # x-1
LOAD_CONST 1
SUBTRACT
MULTIPLY # ()*()
STORE_VAR y # y = ...
LOAD_VAR y
RETURN
事实上,Python 中的字节码通常是 Python 代码本身的非常接近的表示,只是分解成 'atomic' 简单操作的片段。
在内部,每个字节码指令都有一个数值(实际上适合一个字节,因此得名)。如LOAD_VAR = 124
、LOAD_CONST = 100
、ADD = 23
等。局部变量和常量值也用数字表示。因此,如果我们分配x = 01
和y = 02
,上面的代码就变成了:
124, 01, 100, 01, 23, 124, 01, 100, 01,
24, 20, 125, 02, 124, 02, 83
正在执行字节码
您将在下面找到一个简单且简约的 'Python bytecode' 解释器,它能够执行我们在开始时定义的功能。 actual bytecode interpreter of Python 是用 C 编写的,因此可以编译为高效的机器代码。但是原理是完全一样的
它使用堆栈 来保存中间值。也就是说,每个操作的结果都附加到一个列表中。进一步处理这些结果的操作将它们从列表的末尾移除,做一些事情(比如将它们加在一起),然后将结果追加回列表(但是在做减法或除法等操作时必须小心以保持正确的顺序)。
将字节码安排成指令和参数对很方便。一些指令(如 ADD)没有参数,所以在这种情况下我们只使用 0
。但是这里使用的代码还是上面给出的字节码。
def execute(bytecode, consts, vars):
stack = []
for (instr, arg) in bytecode:
if instr == 20:
stack.append(stack.pop() * stack.pop())
elif instr == 23:
stack.append(stack.pop() + stack.pop())
elif instr == 24:
second = stack.pop()
first = stack.pop()
stack.append(first - second)
elif instr == 83:
return stack.pop()
elif instr == 100:
stack.append( consts[arg] )
elif instr == 124:
stack.append( vars[arg] )
elif instr == 125:
vars[arg] = stack.pop()
my_bytecode = [
(124, 1), (100, 1), (23, 0), (124, 1), (100, 1),
(24, 0), (20, 0), (125, 2), (124, 2), (83, 0)
]
my_consts = [ None, 1 ]
my_vars = [ x, 0 ]
execute(my_bytecode, my_consts, my_vars)
您实际上可以查看常量值列表(尽管它们实际上是元组,而不是列表),或者局部变量的定义顺序是:
print(f.__code__.co_code) # prints the bytecode
print(f.__code__.co_consts) # prints (None, 1)
print(f.__code__.co_varnames) # prints ('x', 'y')