ICudaEngine.serialize() 呼叫生成实际上是什么?
What is actually ICudaEngine.serialize() call generating?
我想知道 TensorRT 家伙的名字 "engine" 到底是什么。我想知道这一点,因为我不确定我是否能够使用相同的引擎来推断不同 GPU 的真实架构。
我知道有一种代码可以执行神经网络推理步骤。我想弄清楚它是否包含 cuda PTX 代码(一种由 CUDA JIT 解释的字节码)或者它可能是为给定 GPU 架构编译的实际二进制文件。
我希望它是一种可移植的字节码。
你有什么线索吗?
非常感谢!
I want to know this because I am not sure if I will be able to use the same engine to infer on top of different GPUs real architectures
创建的 TensorRT 模型根据构建它们的 GPU 架构进行了优化。因此,基于一种 GPU 架构构建的引擎不应该用于不同的架构。
我想知道 TensorRT 家伙的名字 "engine" 到底是什么。我想知道这一点,因为我不确定我是否能够使用相同的引擎来推断不同 GPU 的真实架构。
我知道有一种代码可以执行神经网络推理步骤。我想弄清楚它是否包含 cuda PTX 代码(一种由 CUDA JIT 解释的字节码)或者它可能是为给定 GPU 架构编译的实际二进制文件。
我希望它是一种可移植的字节码。 你有什么线索吗?
非常感谢!
I want to know this because I am not sure if I will be able to use the same engine to infer on top of different GPUs real architectures
创建的 TensorRT 模型根据构建它们的 GPU 架构进行了优化。因此,基于一种 GPU 架构构建的引擎不应该用于不同的架构。