张量流量化

Tensorflow quantization

我想使用 Tensorflow 的 transform_graph 工具优化图表。我尝试优化来自 MultiNet 的图表(以及其他具有类似编码器-解码器架构的图表)。然而,优化图在使用 quantize_weights 时实际上更慢,而在使用 quantize_nodes 时甚至更慢。从 Tensorflow 的文档来看,在量化的时候可能没有任何改进,甚至可能更慢。知道下面的 graph/software/hardware 是否正常吗?

这是我的系统信息,供您参考:

如果有必要,我可以post复制所有用于复制的脚本。

Tensorflow 中的量化似乎只发生在 CPU 上。参见:https://github.com/tensorflow/tensorflow/issues/2807

我在 PC 环境中遇到了同样的问题。我的模型比不量化慢 9 倍。

但是当我将我的量化模型移植到 android 应用程序中时,可以加快速度。

似乎当前仅适用于 CPU 且仅适用于 ARM 基础 CPU,例如 android phone.