Tensorflows 量化感知训练是否会导致训练期间的实际加速?

Does Tensorflows quantization aware training lead to an actual speedup during training?

我们正在研究在研究项目中使用量化感知训练,以确定训练期间量化对收敛速度和运行时间的影响。尽管我们还不完全相信这是正确的工具。能否请您澄清以下几点: 1)如果在量化感知训练期间量化了一个层,这意味着输入和权重被量化,包括激活函数在内的所有操作都被量化,然后在返回之前,输出被反量化到与下一层兼容的精度。这种理解是否正确? 2) Tensorboard 分析器兼容性? 3) 原则上,量化意识训练是否会导致训练过程中的加速,或者这是不可能的,因为它仅仅是一个模拟? 4) 你能给我们指出一个关于如何将自定义量化器和数据类型添加到 tensorflow s.t 的资源吗?它们与 GPU 兼容?

非常感谢您的帮助!

经过一些研究,QAT 并没有加速训练,只是为 post 训练量化准备模型。然而,MuPPET 是一种实际上通过量化加速训练的算法。