硬件逻辑操作网格的最大吞吐量

Maximum Throughput of a grid of hardware logic operations

鉴于此系统,并假设我们使用最少数量的寄存器对其进行流水线处理:

如何在不知道流水线化所需的最小寄存器数量的情况下计算最大吞吐量?

C 看起来是一个明显的瓶颈。总吞吐量将类似于每个时钟 C 的一个结果。如果 C 不能进行内部流水线处理,那么其 25ns 的传播延迟将成为系统时钟频率的瓶颈,对吗?

它的其余部分应该可以流水线化,以便经常为 C 准备好输入,因为其他阶段的传播延迟更短。