霍克尼模型参数是消息大小的函数吗?

Are the Hockney model parameters functions of message size?

使用霍克尼模型,传输时间由 t(s) = α + βm 建模,其中 α 是每条消息的延迟时间,β 是每字节的传输时间(或网络带宽的倒数)。

但是从一些论文 (like this paper) 来看,延迟和传输时间是消息大小的函数。对于多种消息大小,它们既不是常数也不是线性的!

如果霍克尼模型参数是消息大小的函数,我们如何预测具有多种消息大小的集体通信时间(例如:用于广播、分散等)?

例子:若采用Flat Tree算法进行广播操作,则t(s)=(P-1)(α + βm)。因为 α 和 β 是消息大小的函数,我们不能用直线绘制它的曲线,没有与消息大小对应的模型参数,我们不能预测运行时间。例如,如果我们没有测量发送和接收 30 字节消息的模型参数,我们就无法预测 30 字节消息大小的操作时间。

在 Hockney 中,α 和 β 是网络的属性,与消息大小无关。虽然提到的论文明确指出:

We altered Hockney model such that α and β are functions of message size.

我同意令人困惑的是,他们总是简单地将他们修改后的模型称为 Hockney。该图表在论文中看起来也很可疑,好像 "Latency" 实际上是消息传输时间。您可以将此延迟称为 ,如从应用程序中看到的那样 。而"Bandwidth"也是从应用看到的带宽。考虑 10^6 bytes / 65 MBytes/s = 1.5 * 10^4 us。我认为使用这些反映总消息传输时间的值作为 Hockney 的附加个人 网络 参数没有任何意义。不幸的是,这篇论文没有解释他们实际上是如何从他们的点对点 MPI 基准中导出参数的。

还值得注意的是,论文几乎总是简单地使用消息传输时间的完整术语 α(ms) + ms · β(ms),除了两种情况,我怀疑它可能是缺少一对大括号。然后,整个术语可以简单地替换为 p2p message time (message size).

对于模型,我更愿意使用具有常量 α 和 β 的纯 Hockney - 或者将 p2p 消息时间描述为消息大小函数的模型。在后一种情况下,您的问题仍然相关:

For instance, we cannot predict the operation time for a message size of 30 bytes if we have not measured model parameters which send and receive 30 byte messages.

要么您必须测量所有可能的尺寸,要么您必须应用拟合模型。顺便说一句 - 如果你使用线性回归,你最终会再次得到 Hockney