收集 MPI 跟踪

Collecting an MPI Trace

如何在超级计算机上收集 MPI 通信跟踪?

我需要包含我可以解析的每条消息的详细信息(比如发件人、收件人、大小等)的文本文件。 我正在为 Intel MPI 使用以下命令,但没有看到任何文本文件。

mpirun -trace -n 4 -trace-pt2pt -trace-collectives ./myApp

不熟悉Intel MPI的集成方案

有许多工具可以提供 MPI 跟踪。

注重性能:

正确性检查:

我建议不要推出自己的解决方案,因为将接收与发送进行匹配并不直接,而且您可能 运行 遇到计时问题,因为计时器未跨节点同步。

你可以,例如使用 Score-P 跟踪 运行,然后在跟踪上使用 otf2-print 命令以获得所需的文本输出。或者您可以使用 OTF2 reader 库并在其上开发工具。 Here is a short tutorial on how to run Score-P, starting at slide 17