MPI_Probe 的线程安全

Thread Safety with MPI_Probe

我正在使用 MPI_Probe 动态发送消息(接收方不知道所发送消息的大小)。我的代码看起来有点像这样 -

if (world_rank == 0) {
    int *buffer = ...
    int bufferSize = ...
    MPI_Send(buffer, buffersize, MPI_INT, 1, 0, MPI_COMM_WORLD);
} else if (world_rank == 1) {
    MPI_Status status;
    MPI_Probe(0, 0, MPI_COMM_WORLD, &status);
    int count = -1;
    MPI_Get_count(&status, MPI_INT, &count);
    int* buffer = (int*)malloc(sizeof(int) * count);
    MPI_Recv(buffer, count, MPI_INT, 0, 0, MPI_COMM_WORLD, MPI_STATUS_IGNORE);
}

如果我 运行 这段代码在多个线程中,是否有可能 MPI_Probe 在一个线程中被调用而 MPI_recv 在另一个线程中被调用,因为调度程序交织线程。本质上,上面的代码是线程安全的。

首先,MPI默认不是线程安全的。您必须检查您的特定库是否已针对线程安全进行编译,然后使用 MPI_Init_thread 而不是 MPI_Init.

初始化 MPI

假设您的 MPI 实例是为线程安全例程初始化的,由于您已经确定的竞争条件,您的代码仍然不是线程安全的。

MPI_ProbeMPI_Recv 在多线程环境中的配对不是线程安全的,这是 MPI-2 中的一个已知问题:http://htor.inf.ethz.ch/publications/img/gregor-any_size-mpi3.pdf

至少有两种可能的解决方案。您可以使用 MPI-3 MPI_MprobeMPI_MRecv,或者在关键代码周围使用 lock/mutex。这可能如下所示:

MPI-2 解决方案(使用 mutex/lock):

int number_amount;
if (world_rank == 0) {
    int *buffer = ...
    int bufferSize = ...
    MPI_Send(buffer, buffersize, MPI_INT, 1, 0, MPI_COMM_WORLD);
} else if (world_rank == 1) {
    MPI_Status status;
    int count = -1;
    /* aquire mutex/lock */
    MPI_Probe(0, 0, MPI_COMM_WORLD, &status);
    MPI_Get_count(&status, MPI_INT, &count);
    int* buffer = (int*)malloc(sizeof(int) * count);
    MPI_Recv(buffer, count, MPI_INT, 0, 0, MPI_COMM_WORLD, MPI_STATUS_IGNORE);
    /* release mutex/lock */
}

MPI-3 解决方案:

int number_amount;
if (world_rank == 0) {
    int *buffer = ...
    int bufferSize = ...
    MPI_Send(buffer, buffersize, MPI_INT, 1, 0, MPI_COMM_WORLD);
} else if (world_rank == 1) {
    MPI_Status status;
    MPI_Message msg;
    int count = -1;
    MPI_Mprobe(0, 0, MPI_COMM_WORLD, &msg, &status);
    MPI_Get_count(&status, MPI_INT, &count);
    int* buffer = (int*)malloc(sizeof(int) * count);
    MPI_Mrecv(buffer, count, MPI_INT, &msg, MPI_STATUS_IGNORE);
}