难以理解 MPI_Type_create_struct

Trouble Understanding MPI_Type_create_struct

我无法理解 MPI_Type_create_struct 方法。假设我们有一个结构:

   struct foo(){
       float value;
       char rank;
   }

我们想将这个结构发送到另一个进程。考虑下面的代码示例:

int count = 2; //number of elements in struct
MPI_Aint offsets[count] = {0, 8};
int blocklengths[count] = {1, 1};
MPI_Datatype types[count] = {MPI_FLOAT, MPI_CHAR};
MPI_Datatype my_mpi_type;

MPI_Type_create_struct(count, blocklengths, offsets, types, &my_mpi_type);

我不确定偏移量和块长度在此示例中的作用。有人可以解释一下上面的这两部分吗?

如您所知,MPI_Type_create_struct() 的目的是提供一种方法来创建用户的 MPI_Datatype 映射其结构化类型。这些新类型随后将可用于 MPI 通信和其他调用,就像默认类型一样,例如允许以与传输 ints 或 floats 数组相同的方式传输结构数组。

现在让我们更详细地了解函数本身。
这是由 man 命令编辑的 return 的概要:

NAME
   MPI_Type_create_struct -  Create an MPI datatype from a general set of
           datatypes, displacements, and block sizes

SYNOPSIS
   int MPI_Type_create_struct(int count,
                              const int array_of_blocklengths[],
                              const MPI_Aint array_of_displacements[],
                              const MPI_Datatype array_of_types[],
                              MPI_Datatype *newtype)

INPUT PARAMETERS
   count   - number  of  blocks  (integer)  ---  also number of entries
             in arrays array_of_types, array_of_displacements and
             array_of_blocklengths
   array_of_blocklengths
           - number of elements in each block (array of integer)
   array_of_displacements
           - byte displacement of each block (array of address integer)
   array_of_types
           - type of elements in each block (array of handles to datatype
             objects)

OUTPUT PARAMETERS
   newtype - new datatype (handle)

让我们看看输入参数的含义是否需要进一步解释:

  • count:这很清楚,在你的情况下,那将是 2
  • array_of_types:好吧,你的例子是 { MPI_FLOAT, MPI_CHAR }
  • array_of_blocklengths:再说一遍,不多说了。 { 1, 1 } 这里是你需要的
  • array_of_displacements:这是你要多加小心的地方。它对应于从结构开始到 array_of_types 中列出的每个元素的地址的内存地址偏移量。在您的情况下,这将类似于 { &f.value - &f, &f.rank - &f },其中 f 属于 foo 类型。这里棘手的部分是,由于潜在的对齐约束,您不能确定这是否等于 { 0, sizeof( float ) }(尽管在这里我很确定它会是)。因此,使用所示的地址偏移量使该方法完全可移植。此外(thx Hristo Iliev 将它指向我)你可以(并且应该)使用 stddef.h 中的 offsetof() 宏,它为你做这个指针算法,将代码简化为 { offsetof( foo, value ), offsetof( foo, rank ) } 哪个看起来更好。

以这种方式初始化参数后,对 MPI_Type_create_struct() 的调用将 return 一个新的 MPI_Datatype,它将适合发送或接收 one foo 当时。原因是这种新类型没有考虑结构的实际范围,包括其字段的对齐约束。你的例子在这方面是完美的,因为它(很可能)是空心的。

原因是 float 通常具有 32b 的对齐约束,而 char 具有 none。因此,主题数组的第二个结构foo的起始地址不在第一个结构的末尾。它位于下一个 32b 对齐的内存地址。这将使我们在结构元素的末尾与数组中下一个元素的开始之间留下一个 3 字节的空洞。

要处理这个问题,你必须调整你的类型以使用 MPI_Type_create_resized() 扩展它,概要如下:

NAME
   MPI_Type_create_resized -  Create a datatype with a new lower bound
        and extent from an existing datatype

SYNOPSIS
   int MPI_Type_create_resized(MPI_Datatype oldtype,
                               MPI_Aint lb,
                               MPI_Aint extent,
                               MPI_Datatype *newtype)

INPUT PARAMETERS
   oldtype - input datatype (handle)
   lb      - new lower bound of datatype (address integer)
   extent  - new extent of datatype (address integer)

OUTPUT PARAMETERS
   newtype - output datatype (handle)

使用起来非常简单,因为 lbextend 都可以通过直接调用专门用于此目的的函数 MPI_Type_get_extent() 来检索(但实际上,您也可以直接使用 0sizeof( foo ))。此外,由于用于调用 MPI_Type_get_extent()MPI_Type_create_resized() 的中间类型未在任何实际 MPI 通信中使用,因此不需要使用 MPI_Type_commit() 提交,省去了一些调用和时间。

现在,您的代码变为:

int count = 2;
int array_of_blocklengths[] = { 1, 1 };
MPI_Aint array_of_displacements[] = { offsetof( foo, value ),
                                      offsetof( foo, rank ) };
MPI_Datatype array_of_types[] = { MPI_FLOAT, MPI_CHAR };
MPI_Datatype tmp_type, my_mpi_type;
MPI_Aint lb, extent;

MPI_Type_create_struct( count, array_of_blocklengths, array_of_displacements,
                        array_of_types, &tmp_type );
MPI_Type_get_extent( tmp_type, &lb, &extent );
MPI_Type_create_resized( tmp_type, lb, extent, &my_mpi_type );
MPI_Type_commit( &my_mpi_type );