在C中有效地对二维数组的列进行排序

Efficiently sort a column of a two-dimensional array in C

我通过 malloc 在 C 中创建一个二维数组,如下所示:

double **x;     
x = malloc(rows * sizeof(double*));
for (n = 0; n < rows; n++){
    x[n] = malloc(columns * sizeof(double));
    memset(x[n], 0, columns * sizeof(double));
}

我还检查 malloc 是否失败,但为了更好的可读性,我发布了那个版本。它实际上工作正常。

现在我有了一个按行对元素进行 qsorting 的函数:

double qsort_row_wise(double points[], int points_count)

我可以通过以下方式调用具有 4+1 列的特定行(第 3 行/第 4 行):

my_qsort(x[3], 4);

这个函数正在接收一个正常的数组并且也运行良好。

现在我想用这个函数对一列进行qsort。这就是为什么我要搜索这样的东西(不起作用):

my_qsort(x[][3], 4);

x[][3]这里表示第3列所有元素的向量。

如果可能的话,我想做一个类似 "vector" 的操作,而不是逐步选择所有内容(for 循环)以获得最佳性能。

嗯,您需要创建一个数组,其大小为您拥有的行数,因为列由 n 行组成。

double *cols = malloc(nofrows * sizeof(double));

然后在行上遍历二维数组并将列索引用作常量:

int whichcolumn = 1;
for (int i = 0; i < rows; i++)
  cols[i] = x[i][whichcolumn];

然后将 cols 传递给 qsort 函数

qsort_row_wise(cols, nofrows);

If possible I would like to do a vector-operation, not selecting everything step by step(for loop) for best performance.

这是不可能的。

您的第一个代码片段创建的不是二维数组,而是一个一维指针数组,每个元素指向一个 double 的一维数组。这样的构造有时称为 "scattered" 数组,因为它由 "number of rows"+1 不一定是连续的内存块组成。

从后一个事实得出结论,您无法提取列,因为元素分布在整个内存中,无法通过单个操作进行处理。

既然你想要一个二维数组,最好将它分配为一个连续的块:

double *x = calloc(rows * columns, sizeof(double)); // does zero init

现在您可以使用算术索引,所以您的 my_qsort 函数应该这样声明:

void my_qsort(double *start, size_t count, size_t stride);

现在要对第 3 行进行排序,您可以这样做:

my_qsort(x + 3 * columns, columns, 1);

要对第 5 列进行排序,您可以这样做:

my_qsort(x + 5, rows, columns);

排序时,需要访问的元素是start[ii * stride],其中ii0countstart 当然只是二维数组中您希望排序的第一个单元格——通常是行中最左边的单元格或列中的顶部单元格。也可以使用相同的函数对行或列的一部分进行排序,或者对矩阵中的任意 "line" 进行排序,例如方阵的对角线:

my_qsort(x, rows, columns + 1);

使用单个分配来存储二维数组不仅使 "strided" 操作更容易,而且效率更高,因为它减少了分配的数量,改善了空间局部性,并且 Linux , 增加了当你 free 内存时立即回收内存的机会,因为 "large" 分配是通过 mmap 而不是 sbrk.

完成的