在C中有效地对二维数组的列进行排序

Question

我通过 malloc 在 C 中创建一个二维数组，如下所示：

double **x;     
x = malloc(rows * sizeof(double*));
for (n = 0; n < rows; n++){
    x[n] = malloc(columns * sizeof(double));
    memset(x[n], 0, columns * sizeof(double));
}

我还检查 malloc 是否失败，但为了更好的可读性，我发布了那个版本。它实际上工作正常。

现在我有了一个按行对元素进行 qsorting 的函数:

double qsort_row_wise(double points[], int points_count)

我可以通过以下方式调用具有 4+1 列的特定行（第 3 行/第 4 行）：

my_qsort(x[3], 4);

这个函数正在接收一个正常的数组并且也运行良好。

现在我想用这个函数对一列进行qsort。这就是为什么我要搜索这样的东西（不起作用）：

my_qsort(x[][3], 4);

x[][3]这里表示第3列所有元素的向量。

如果可能的话，我想做一个类似 "vector" 的操作，而不是逐步选择所有内容（for 循环）以获得最佳性能。

Answer 1

嗯，您需要创建一个数组，其大小为您拥有的行数，因为列由 n 行组成。

double *cols = malloc(nofrows * sizeof(double));

然后在行上遍历二维数组并将列索引用作常量：

int whichcolumn = 1;
for (int i = 0; i < rows; i++)
  cols[i] = x[i][whichcolumn];

然后将 cols 传递给 qsort 函数

qsort_row_wise(cols, nofrows);

Answer 2

If possible I would like to do a vector-operation, not selecting everything step by step(for loop) for best performance.

这是不可能的。

您的第一个代码片段创建的不是二维数组，而是一个一维指针数组，每个元素指向一个 double 的一维数组。这样的构造有时称为 "scattered" 数组，因为它由 "number of rows"+1 不一定是连续的内存块组成。

从后一个事实得出结论，您无法提取列，因为元素分布在整个内存中，无法通过单个操作进行处理。

Answer 3

既然你想要一个二维数组，最好将它分配为一个连续的块：

double *x = calloc(rows * columns, sizeof(double)); // does zero init

现在您可以使用算术索引，所以您的 my_qsort 函数应该这样声明：

void my_qsort(double *start, size_t count, size_t stride);

现在要对第 3 行进行排序，您可以这样做：

my_qsort(x + 3 * columns, columns, 1);

要对第 5 列进行排序，您可以这样做：

my_qsort(x + 5, rows, columns);

排序时，需要访问的元素是start[ii * stride]，其中ii从0到count。 start 当然只是二维数组中您希望排序的第一个单元格——通常是行中最左边的单元格或列中的顶部单元格。也可以使用相同的函数对行或列的一部分进行排序，或者对矩阵中的任意 "line" 进行排序，例如方阵的对角线：

my_qsort(x, rows, columns + 1);

使用单个分配来存储二维数组不仅使 "strided" 操作更容易，而且效率更高，因为它减少了分配的数量，改善了空间局部性，并且 Linux , 增加了当你 free 内存时立即回收内存的机会，因为 "large" 分配是通过 mmap 而不是 sbrk.

完成的

在C中有效地对二维数组的列进行排序

Efficiently sort a column of a two-dimensional array in C

c

arrays

sorting

quicksort

multidimensional-array