在C中有效地对二维数组的列进行排序
Efficiently sort a column of a two-dimensional array in C
我通过 malloc 在 C 中创建一个二维数组,如下所示:
double **x;
x = malloc(rows * sizeof(double*));
for (n = 0; n < rows; n++){
x[n] = malloc(columns * sizeof(double));
memset(x[n], 0, columns * sizeof(double));
}
我还检查 malloc 是否失败,但为了更好的可读性,我发布了那个版本。它实际上工作正常。
现在我有了一个按行对元素进行 qsorting 的函数:
double qsort_row_wise(double points[], int points_count)
我可以通过以下方式调用具有 4+1 列的特定行(第 3 行/第 4 行):
my_qsort(x[3], 4);
这个函数正在接收一个正常的数组并且也运行良好。
现在我想用这个函数对一列进行qsort。这就是为什么我要搜索这样的东西(不起作用):
my_qsort(x[][3], 4);
x[][3]这里表示第3列所有元素的向量。
如果可能的话,我想做一个类似 "vector" 的操作,而不是逐步选择所有内容(for 循环)以获得最佳性能。
嗯,您需要创建一个数组,其大小为您拥有的行数,因为列由 n 行组成。
double *cols = malloc(nofrows * sizeof(double));
然后在行上遍历二维数组并将列索引用作常量:
int whichcolumn = 1;
for (int i = 0; i < rows; i++)
cols[i] = x[i][whichcolumn];
然后将 cols 传递给 qsort 函数
qsort_row_wise(cols, nofrows);
If possible I would like to do a vector-operation, not selecting everything step by step(for loop) for best performance.
这是不可能的。
您的第一个代码片段创建的不是二维数组,而是一个一维指针数组,每个元素指向一个 double
的一维数组。这样的构造有时称为 "scattered" 数组,因为它由 "number of rows"+1 不一定是连续的内存块组成。
从后一个事实得出结论,您无法提取列,因为元素分布在整个内存中,无法通过单个操作进行处理。
既然你想要一个二维数组,最好将它分配为一个连续的块:
double *x = calloc(rows * columns, sizeof(double)); // does zero init
现在您可以使用算术索引,所以您的 my_qsort
函数应该这样声明:
void my_qsort(double *start, size_t count, size_t stride);
现在要对第 3 行进行排序,您可以这样做:
my_qsort(x + 3 * columns, columns, 1);
要对第 5 列进行排序,您可以这样做:
my_qsort(x + 5, rows, columns);
排序时,需要访问的元素是start[ii * stride]
,其中ii
从0
到count
。 start
当然只是二维数组中您希望排序的第一个单元格——通常是行中最左边的单元格或列中的顶部单元格。也可以使用相同的函数对行或列的一部分进行排序,或者对矩阵中的任意 "line" 进行排序,例如方阵的对角线:
my_qsort(x, rows, columns + 1);
使用单个分配来存储二维数组不仅使 "strided" 操作更容易,而且效率更高,因为它减少了分配的数量,改善了空间局部性,并且 Linux , 增加了当你 free
内存时立即回收内存的机会,因为 "large" 分配是通过 mmap
而不是 sbrk
.
完成的
我通过 malloc 在 C 中创建一个二维数组,如下所示:
double **x;
x = malloc(rows * sizeof(double*));
for (n = 0; n < rows; n++){
x[n] = malloc(columns * sizeof(double));
memset(x[n], 0, columns * sizeof(double));
}
我还检查 malloc 是否失败,但为了更好的可读性,我发布了那个版本。它实际上工作正常。
现在我有了一个按行对元素进行 qsorting 的函数:
double qsort_row_wise(double points[], int points_count)
我可以通过以下方式调用具有 4+1 列的特定行(第 3 行/第 4 行):
my_qsort(x[3], 4);
这个函数正在接收一个正常的数组并且也运行良好。
现在我想用这个函数对一列进行qsort。这就是为什么我要搜索这样的东西(不起作用):
my_qsort(x[][3], 4);
x[][3]这里表示第3列所有元素的向量。
如果可能的话,我想做一个类似 "vector" 的操作,而不是逐步选择所有内容(for 循环)以获得最佳性能。
嗯,您需要创建一个数组,其大小为您拥有的行数,因为列由 n 行组成。
double *cols = malloc(nofrows * sizeof(double));
然后在行上遍历二维数组并将列索引用作常量:
int whichcolumn = 1;
for (int i = 0; i < rows; i++)
cols[i] = x[i][whichcolumn];
然后将 cols 传递给 qsort 函数
qsort_row_wise(cols, nofrows);
If possible I would like to do a vector-operation, not selecting everything step by step(for loop) for best performance.
这是不可能的。
您的第一个代码片段创建的不是二维数组,而是一个一维指针数组,每个元素指向一个 double
的一维数组。这样的构造有时称为 "scattered" 数组,因为它由 "number of rows"+1 不一定是连续的内存块组成。
从后一个事实得出结论,您无法提取列,因为元素分布在整个内存中,无法通过单个操作进行处理。
既然你想要一个二维数组,最好将它分配为一个连续的块:
double *x = calloc(rows * columns, sizeof(double)); // does zero init
现在您可以使用算术索引,所以您的 my_qsort
函数应该这样声明:
void my_qsort(double *start, size_t count, size_t stride);
现在要对第 3 行进行排序,您可以这样做:
my_qsort(x + 3 * columns, columns, 1);
要对第 5 列进行排序,您可以这样做:
my_qsort(x + 5, rows, columns);
排序时,需要访问的元素是start[ii * stride]
,其中ii
从0
到count
。 start
当然只是二维数组中您希望排序的第一个单元格——通常是行中最左边的单元格或列中的顶部单元格。也可以使用相同的函数对行或列的一部分进行排序,或者对矩阵中的任意 "line" 进行排序,例如方阵的对角线:
my_qsort(x, rows, columns + 1);
使用单个分配来存储二维数组不仅使 "strided" 操作更容易,而且效率更高,因为它减少了分配的数量,改善了空间局部性,并且 Linux , 增加了当你 free
内存时立即回收内存的机会,因为 "large" 分配是通过 mmap
而不是 sbrk
.