使用 malloc 和 calloc 生成矩阵导致混淆行为
Generating a matrix with malloc and calloc causing confusing behavior
我一直在做一个用 C 语言处理矩阵计算的小项目。
我正在对我编写的代码进行一些测试,发现了一些令人难以置信的令人困惑的行为。
在我进入问题之前,这里是一些相关代码。
矩阵定义:
typedef struct
{
double **matrix;
int rows;
int cols;
int dimensions[2];
char *str_dims;
} Matrix;
当我初始化一个矩阵时,我使用 malloc 为行数分配内存,然后使用 calloc 遍历为所有列分配内存的行,因此它们初始化为 0。
void init_matrix(Matrix *x, int i, int j)
{
x->matrix = malloc(x->rows * sizeof(double *));
for (int i = 0; i < x->rows; i++)
x->matrix[i] = calloc(x->cols, sizeof(double));
}
我还有生成随机矩阵的功能,
Matrix get_rand_matrix(int i, int j)
{
Matrix x;
init_matrix(&x, i, j);
srand(time(NULL));
for(int i = 0; i < x.rows; i++)
for(int j = 0; j < x.cols; j++)
x.matrix[i][j] = rand();
return x;
}
令人困惑的行为
除了以古人的标准来看代码很可能相当可怕之外,我还认为它工作正常。然而,幸运的是,当我进行一些测试(打印矩阵)时,我无意中将负责迭代矩阵列的循环增加了 1,这就是我收到的输出。 (为了您的观看乐趣而格式化。)
+-------------+--------------+-----+
|739979002.00 | 1854570721.00| 0.00|
|130427701.00 | 402893063.00 | 0.00|
|1973118592.00| 135400441.00 | 0.00|
|1707001127.00| 1093842609.00| 0.00|
+----------------------------------+
预期输出的位置,
+-------------+--------------+
|739979002.00 | 1854570721.00|
|130427701.00 | 402893063.00 |
|1973118592.00| 135400441.00 |
|1707001127.00| 1093842609.00|
+----------------------------+
生成此代码只是为了让您远离黑暗,
Matrix m = get_rand_matrix(4, 2);
for(int i = 0; i < m.rows; i++)
{
for(int j = 0; j < m.cols + 1; j++)
printf("%.2lf ", m.matrix[i][j]);
printf("\n");
}
问题
现在,老实说,我不知道为什么我没有遇到段错误并且可以访问分配的内存边界之外的零初始化元素(我本以为是)。我只能通过将 malloc
和 calloc
合并在一起来假设这是我的错误,但话又说回来,我也不明白为什么这行不通。
有谁知道发生了什么,为什么在分配的内存范围之外有 0 个已初始化的双精度值?总的来说,我对 C 和内存分配还比较陌生,这让我眼花缭乱。
有趣的补充
当您增加列循环退出条件时,某些元素似乎会重复(使用 j < m.cols + 5
生成)
+-------------------------------------------------------------------------------+
|549092153.00 | 1317836633.00 | 0.00| 0.00 | 218607745.00 |1326282480.00 | 0.00 |
|218607745.00 | 1326282480.00 | 0.00| 0.00 | 715372192.00 |976468777.00 | 0.00 |
|715372192.00 | 976468777.00 | 0.00| 0.00 | 103851159.00 |363785358.00 | 0.00 |
|103851159.00 | 363785358.00 | 0.00| 0.00 | 0.00 | 0.00 | 0.00 |
+-------------------------------------------------------------------------------+
我将增量增加到 +1000,它仍然继续打印 0.00 和重复的数字。
如果我没看错的话,你所做的只是读取分配数组之外的内存。这可能会导致分段错误,但并非总是如此。该站点提供了一些示例:https://www.geeksforgeeks.org/accessing-array-bounds-ccpp/
一般来说,当你要求C从内存中读取时,你给它一个物理地址。如果该地址存在并且您被允许从中读取,它将返回存储在那里的数据,无论它是否在您的数组中。这些可能是 0 值或来自您或其他程序在那里写入的变量的垃圾数据。在您看到重复值的最后一个示例中,这是因为您的程序连续为 matrix[i] 和 matrix[i+1] 分配了内存。因此,当你开始读取越过matrix[i]的边界时,你就开始从matrix[i+1]开始读取内存。
此外,您提到它在边界外存储双精度值,但这并不完全正确。 C 不知道应该在那里存储什么类型的数据,它只知道将其解释为双精度,因为你告诉它。如果您将所有内容都转换为字符,它将读取和打印字符而不是双精度数。
我一直在做一个用 C 语言处理矩阵计算的小项目。
我正在对我编写的代码进行一些测试,发现了一些令人难以置信的令人困惑的行为。
在我进入问题之前,这里是一些相关代码。
矩阵定义:
typedef struct
{
double **matrix;
int rows;
int cols;
int dimensions[2];
char *str_dims;
} Matrix;
当我初始化一个矩阵时,我使用 malloc 为行数分配内存,然后使用 calloc 遍历为所有列分配内存的行,因此它们初始化为 0。
void init_matrix(Matrix *x, int i, int j)
{
x->matrix = malloc(x->rows * sizeof(double *));
for (int i = 0; i < x->rows; i++)
x->matrix[i] = calloc(x->cols, sizeof(double));
}
我还有生成随机矩阵的功能,
Matrix get_rand_matrix(int i, int j)
{
Matrix x;
init_matrix(&x, i, j);
srand(time(NULL));
for(int i = 0; i < x.rows; i++)
for(int j = 0; j < x.cols; j++)
x.matrix[i][j] = rand();
return x;
}
令人困惑的行为
除了以古人的标准来看代码很可能相当可怕之外,我还认为它工作正常。然而,幸运的是,当我进行一些测试(打印矩阵)时,我无意中将负责迭代矩阵列的循环增加了 1,这就是我收到的输出。 (为了您的观看乐趣而格式化。)
+-------------+--------------+-----+
|739979002.00 | 1854570721.00| 0.00|
|130427701.00 | 402893063.00 | 0.00|
|1973118592.00| 135400441.00 | 0.00|
|1707001127.00| 1093842609.00| 0.00|
+----------------------------------+
预期输出的位置,
+-------------+--------------+
|739979002.00 | 1854570721.00|
|130427701.00 | 402893063.00 |
|1973118592.00| 135400441.00 |
|1707001127.00| 1093842609.00|
+----------------------------+
生成此代码只是为了让您远离黑暗,
Matrix m = get_rand_matrix(4, 2);
for(int i = 0; i < m.rows; i++)
{
for(int j = 0; j < m.cols + 1; j++)
printf("%.2lf ", m.matrix[i][j]);
printf("\n");
}
问题
现在,老实说,我不知道为什么我没有遇到段错误并且可以访问分配的内存边界之外的零初始化元素(我本以为是)。我只能通过将 malloc
和 calloc
合并在一起来假设这是我的错误,但话又说回来,我也不明白为什么这行不通。
有谁知道发生了什么,为什么在分配的内存范围之外有 0 个已初始化的双精度值?总的来说,我对 C 和内存分配还比较陌生,这让我眼花缭乱。
有趣的补充
当您增加列循环退出条件时,某些元素似乎会重复(使用 j < m.cols + 5
生成)
+-------------------------------------------------------------------------------+
|549092153.00 | 1317836633.00 | 0.00| 0.00 | 218607745.00 |1326282480.00 | 0.00 |
|218607745.00 | 1326282480.00 | 0.00| 0.00 | 715372192.00 |976468777.00 | 0.00 |
|715372192.00 | 976468777.00 | 0.00| 0.00 | 103851159.00 |363785358.00 | 0.00 |
|103851159.00 | 363785358.00 | 0.00| 0.00 | 0.00 | 0.00 | 0.00 |
+-------------------------------------------------------------------------------+
我将增量增加到 +1000,它仍然继续打印 0.00 和重复的数字。
如果我没看错的话,你所做的只是读取分配数组之外的内存。这可能会导致分段错误,但并非总是如此。该站点提供了一些示例:https://www.geeksforgeeks.org/accessing-array-bounds-ccpp/
一般来说,当你要求C从内存中读取时,你给它一个物理地址。如果该地址存在并且您被允许从中读取,它将返回存储在那里的数据,无论它是否在您的数组中。这些可能是 0 值或来自您或其他程序在那里写入的变量的垃圾数据。在您看到重复值的最后一个示例中,这是因为您的程序连续为 matrix[i] 和 matrix[i+1] 分配了内存。因此,当你开始读取越过matrix[i]的边界时,你就开始从matrix[i+1]开始读取内存。
此外,您提到它在边界外存储双精度值,但这并不完全正确。 C 不知道应该在那里存储什么类型的数据,它只知道将其解释为双精度,因为你告诉它。如果您将所有内容都转换为字符,它将读取和打印字符而不是双精度数。