使用pthread时在struct中传递数组的问题
Problem about passing an array in struct when using pthread
#include <math.h>
#include <stdint.h>
#include <stdio.h>
#include <stdlib.h>
#include <string.h>
#include <time.h>
#include <pthread.h>
/* You may need to define struct here */
struct arg_type {
int head;
int length;
int num;
float *vec;
double *sqsum;
};
/*!
* \brief subroutine function
*
* \param arg, input arguments pointer
* \return void*, return pointer
*/
void *l2_norm(void *arg) {
/* TODO: Your code here */
struct arg_type *a = (struct arg_type *)arg;
a->sqsum[a->num] = 0.0f;
for (int j = a->head; j < (a->head + a->length); j++) {
a->sqsum[a->num] += a->vec[j] * a->vec[j];
}
pthread_exit(NULL);
}
/*!
* \brief wrapper function
*
* \param vec, input vector array
* \param len, length of vector
* \param k, number of threads
* \return float, l2 norm
*/
float multi_thread_l2_norm(const float *vec, size_t len, int k) {
/* TODO: your code here */
double sum = 0.0f;
struct arg_type arg;
pthread_t tid;
*arg.vec = *vec;
arg.length = (int)len / k;
for (int i = 0; i < k; i++) {
arg.num = i;
arg.head = arg.length * i;
pthread_create(&tid, NULL, l2_norm, &arg);
}
pthread_join(tid, NULL);
for (int j = 0; j < k; j++) {
sum += arg.sqsum[j];
}
sum = sqrt(sum);
return sum;
}
我是这个主题的新手。
这是一个使用多线程计算 L2 范数并将时间与原始实现进行比较的程序。
使用GDB后,我很确定程序卡在了第49行
*arg.vec = *vec;
但我不确定为什么并且正在努力调试它
您正在共享 arg 变量,您应该在其中为每个线程提供副本
// you need to allocate new memory zone before storing the vec in it
// ex : arg = malloc(sizeof(arg_type ));
*arg.vec = *vec;
在您的情况下,所有线程都将具有相同的 arg.num、arg.head ...
arg.vec 是一个未分配的指针,因此访问内容会崩溃。
应该是,
arg.vec = 向量;
此外,代码中的其他问题是--
需要 arg 数组:
您创建了 'k' 个线程,但是您将相同的 'arg' 结构传递给每个线程,因此 'arg' 的变量成员(即 num、head)在线程函数中可能是相同的并发 运行。
因此,您需要 'k' 个 'arg' 的结构,即 arg 结构数组并将其每个元素传递给每个线程。
需要数组 tid:
此外,您创建了 'k' 个线程,但您只加入了一个线程(即最后一个线程),即您确保只完成最后一个线程。为确保所有线程完成,您需要等待创建的所有线程。
#include <math.h>
#include <stdint.h>
#include <stdio.h>
#include <stdlib.h>
#include <string.h>
#include <time.h>
#include <pthread.h>
/* You may need to define struct here */
struct arg_type {
int head;
int length;
int num;
float *vec;
double *sqsum;
};
/*!
* \brief subroutine function
*
* \param arg, input arguments pointer
* \return void*, return pointer
*/
void *l2_norm(void *arg) {
/* TODO: Your code here */
struct arg_type *a = (struct arg_type *)arg;
a->sqsum[a->num] = 0.0f;
for (int j = a->head; j < (a->head + a->length); j++) {
a->sqsum[a->num] += a->vec[j] * a->vec[j];
}
pthread_exit(NULL);
}
/*!
* \brief wrapper function
*
* \param vec, input vector array
* \param len, length of vector
* \param k, number of threads
* \return float, l2 norm
*/
float multi_thread_l2_norm(const float *vec, size_t len, int k) {
/* TODO: your code here */
double sum = 0.0f;
struct arg_type arg;
pthread_t tid;
*arg.vec = *vec;
arg.length = (int)len / k;
for (int i = 0; i < k; i++) {
arg.num = i;
arg.head = arg.length * i;
pthread_create(&tid, NULL, l2_norm, &arg);
}
pthread_join(tid, NULL);
for (int j = 0; j < k; j++) {
sum += arg.sqsum[j];
}
sum = sqrt(sum);
return sum;
}
我是这个主题的新手。
这是一个使用多线程计算 L2 范数并将时间与原始实现进行比较的程序。
使用GDB后,我很确定程序卡在了第49行
*arg.vec = *vec;
但我不确定为什么并且正在努力调试它
您正在共享 arg 变量,您应该在其中为每个线程提供副本
// you need to allocate new memory zone before storing the vec in it
// ex : arg = malloc(sizeof(arg_type ));
*arg.vec = *vec;
在您的情况下,所有线程都将具有相同的 arg.num、arg.head ...
arg.vec 是一个未分配的指针,因此访问内容会崩溃。
应该是,
arg.vec = 向量;
此外,代码中的其他问题是--
需要 arg 数组: 您创建了 'k' 个线程,但是您将相同的 'arg' 结构传递给每个线程,因此 'arg' 的变量成员(即 num、head)在线程函数中可能是相同的并发 运行。 因此,您需要 'k' 个 'arg' 的结构,即 arg 结构数组并将其每个元素传递给每个线程。
需要数组 tid: 此外,您创建了 'k' 个线程,但您只加入了一个线程(即最后一个线程),即您确保只完成最后一个线程。为确保所有线程完成,您需要等待创建的所有线程。