线程安全,可重入,async-signal 安全 putenv
Thread safe, reentrant, async-signal safe putenv
我提前为一些代码转储道歉,我已经尽可能多地修剪了不重要的代码:
// Global vars / mutex stuff
extern char **environ;
pthread_mutex_t env_mutex = PTHREAD_MUTEX_INITIALIZER;
int
putenv_r(char *string)
{
int len;
int key_len = 0;
int i;
sigset_t block;
sigset_t old;
sigfillset(&block);
pthread_sigmask(SIG_BLOCK, &block, &old);
// This function is thread-safe
len = strlen(string);
for (int i=0; i < len; i++) {
if (string[i] == '=') {
key_len = i; // Thanks Klas for pointing this out.
break;
}
}
// Need a string like key=value
if (key_len == 0) {
errno = EINVAL; // putenv doesn't normally return this err code
return -1;
}
// We're moving into environ territory so start locking stuff up.
pthread_mutex_lock(&env_mutex);
for (i = 0; environ[i] != NULL; i++) {
if (strncmp(string, environ[i], key_len) == 0) {
// Pointer assignment, so if string changes so does the env.
// This behaviour is POSIX conformant, instead of making a copy.
environ[i] = string;
pthread_mutex_unlock(&env_mutex);
return(0);
}
}
// If we get here, the env var didn't already exist, so we add it.
// Note that malloc isn't async-signal safe. This is why we block signals.
environ[i] = malloc(sizeof(char *));
environ[i] = string;
environ[i+1] = NULL;
// This ^ is possibly incorrect, do I need to grow environ some how?
pthread_mutex_unlock(&env_mutex);
pthread_sigmask(SIG_SETMASK, &old, NULL);
return(0);
}
正如标题所说,我正在尝试编写线程安全的代码,async-signal putenv
的安全可重入版本。该代码的工作原理是它像 putenv
那样设置环境变量,但我确实有一些担忧:
- 我使它 async-signal 安全的方法感觉有点 ham-handed,只是阻止所有信号(当然 SIGKILL/SIGSTOP 除外)。或者这是最合适的方法吗?
- 是不是我信号阻塞的位置太保守了?我知道
strlen
不能保证 async-signal 安全,这意味着我的信号阻塞必须事先发生,但也许我错了。
- 考虑到所有函数都是 thread-safe 并且我锁定了与
environ
的交互,我相当确定它是线程安全的,但我希望得到其他证明。
- 可否重入我真的不太确定。虽然不能保证,但我想如果我勾选其他两个框,它很可能是可重入的?
我找到了这个问题的另一个解决方案here,他们只是设置了适当的信号阻塞和互斥锁(病态押韵)然后调用putenv
通常。这有效吗?如果是这样,显然比我的方法简单多了。
抱歉代码块太大,希望我已经建立了一个MCVE。为了简洁起见,我在代码中遗漏了一些错误检查。谢谢!
如果您想自己测试代码,这是其余代码,包括主要代码:
#include <string.h>
#include <errno.h>
#include <pthread.h>
#include <stdlib.h>
#include <stdio.h>
#include <signal.h>
// Prototypes
static void thread_init(void);
int putenv_r(char *string);
int
main(int argc, char *argv[]) {
int ret = putenv_r("mykey=myval");
printf("%d: mykey = %s\n", ret, getenv("mykey"));
return 0;
}
这段代码有问题:
// If we get here, the env var didn't already exist, so we add it.
// Note that malloc isn't async-signal safe. This is why we block signals.
environ[i] = malloc(sizeof(char *));
environ[i] = string;
它在堆上创建一个 char *
,将 char *
的地址分配给 environ[i]
,然后用 string
中包含的地址覆盖该值。那是行不通的。它不保证 environ
之后以 NULL 结尾。
因为char **environ
is a pointer to an array of pointers。数组中的最后一个指针是 NULL
- 这就是代码可以告诉它已到达环境变量列表末尾的方式。
像这样的东西应该会更好:
unsigned int envCount;
for ( envCount = 0; environ[ envCount ]; envCount++ )
{
/* empty loop */;
}
/* since environ[ envCount ] is NULL, the environ array
of pointers has envCount + 1 elements in it */
envCount++;
/* grow the environ array by one pointer */
char ** newEnviron = realloc( environ, ( envCount + 1 ) * sizeof( char * ) );
/* add the new envval */
newEnviron[ envCount - 1 ] = newEnvval;
/* NULL-terminate the array of pointers */
newEnviron[ envCount ] = NULL;
environ = newEnviron;
请注意,没有错误检查,它假定原始 environ
数组是通过调用 malloc()
或类似方法获得的。如果该假设错误,则行为未定义。
我提前为一些代码转储道歉,我已经尽可能多地修剪了不重要的代码:
// Global vars / mutex stuff
extern char **environ;
pthread_mutex_t env_mutex = PTHREAD_MUTEX_INITIALIZER;
int
putenv_r(char *string)
{
int len;
int key_len = 0;
int i;
sigset_t block;
sigset_t old;
sigfillset(&block);
pthread_sigmask(SIG_BLOCK, &block, &old);
// This function is thread-safe
len = strlen(string);
for (int i=0; i < len; i++) {
if (string[i] == '=') {
key_len = i; // Thanks Klas for pointing this out.
break;
}
}
// Need a string like key=value
if (key_len == 0) {
errno = EINVAL; // putenv doesn't normally return this err code
return -1;
}
// We're moving into environ territory so start locking stuff up.
pthread_mutex_lock(&env_mutex);
for (i = 0; environ[i] != NULL; i++) {
if (strncmp(string, environ[i], key_len) == 0) {
// Pointer assignment, so if string changes so does the env.
// This behaviour is POSIX conformant, instead of making a copy.
environ[i] = string;
pthread_mutex_unlock(&env_mutex);
return(0);
}
}
// If we get here, the env var didn't already exist, so we add it.
// Note that malloc isn't async-signal safe. This is why we block signals.
environ[i] = malloc(sizeof(char *));
environ[i] = string;
environ[i+1] = NULL;
// This ^ is possibly incorrect, do I need to grow environ some how?
pthread_mutex_unlock(&env_mutex);
pthread_sigmask(SIG_SETMASK, &old, NULL);
return(0);
}
正如标题所说,我正在尝试编写线程安全的代码,async-signal putenv
的安全可重入版本。该代码的工作原理是它像 putenv
那样设置环境变量,但我确实有一些担忧:
- 我使它 async-signal 安全的方法感觉有点 ham-handed,只是阻止所有信号(当然 SIGKILL/SIGSTOP 除外)。或者这是最合适的方法吗?
- 是不是我信号阻塞的位置太保守了?我知道
strlen
不能保证 async-signal 安全,这意味着我的信号阻塞必须事先发生,但也许我错了。 - 考虑到所有函数都是 thread-safe 并且我锁定了与
environ
的交互,我相当确定它是线程安全的,但我希望得到其他证明。 - 可否重入我真的不太确定。虽然不能保证,但我想如果我勾选其他两个框,它很可能是可重入的?
我找到了这个问题的另一个解决方案here,他们只是设置了适当的信号阻塞和互斥锁(病态押韵)然后调用putenv
通常。这有效吗?如果是这样,显然比我的方法简单多了。
抱歉代码块太大,希望我已经建立了一个MCVE。为了简洁起见,我在代码中遗漏了一些错误检查。谢谢!
如果您想自己测试代码,这是其余代码,包括主要代码:
#include <string.h>
#include <errno.h>
#include <pthread.h>
#include <stdlib.h>
#include <stdio.h>
#include <signal.h>
// Prototypes
static void thread_init(void);
int putenv_r(char *string);
int
main(int argc, char *argv[]) {
int ret = putenv_r("mykey=myval");
printf("%d: mykey = %s\n", ret, getenv("mykey"));
return 0;
}
这段代码有问题:
// If we get here, the env var didn't already exist, so we add it.
// Note that malloc isn't async-signal safe. This is why we block signals.
environ[i] = malloc(sizeof(char *));
environ[i] = string;
它在堆上创建一个 char *
,将 char *
的地址分配给 environ[i]
,然后用 string
中包含的地址覆盖该值。那是行不通的。它不保证 environ
之后以 NULL 结尾。
因为char **environ
is a pointer to an array of pointers。数组中的最后一个指针是 NULL
- 这就是代码可以告诉它已到达环境变量列表末尾的方式。
像这样的东西应该会更好:
unsigned int envCount;
for ( envCount = 0; environ[ envCount ]; envCount++ )
{
/* empty loop */;
}
/* since environ[ envCount ] is NULL, the environ array
of pointers has envCount + 1 elements in it */
envCount++;
/* grow the environ array by one pointer */
char ** newEnviron = realloc( environ, ( envCount + 1 ) * sizeof( char * ) );
/* add the new envval */
newEnviron[ envCount - 1 ] = newEnvval;
/* NULL-terminate the array of pointers */
newEnviron[ envCount ] = NULL;
environ = newEnviron;
请注意,没有错误检查,它假定原始 environ
数组是通过调用 malloc()
或类似方法获得的。如果该假设错误,则行为未定义。