当 pollfd 在另一个线程上更改时，Linux 和 OS X 之间 poll() 的差异

Question

我正在尝试在 OS X 上的多线程环境中获取 libwebsockets 运行。我无法触发从与主服务线程不同的线程发送数据。在 libwebsocket 文档中暗示这应该是可能的 (demo code, mailinglist)。所以我深入研究了代码，发现了 poll() 函数中的问题。

关于作为参数给出的 struct pollfd，poll() 似乎表现不同。 libwebsockets 依赖于在 poll() 处于活动状态时更改 fds.event 字段的可能性。这在 Linux 上工作正常，但在 OS X.

上不起作用

我写了一个小测试程序来演示这个行为：

#include <unistd.h>
#include <netdb.h>
#include <poll.h>
#include <iostream>
#include <thread>

#define PORT "3490"

struct pollfd    fds[1];
bool connected = false;

void main_loop() {
    int sockfd, new_fd; 
    struct addrinfo hints, *servinfo, *p;
    socklen_t sin_size;
    int yes=1;
    char s[INET6_ADDRSTRLEN];
    int rv;

    memset(&hints, 0, sizeof hints);
    hints.ai_family = AF_INET;
    hints.ai_socktype = SOCK_STREAM;
    hints.ai_flags = AI_PASSIVE; 

    if ((rv = getaddrinfo(NULL, PORT, &hints, &servinfo)) != 0) {
        fprintf(stderr, "getaddrinfo: %s\n", gai_strerror(rv));
        return;
    }

    for(p = servinfo; p != NULL; p = p->ai_next) {
        if ((sockfd = socket(p->ai_family, p->ai_socktype, p->ai_protocol)) == -1) {
            perror("server: socket");
            continue;
        }

        if (setsockopt(sockfd, SOL_SOCKET, SO_REUSEADDR, &yes, sizeof(int)) == -1) {
            perror("setsockopt");
            exit(1);
        }

        if (bind(sockfd, p->ai_addr, p->ai_addrlen) == -1) {
            close(sockfd);
            perror("server: bind");
            continue;
        }

        break;
    }

    freeaddrinfo(servinfo);

    if (p == NULL)  {
        fprintf(stderr, "server: failed to bind\n");
        exit(1);
    }

    if (listen(sockfd, 10) == -1) {
        perror("listen");
        exit(1);
    }

    printf("server: waiting for connections...\n");

    new_fd = accept(sockfd, NULL, &sin_size);
    if (new_fd == -1) {
        perror("accept");
        return;
    }

    fds[0].fd = new_fd;
    fds[0].events = POLLIN;
    connected = true;

    printf("event is %i\n", fds[0].events);
    int ret = poll(fds, 1, 5000);
    printf("event is %i\n", fds[0].events); //expecting 1 on Mac and 5 on Linux

    if (send(new_fd, "Hello, world!\n", 14, 0) == -1)
        perror("send");

    close(new_fd); 
    close(sockfd);
}

void second_thread()
{
    while(connected == false){}
    sleep(1);
    fds[0].events = POLLIN|POLLOUT;
    printf("set event to %i\n", fds[0].events);
}

int main() {

    std::thread t1(main_loop);
    std::thread t2(second_thread);

    t1.join();
    t2.join();

    return 0;
}

使用 clang++ -std=c++11 -stdlib=libc++ -o poll poll.cpp 在 OS X 上编译在 Linux 上使用 g++ -std=c++11 -pthread -o poll poll.cpp

程序开始侦听端口 3490。如果您连接到它（例如使用 netcat localhost 3490），它将在主线程上轮询输入并尝试更改第二个线程中的事件标志。它将在 5 秒后退出。

OS X 上的输出：

server: waiting for connections...
event is 1
set event to 5
event is 1

Linux 上的输出：

server: waiting for connections...
event is 1
set event to 5
event is 5

所以我的问题是：是否有任何文档可以解释这种行为？ libwebsockets 期望在轮询处于活动状态时更改 fds.events 是合法的，这是否安全？我在联机帮助页 (OS X, Linux) 中找不到有关它的任何详细信息。

Answer 1

起初，您似乎说您找到了一些文档，声称这是受支持和定义的行为。我很想知道你在哪里读到的，因为我无法在 poll(2), nor in the POSIX man page for poll() 的 Linux 手册页中找到任何记录不同线程实际上可以更改事件数组中的值的内容另一个线程传递给 poll() 的参数，并使不同线程的更改实际上在原始线程的 poll() 调用中生效，而不管与内存屏障等相关的任何问题。

对我来说，这两个手册页似乎完全没有提及这个主题。它们不表明这是否是预期的、支持的或定义的行为；或者这是否不是受支持或未定义的行为。

不同线程可以修改参数给另一个线程发出的系统调用的命题，after -- AFTER --另一个线程已经进入系统调用，对我来说似乎很反直觉。如果这是受支持的行为，我希望它被明确记录下来，并且我在 Linux 或 POSIX 手册页中找不到任何对它的引用。

话虽如此：即使我将我的软件范围限制在Linux，即使我不需要关心其他平台；鉴于没有这方面的任何文档，即使我的测试显示 Linux 内核以这种方式实现 poll(2)，我也不希望有任何保证某些未来的内核版本将继续以这种方式运行。我不能依赖这种行为，除了我测试过的特定内核构建。

因此，回答您的问题：关于此主题的唯一权威文档是相关手册页。他们没有明确将此记录为合法行为；尽管他们也没有明确表示这是非法行为，但出于上述原因，我认为这是不受支持的、未定义的行为。

当 pollfd 在另一个线程上更改时，Linux 和 OS X 之间 poll() 的差异

Differences in poll() between Linux and OS X when pollfd is changed on another thread

sockets

linux

macos

multithreading

libwebsockets