libircclient :选择性连接绝对无法调试

libircclient : Selective connection absolutely impossible to debug

我通常不是那种会 post 提问的人,而且我更喜欢先搜索为什么某些东西不起作用,但这次我竭尽所能,但我就是想不通怎么了。

事情是这样的:

我目前正在编写一个 IRC Bot,我正在使用 libircclient,这是一个用于处理 IRC 连接的小型 C 库。它工作得非常好,它完成了工作并且有点易于使用,但是 ...

我正在连接到两个不同的服务器,所以我正在使用自定义网络循环,它使用 select 函数。在我的个人电脑上,这个循环没有问题,一切正常。

但是(这就是问题所在),在我将托管机器人的远程服务器上,我可以连接到一台服务器,但不能连接到另一台服务器。

我尽我所能调试一切。我什至去检查了 libircclient 的来源,看看它是如何工作的,并在可能的地方放了一些 printfs,我可以看到它来自哪里,但我不明白它为什么这样做。

服务器代码如下(irc_session_t objects 是封装的,但一般比较容易理解,有需要的可以私信询问):

// Connect the first session
first.connect();

// Connect the osu! session
second.connect();

// Initialize sockets sets
fd_set sockets, out_sockets;

// Initialize sockets count
int sockets_count;

// Initialize timeout struct
struct timeval timeout;

// Set running as true
running = true;

// While the server is running (Which means always)
while (running)
{
    // First session has disconnected
    if (!first.connected())
        // Reconnect it
        first.connect();

    // Second session has disconnected
    if (!second.connected())
        // Reconnect it
        second.connect();

    // Reset timeout values
    timeout.tv_sec = 1;
    timeout.tv_usec = 0;

    // Reset sockets count
    sockets_count = 0;

    // Reset sockets and out sockets
    FD_ZERO(&sockets);
    FD_ZERO(&out_sockets);

    // Add sessions descriptors
    irc_add_select_descriptors(first.session(), &sockets, &out_sockets, &sockets_count);
    irc_add_select_descriptors(second.session(), &sockets, &out_sockets, &sockets_count);

    // Select something. If it went wrong
    int available = select(sockets_count + 1, &sockets, &out_sockets, NULL, &timeout);

    // Error
    if (available < 0)
        // Error
        Utils::throw_error("Server", "run", "Something went wrong when selecting a socket");

    // We have a socket
    if (available > 0)
    {
        // If there was something wrong when processing the first session
        if (irc_process_select_descriptors(first.session(), &sockets, &out_sockets))
            // Error
            Utils::throw_error("Server", "run", Utils::string_format("Error with the first session: %s", first.get_error()));

        // If there was something wrong when processing the second session
        if (irc_process_select_descriptors(second.session(), &sockets, &out_sockets))
            // Error
            Utils::throw_error("Server", "run", Utils::string_format("Error with the second session: %s", second.get_error()));
    }

此代码中的问题在于这一行:

irc_process_select_descriptors(second.session(), &sockets, &out_sockets)

总是return一个错误第一次调用,并且只针对一个服务器。奇怪的是,在我的 Windows 电脑上,它工作得很好,而在 Ubuntu 服务器上,它就是不想,我就是不明白为什么。

我做了一些 in-depth 调试,我看到 libircclient 是这样做的:

if (session->state == LIBIRC_STATE_CONNECTING && FD_ISSET(session->sock, out_set))

这就是一切出错的地方。 session 状态正确设置为 LIBIRC_STATE_CONNECTING,但是第二件事,FD_ISSET(session->sock, out_set) 总是 return false .对于第一个 session,return 是正确的,但对于第二个 session,永远不会。

两台服务器分别是irc.twitch.tv:6667和irc.ppy.sh:6667。服务器设置正确,服务器密码也正确,因为在我的个人电脑上一切正常。

很抱歉post。

提前致谢!

好的,经过几个小时的调试,我终于找到了问题。

所以当session连接上时,会进入LIBIRC_STATE_CONNECTING状态,然后调用irc_process_select_descriptors时,会检查这个:

if (session->state == LIBIRC_STATE_CONNECTING && FD_ISSET(session->sock, out_set))

问题是 select() 会改变套接字集,并会删除所有不相关的集。

所以如果服务器在调用 irc_process_select_descriptors 之前没有发送任何消息,FD_ISSET 将 return 0,因为 select() 认为这个套接字是不相关。

我通过写

修复了它
if (session->state == LIBIRC_STATE_CONNECTING)
{
    if(!FD_ISSET(session->sock, out_set))
        return 0;

    ...
}

所以它会让程序等待,直到服务器向我们发送任何东西。

抱歉没有检查所有内容!