dlsym() + RTLD_NEXT 在 Ubuntu 20.04 上无法正常工作

dlsym() + RTLD_NEXT doesn't work as expected on Ubuntu 20.04

我在 Ubuntu 20.04 (gcc v 9.3.0) 上使用 dlsym() 调用时遇到奇怪的运行时行为。

请看下面一个简单的例子:

#include <iostream>
#include <dlfcn.h>
#include <execinfo.h>
#include <typeinfo>
#include <string>
#include <memory>
#include <cxxabi.h>
#include <cstdlib>

extern "C"
{
    void __cxa_throw(void *ex, void *info, void (*dest)(void *))
    {
        std::cout << "__cxa_throw() invoked \n";

        static void (*const rethrow)(void *, void *, void (*)(void *)) __attribute__((noreturn))
            = (void (*)(void *, void *, void (*)(void *)))dlsym(RTLD_NEXT, "__cxa_throw");

        std::cout << "addr in lib=" << &rethrow << "\n";

        rethrow(ex, info, dest);

        std::terminate();
    }
}

#include <iostream>

void foo()
{
  throw std::runtime_error("error");
}

int main()
{
    foo();
    return 0;
}

按如下方式构建这 2 个文件:

g++ -fPIC -std=c++17 test.cpp -g -c -o test.o
g++ -shared ./test.o -o libtest.so
g++ main.cpp -std=c++17 -g -pedantic -L./ -ltest -ldl

将 ldd 提供给 ./a.out 得到:

ldd a.out 
    linux-vdso.so.1 (0x00007ffe01186000)
    /usr/local/lib/AppProtection/libAppProtection.so (0x00007f1dbd738000)
    libtest.so (0x00007f1dbd733000)
    libdl.so.2 => /lib/x86_64-linux-gnu/libdl.so.2 (0x00007f1dbd708000)
    libstdc++.so.6 => /lib/x86_64-linux-gnu/libstdc++.so.6 (0x00007f1dbd526000)
    libgcc_s.so.1 => /lib/x86_64-linux-gnu/libgcc_s.so.1 (0x00007f1dbd50b000)
    libc.so.6 => /lib/x86_64-linux-gnu/libc.so.6 (0x00007f1dbd319000)
    libpthread.so.0 => /lib/x86_64-linux-gnu/libpthread.so.0 (0x00007f1dbd2f4000)
    libX11.so.6 => /lib/x86_64-linux-gnu/libX11.so.6 (0x00007f1dbd1b7000)
    libxcb.so.1 => /lib/x86_64-linux-gnu/libxcb.so.1 (0x00007f1dbd18d000)
    libXi.so.6 => /lib/x86_64-linux-gnu/libXi.so.6 (0x00007f1dbd17b000)
    /lib64/ld-linux-x86-64.so.2 (0x00007f1dbd964000)
    libm.so.6 => /lib/x86_64-linux-gnu/libm.so.6 (0x00007f1dbd02c000)
    libXau.so.6 => /lib/x86_64-linux-gnu/libXau.so.6 (0x00007f1dbd024000)
    libXdmcp.so.6 => /lib/x86_64-linux-gnu/libXdmcp.so.6 (0x00007f1dbd01c000)
    libXext.so.6 => /lib/x86_64-linux-gnu/libXext.so.6 (0x00007f1dbd007000)
    libbsd.so.0 => /lib/x86_64-linux-gnu/libbsd.so.0 (0x00007f1dbcfed000)

我们可以看到 libtest.solibstdc++.so 之前解决了。 我期望这段代码应该如何工作:

除 Ubuntu 20.04 外,这在所有平台上都按预期工作,其中 rethrow 引用 libtest.so 中的 __cxa_throw(但不是 libstc++.so),因此导致无限递归。

请帮忙,因为我对运行时行为感到困惑。

如评论中所述,该问题是由挂钩 dlsym() 的 Citrix ICA 客户端完成的挂钩引起的,因此导致调用了错误的 dlsym()

Citrix ICA 客户端的“应用程序保护”组件安装库 /usr/local/lib/AppProtection/libAppProtection.so 并将其添加到 /etc/ld.so.preload 中,使其加载到每个动态链接的进程中。除其他外,该库用自己的函数替换了 dlsym 函数。 (如果您好奇这为什么不总是通过进入无限循环来破坏一切,请参阅 How can I intercept dlsym calls using LD_PRELOAD?。实际上,Citrix 的代码似乎是直接从该答案中复制和粘贴的。)问题是因为 RTLD_NEXT 依赖于能够检查 return 地址,所以需要特别小心以避免在 hook dlsym 时破坏它,而他们没有特别小心。结果,RTLD_NEXT 将在 libAppProtection.so 之后的下一个库中查找符号,而不是在您的代码之后的下一个库中查找符号,这正是您 运行 遇到的问题。

这里有一些解决方法的选择:

  • 向 Citrix 支持部门投诉,直到他们修复有问题的库
  • sudo apt-get purge icaclient(之后可以选择重新安装,但是
  • 修改您的程序以从 libdl.so 加载真正的 dlsym,然后将其用于任何使用 RTLD_NEXT
  • 的调用