从同一个 DSO 中“dlopen”一个 DSO

`dlopen`ing a DSO from inside that same DSO

我有一个 DSO(mylibrary.so.0 库),带有一个标记为 extern "C"func1 函数,我确定它自

以来就已导出
nm -D mylibrary.so.0 | grep func1
000000000009f9bb T func1 <- symbol is visible and exported

这个 DSO 正在加载到我无法控制的依赖链中,例如

executable1 -dlopen-> 3rdpartydispatcher.so -dlopen-> my_library.so.0

现在,我的库有一个被调用的方法(我可以看到它是通过 gdb 进入它而被调用的)并接收一个 C 字符串和它应该调用的函数名称,例如

void call_function_from_name(const char *function_name) {

    void *mylibrary_so_0 = dlopen(NULL, RTLD_NOW); // (*)
    void *func1 = dlsym(mylibrary_so_0, function_name);
    if (!func1) {
        log_error(dlerror());
    }
    ...
}

问题是:即使使用参数 func1 调用 call_function_from_name,即完全有效和导出的符号,dlsym 也会失败并且错误是 executable1 has no func1 symbol.

我来自 Windows 环境,我假设 dlopen(NULL, ..) returns 我是主要可执行文件的句柄 但是 任何后续dlopen 来自该可执行文件的库也被映射到它的虚拟地址 space,因此我可以使用该句柄来搜索这些库导出的符号。

我的假设不正确吗?如果是,我如何从 same-dso 函数调用中引用 func1

您的库可能加载了 RTLD_LOCAL,但明确没有将其放在全局符号 space 中。如果需要,它可以使用 RTLD_GLOBAL 到 "fix" 对自身调用 dlopen,或者如果您知道所需的符号在您的库中,它可以获得一个新的 RTLD_LOCAL 句柄自身并调用 dlsym 而不是全局名称 space.

`void *mylibrary_so_0 = dlopen(NULL, RTLD_NOW); // (*)`

出于某种原因,您认为这应该 dlopen my_library.so.0,但它 不会 -- 它会打开主要的可执行文件。

错误信息清楚地告诉你:executable1 has no func1.

一个可能的修复方法是使用 dlopen("my_library.so.0", RTLD_NOW),但更好的修复方法是提供一个 static 函数映射,您希望能够以这种方式调用,并且使用 那个:

struct mapping { const char *f_name; void (*f_ptr)(); } = {
  { "func1", &func1 },
  { "func2", &func2 },
  { NULL, NULL },
};

现在只需搜索您的 mapping,然后调用目标函数;不需要 dlsym