Perf中用于确定库加载地址的机制
The Mechanism Used to Determine Library Load Address in Perf
perf
如何在 post 处理期间确定每个加载图像(例如,共享库)的加载地址。例如,perf report
使用此信息使每个符号地址相对于每个加载图像的开头。如下图所示 (unwind: _int_malloc...
):
它是否存储在 elf
二进制或分析输出(即 perf.data
)的某处?
仅查看 ELF 可执行文件和库是无法找到它的。它可以每个 运行;即使 ASLR 像 GDB 一样被 perf 禁用,程序也可能在使用某些可选库的 dlopen
之前使用 mmap(MAP_FIXED)
,然后才加载,因此 dlopen 必须选择与平常不同的地址来映射库. (正常的动态链接发生在 main
运行 之前,不是通过 dlopen,但大概 perf
希望能够记录地址 -> 任何文件支持映射的文件映射。)
大概是perf保存了运行每个ELF对象在perf.data
中的时基地址
共享库加载地址存储在perf record
命令期间记录的perf.data文件中。您可以使用 perf script -D
命令以部分解码格式转储来自 perf.data 的数据。当您的程序由 ld-linux*.so.2
加载时(或当 dlopen 需要时),加载程序将搜索库并使用 mmap
系统调用加载其段。这些 mmap 事件由内核记录,并在 perf.data 文件中具有 PERF_RECORD_MMAP 或 PERF_RECORD_MMAP2 类型。 perf report
(和perf script
)将重建内存偏移量以解码符号名称。
$ perf record echo 1
$ perf script -D|grep MMAP -c
7
$ perf script -D|less
PERF_RECORD_MMAP2 ... r-xp /bin/echo
...
PERF_RECORD_MMAP2 ... r-xp /lib/x86_64-linux-gnu/libc-2.27.so
perf
的基本思想在https://github.com/torvalds/linux/blob/master/tools/perf/design.txt file. To start profiling there is perf_event_open
syscall which has perf_event_attr *attr
argument. Man page描述了attr的mmap相关字段:
The perf_event_attr structure provides detailed configuration
information for the event being created.
mmap : 1, /* include mmap data */
mmap_data : 1, /* non-exec mmap data */
mmap2 : 1, /* include mmap with inode data */
Linux 内核在其 perf_events
子系统 (kernel/events) 中将记录已分析进程所需的事件,并使用 fd 和 mmap 将数据导出到分析器。 perf record
通常会将这些数据从内核转储到 perf.data 文件中而不进行大量处理(检查 "Woken up 1 times to write data" 输出的 perf record
打印件)。内核中的mmap事件由perf_event_mmap_output
called from perf_event_mmap_event
which is called from perf_event_mmap
. mmap syscall implementation in mm/mmap.c
has some unconditional calls to perf_event_mmap
.
记录
perf 的 design.txt 提到了 munmap,但当前实现没有 munmap 字段或事件,事件代码 2 被重新用于 PERF_RECORD_LOST. There were ideas that munmap can be helpful https://www.spinics.net/lists/netdev/msg524414.html with links to https://lkml.org/lkml/2016/12/10/1 and https://lkml.org/lkml/2017/1/27/452
perf 工具是 linux 内核源代码的一部分,可以通过 LXR/elixir 网站在线查看:https://elixir.bootlin.com/linux/v5.4/source/tools/perf/
mmap/mmap2 事件的处理代码在 perf/util/machine.c machine__process_mmap_event
and machine__process_mmap2_event
中;记录的 mmap 参数、返回的地址、偏移量和文件名是在 map__new
和 thread__insert_map
的帮助下为进程 (pid/tid) 记录的,稍后用于将样本事件地址转换为符号名称。
PS:您的 perf.data 的大小为 300+ MB,这是巨大的,处理速度可能会很慢。对于长 运行 程序,您可能希望使用 perf record
的 -F freq
选项降低性能记录事件采样频率:perf record -F40
或使用 -c
选项。
perf
如何在 post 处理期间确定每个加载图像(例如,共享库)的加载地址。例如,perf report
使用此信息使每个符号地址相对于每个加载图像的开头。如下图所示 (unwind: _int_malloc...
):
它是否存储在 elf
二进制或分析输出(即 perf.data
)的某处?
仅查看 ELF 可执行文件和库是无法找到它的。它可以每个 运行;即使 ASLR 像 GDB 一样被 perf 禁用,程序也可能在使用某些可选库的 dlopen
之前使用 mmap(MAP_FIXED)
,然后才加载,因此 dlopen 必须选择与平常不同的地址来映射库. (正常的动态链接发生在 main
运行 之前,不是通过 dlopen,但大概 perf
希望能够记录地址 -> 任何文件支持映射的文件映射。)
大概是perf保存了运行每个ELF对象在perf.data
共享库加载地址存储在perf record
命令期间记录的perf.data文件中。您可以使用 perf script -D
命令以部分解码格式转储来自 perf.data 的数据。当您的程序由 ld-linux*.so.2
加载时(或当 dlopen 需要时),加载程序将搜索库并使用 mmap
系统调用加载其段。这些 mmap 事件由内核记录,并在 perf.data 文件中具有 PERF_RECORD_MMAP 或 PERF_RECORD_MMAP2 类型。 perf report
(和perf script
)将重建内存偏移量以解码符号名称。
$ perf record echo 1
$ perf script -D|grep MMAP -c
7
$ perf script -D|less
PERF_RECORD_MMAP2 ... r-xp /bin/echo
...
PERF_RECORD_MMAP2 ... r-xp /lib/x86_64-linux-gnu/libc-2.27.so
perf
的基本思想在https://github.com/torvalds/linux/blob/master/tools/perf/design.txt file. To start profiling there is perf_event_open
syscall which has perf_event_attr *attr
argument. Man page描述了attr的mmap相关字段:
The perf_event_attr structure provides detailed configuration
information for the event being created.
mmap : 1, /* include mmap data */
mmap_data : 1, /* non-exec mmap data */
mmap2 : 1, /* include mmap with inode data */
Linux 内核在其 perf_events
子系统 (kernel/events) 中将记录已分析进程所需的事件,并使用 fd 和 mmap 将数据导出到分析器。 perf record
通常会将这些数据从内核转储到 perf.data 文件中而不进行大量处理(检查 "Woken up 1 times to write data" 输出的 perf record
打印件)。内核中的mmap事件由perf_event_mmap_output
called from perf_event_mmap_event
which is called from perf_event_mmap
. mmap syscall implementation in mm/mmap.c
has some unconditional calls to perf_event_mmap
.
perf 的 design.txt 提到了 munmap,但当前实现没有 munmap 字段或事件,事件代码 2 被重新用于 PERF_RECORD_LOST. There were ideas that munmap can be helpful https://www.spinics.net/lists/netdev/msg524414.html with links to https://lkml.org/lkml/2016/12/10/1 and https://lkml.org/lkml/2017/1/27/452
perf 工具是 linux 内核源代码的一部分,可以通过 LXR/elixir 网站在线查看:https://elixir.bootlin.com/linux/v5.4/source/tools/perf/
mmap/mmap2 事件的处理代码在 perf/util/machine.c machine__process_mmap_event
and machine__process_mmap2_event
中;记录的 mmap 参数、返回的地址、偏移量和文件名是在 map__new
和 thread__insert_map
的帮助下为进程 (pid/tid) 记录的,稍后用于将样本事件地址转换为符号名称。
PS:您的 perf.data 的大小为 300+ MB,这是巨大的,处理速度可能会很慢。对于长 运行 程序,您可能希望使用 perf record
的 -F freq
选项降低性能记录事件采样频率:perf record -F40
或使用 -c
选项。