Enable/disable 以编程方式执行事件收集

Enable/disable perf event collection programmatically

我正在使用 perf 在 Ubuntu 20.04 上进行分析(尽管我可以使用任何其他免费工具)。它允许在 CLI 中传递延迟,以便事件收集在程序启动后的特定时间后开始。然而,这次变化很大(1000 秒中有 20 秒)并且有尾部计算我也不感兴趣。

因此,最好从我的程序中调用一些 API 来开始对我感兴趣的代码片段进行 perf 事件收集,然后在代码完成后停止收集。

运行 循环中的代码并不是一个真正的选项,因为有大约 30 秒的初始化阶段和 10 秒的测量阶段,我只对后者感兴趣。

在被分析的程序(或控制进程)和 perf 进程之间有一个进程间通信机制来实现这一点:使用 --control 格式的选项 --control=fifo:ctl-fifo[,ack-fifo]--control=fd:ctl-fd[,ack-fd]perf-stat(1) 联机帮助页中所述。此选项指定一对 FIFO 文件(命名管道)的路径名或一对文件描述符。第一个文件用于发出命令以启用或禁用正在侦听同一文件的任何 perf 进程中的所有事件。第二个文件是可选的,用于在实际执行命令时使用 perf 检查。

联机帮助页中有一个示例显示如何使用此选项从 bash 脚本控制 perf 进程,您可以轻松将其转换为 C/C++:

ctl_dir=/tmp/

ctl_fifo=${ctl_dir}perf_ctl.fifo
test -p ${ctl_fifo} && unlink ${ctl_fifo}
mkfifo ${ctl_fifo}
exec {ctl_fd}<>${ctl_fifo}

这首先检查文件 /tmp/perf_ctl.fifo,如果存在,则它是一个命名管道,然后才将其删除。如果文件不存在这不是问题,但如果它存在并且它不是命名管道,则不应删除该文件并且 mkfifo 应该失败。 mkfifo 使用路径名 /tmp/perf_ctl.fifo 创建命名管道。下一个命令然后使用 read/write 权限打开文件并将文件描述符分配给 ctl_fd。等效的系统调用是 fstatunlinkmkfifoopen。请注意,命名管道将由 shell 脚本(控制进程)或正在分析的进程写入,并将从 perf 进程读取。对第二个命名管道 ctl_fd_ack 重复相同的命令,它将用于接收来自 perf.

的确认
perf stat -D -1 -e cpu-cycles -a -I 1000       \
          --control fd:${ctl_fd},${ctl_fd_ack} \
          -- sleep 30 &
perf_pid=$!

这将派生当前进程并在继承相同文件描述符的子进程中运行 perf stat 程序。 -D -1 选项告诉 perf 开始时禁用所有事件。您可能需要按如下方式更改性能选项:

perf stat -D -1 -e <your event list> --control fd:${ctl_fd},${ctl_fd_ack} -p pid

在这种情况下,要分析的程序与控制进程相同,因此告诉 perf 使用 -p 分析您已经 运行 的程序。等效的系统调用是 fork 后跟子进程中的 execv

sleep 5  && echo 'enable' >&${ctl_fd} && read -u ${ctl_fd_ack} e1 && echo "enabled(${e1})"
sleep 10 && echo 'disable' >&${ctl_fd} && read -u ${ctl_fd_ack} d1 && echo "disabled(${d1})"

示例脚本休眠约 5 秒,将 'enable' 写入 ctl_fd 管道,然后检查来自 perf 的响应以确保在继续禁用事件之前已启用事件大约 10 秒后。等效的系统调用是 writeread.

脚本的其余部分删除文件描述符和管道文件。

现在将它们放在一起,您的程序应该如下所示:

/* PART 1
Initialization code.
*/

/* PART 2
Create named pipes and fds.
Fork perf with disabled events.
perf is running now but nothing is being measured.
You can redirect perf output to a file if you wish.
*/

/* PART 3
Enable events.
*/

/* PART 4
The code you want to profile goes here.
*/

/* PART 5
Disable events.
perf is still running but nothing is being measured.
*/

/* PART 6
Cleanup.
Let this process terminate, which would cause the perf process to terminate as well.
Alternatively, use `kill(pid, SIGINT)` to gracefully kill perf.
perf stat outputs the results when it terminates.
*/