需要编译标志以便用户执行

Required compile flags in order to user perf

我试图理解 linux perfhotspot 以理解我的 c++ 应用程序的调用 stacks/trace。

程序应该在debug模式下编译还是在release模式下编译?假设我只有一个文件 inline.cpp。我在 example 之一中看到使用

g++ -O2 -g inline.cpp -o inline
perf record --call-graph dwarf ./inline

请问debug (-g)optimization -O2中的程序是否需要编译?编译可执行文件以使其对 运行 with perf record 有用的标志是什么?

如果我们不带编译器标志编译程序会有什么不同吗?

g++ inline.cpp -o inline

首先,-g-O2并不是对立的。 -g 指定将生成调试符号,以便您可以将热点与实际代码行相关联。 -O2 指定应执行代码优化;对于您打算在调试器中 运行 的代码,通常不会这样做,因为这会使跟踪执行变得更加困难。

探查器测量可执行文件的性能,而不是源代码的性能。如果分析未优化的可执行文件,您将看到未优化的可执行文件的性能问题所在,但这些问题可能与优化的可执行文件中的问题不同。假设您关心优化后的可执行文件的性能(因为这是用户通常 运行ning 的性能),您应该对其进行分析。 -O2 的使用肯定会让 更难理解 性能问题所在,但这只是分析代码的本质。