perf
-
为 perf report assembly 选择 Intel 语法
-
perf 如何使用 ORC 在较新的内核版本中展开堆栈?
-
运行 时间和在 linux perf 中报告的周期计数
-
哪种对齐方式会导致这种性能差异
-
使用 "Perf stat" 同时分析进程和 system-wide 事件
-
什么是“__GI_memset”?为什么要花费这么多 CPU 资源?
-
Enable/disable 以编程方式执行事件收集
-
计算 Amd Zen 2 处理器上的 L3 缓存访问事件
-
我可以制作一个模板函数 noinline 还是强制它出现在分析器中?
-
我可以加载 elf 并在实际 运行 之前从 /proc/pid/maps 获取虚拟地址吗?
-
MM_PREFETCH 固有的访问行为 - Intel
-
Perf instruction/cycles 计入 userspace/kernelspace 单独计入 Linux
-
为什么在两个 CPU 寄存器之间移动数据如此缓慢以致于花费了总时间的 30%?
-
重定向性能输出
-
perf record(或其他分析器)如何选择将哪条指令计为成本时间?
-
了解 Linux perf FP 计数器和 C++ 程序中的 FLOPS 计算
-
了解 Linux Perf Stat 打印的频率
-
如何获得涉及 C++ 标准库的 frame-pointer perf call stacks/flamegraphs?
-
需要编译标志以便用户执行
-
使用 --call-stack fp 的 perf 记录无法展开主函数