intel-pmu
-
现代 x86 CPU 中是否有一个计数器只计算在中断处理程序中花费的时间(或周期)?
-
使用 wrmsrl 和 rdmsrl 读取 PMU 计数器
-
cpuid:报告的微架构似乎模棱两可
-
PMU x86-64 性能计数器未显示在 AWS 下的性能中
-
Vtune:在机器 运行 执行其他任务时 vtune 测量 运行 时英特尔采样驱动程序的准确性
-
性能计数器和 IMC 计数器不匹配
-
DRAM 每列内存访问的性能计数器
-
mem_load_uops_retired.l3_miss 和 offcore_response.demand_data_rd.l3_miss.local_dram 事件之间的区别
-
PMC 计算软件预取是否命中 L1 缓存
-
性能事件组中只有 2 PERF_TYPE_HW_CACHE 个事件
-
PERF_TYPE_HARDWARE 和 PERF_TYPE_HW_CACHE 并发监控
-
性能不精确的调用图报告
-
为什么kill dependency指令会消耗reservation station slots?
-
如何读取x86 intel处理器的PMC(Performance Monitoring Counter)
-
rdpmc:令人惊讶的行为
-
为什么用户态 L1 store miss 事件只在有 store initialization loop 时才被统计?
-
perf 如何使用 offcore 事件?
-
为什么每次迭代的 uops 数量会随着流式负载的步幅而增加?
-
硬件缓存事件和性能
-
LSD 能否从检测到的循环的下一次迭代发出 uOP?