在基于 SMP 的 linux 系统中访问另一个 cpu 的 "current_task" 指针
Access "current_task" pointer of another cpu in a SMP based linux system
我正在编写一些内核驱动程序,我需要在其中检查哪个线程在另一个内核的特定点上是 运行。我的驱动程序在每个内核上运行一个内核线程,我需要时不时地同步一些线程来完成某些任务。我从调试日志中观察到的是,有时一个线程过多地等待其他线程。我做了一些补丁,将 __preempt_count
存储在其他内核上,以检查是否有任何 softirq/hardirq 或抢占禁用延迟了我的线程。
我还使用 FTRACE 检查 irqsoff 和 preemptirqsoff 的 IRQ 关闭和抢占禁用的最长持续时间。
直到现在我才能够发现 kerneloops 线程禁用长达 20 毫秒的中断,我发现它太长了。
做了 systemctl disable kerneloops
并解决了这个问题。
现在我似乎处理了一些禁用的抢占windows。为了将来对该驱动程序进行分析,我需要一种方法来确定在特定时间点在其他内核上正在执行哪些线程。我主要尝试将 FTRACE 与 IRQ entry/exit 的事件一起使用,我还使用 trace_printk
将一些调试日志推送到 ftrace 缓冲区中,以便将所有内容都放在一个日志中,等等。
但是,我想做的一件事是访问其他核心的 current_task
结构(current
ptr)并打印 comm
字段,它给出了名称任务(或 pid 值)。
但我很难完成这项工作。
对于 __preempt_count
我没有问题:
int *p = per_cpu_ptr(&__preempt_count,cpu);
pr_info("Preempt count of cpu%u is 0x%08x\n",cpu,*p);
到目前为止,我在声明或访问每个 cpu 变量时没有遇到任何问题,但由于某种原因,current_task
指针在尝试访问它时会触发页面错误。
char buf[10];
struct task_struct *task = per_cpu_ptr(current_task,cpu);
snprintf(buf,8,"%s",task->comm);
pr_info("Task name: %s",buf);
以上代码总是触发页面错误,NULL ptr bla bla。
直到现在我都找不到原因。我试图打印 task
的指针值,我遇到了同样的页面错误。
可能是因为其他核心无法访问该地址?在内核中 space 不应该是这种情况 afaik。到目前为止,我对每个核心变量也没有任何问题,我玩了很多。
底线:访问其他核心的 current_task
并打印 comm/pid 字段的正确方法是什么?
非常感谢,
丹尼尔
我终于知道哪里出了问题。
__preempt_count
和 current_task
之间的区别是第一个定义为 int 变量,而第二个定义为指向结构的指针。换句话说,第一个被定义为变量,第二个被定义为指针。
现在,深入研究每个 cpu 变量,它们只是编译器在单独的内存位置分配的变量,如数组。当调用变量 Foo 的 per_cpu_ptr
时,宏会计算类似 Foo[cpu]
的内容,但这意味着 per_cpu_ptr
需要变量的实际基址,即 &
这样它就可以从这里开始计算相对地址值。
声明时:foo = per_cpu_ptr(&__preempt_count,cpu)
,这个地址已经给定了=&__preempt_count
当声明:bar = per_cpu_ptr(current_task,cpu)
时,没有给出这个地址,因为这里缺少 &
。 current_task 是一个指针,但不是 current_task 数组的基地址。
在上述两种情况下,per_cpu_ptr
的参数都是一个指针,但这里我的理解是错误的,我不清楚我需要传递的变量的指针到底是什么,现在清楚了: 我必须传递变量的基地址(var 或指针无关紧要)以便宏可以计算该变量的相对地址 cpu.
因此,正确的方法是:
bar = per_cpu(current_task,cpu)
转换为 *per_cpu_var(¤t_task,cpu)
或直接
bar = *per_cpu_var(¤t_task,cpu);
我正在编写一些内核驱动程序,我需要在其中检查哪个线程在另一个内核的特定点上是 运行。我的驱动程序在每个内核上运行一个内核线程,我需要时不时地同步一些线程来完成某些任务。我从调试日志中观察到的是,有时一个线程过多地等待其他线程。我做了一些补丁,将 __preempt_count
存储在其他内核上,以检查是否有任何 softirq/hardirq 或抢占禁用延迟了我的线程。
我还使用 FTRACE 检查 irqsoff 和 preemptirqsoff 的 IRQ 关闭和抢占禁用的最长持续时间。
直到现在我才能够发现 kerneloops 线程禁用长达 20 毫秒的中断,我发现它太长了。
做了 systemctl disable kerneloops
并解决了这个问题。
现在我似乎处理了一些禁用的抢占windows。为了将来对该驱动程序进行分析,我需要一种方法来确定在特定时间点在其他内核上正在执行哪些线程。我主要尝试将 FTRACE 与 IRQ entry/exit 的事件一起使用,我还使用 trace_printk
将一些调试日志推送到 ftrace 缓冲区中,以便将所有内容都放在一个日志中,等等。
但是,我想做的一件事是访问其他核心的 current_task
结构(current
ptr)并打印 comm
字段,它给出了名称任务(或 pid 值)。
但我很难完成这项工作。
对于 __preempt_count
我没有问题:
int *p = per_cpu_ptr(&__preempt_count,cpu);
pr_info("Preempt count of cpu%u is 0x%08x\n",cpu,*p);
到目前为止,我在声明或访问每个 cpu 变量时没有遇到任何问题,但由于某种原因,current_task
指针在尝试访问它时会触发页面错误。
char buf[10];
struct task_struct *task = per_cpu_ptr(current_task,cpu);
snprintf(buf,8,"%s",task->comm);
pr_info("Task name: %s",buf);
以上代码总是触发页面错误,NULL ptr bla bla。
直到现在我都找不到原因。我试图打印 task
的指针值,我遇到了同样的页面错误。
可能是因为其他核心无法访问该地址?在内核中 space 不应该是这种情况 afaik。到目前为止,我对每个核心变量也没有任何问题,我玩了很多。
底线:访问其他核心的 current_task
并打印 comm/pid 字段的正确方法是什么?
非常感谢,
丹尼尔
我终于知道哪里出了问题。
__preempt_count
和 current_task
之间的区别是第一个定义为 int 变量,而第二个定义为指向结构的指针。换句话说,第一个被定义为变量,第二个被定义为指针。
现在,深入研究每个 cpu 变量,它们只是编译器在单独的内存位置分配的变量,如数组。当调用变量 Foo 的 per_cpu_ptr
时,宏会计算类似 Foo[cpu]
的内容,但这意味着 per_cpu_ptr
需要变量的实际基址,即 &
这样它就可以从这里开始计算相对地址值。
声明时:foo = per_cpu_ptr(&__preempt_count,cpu)
,这个地址已经给定了=&__preempt_count
当声明:bar = per_cpu_ptr(current_task,cpu)
时,没有给出这个地址,因为这里缺少 &
。 current_task 是一个指针,但不是 current_task 数组的基地址。
在上述两种情况下,per_cpu_ptr
的参数都是一个指针,但这里我的理解是错误的,我不清楚我需要传递的变量的指针到底是什么,现在清楚了: 我必须传递变量的基地址(var 或指针无关紧要)以便宏可以计算该变量的相对地址 cpu.
因此,正确的方法是:
bar = per_cpu(current_task,cpu)
转换为 *per_cpu_var(¤t_task,cpu)
或直接
bar = *per_cpu_var(¤t_task,cpu);