]> git.ipfire.org Git - thirdparty/kernel/stable.git/commit
cgroup: Don't expose dead tasks in cgroup
authorSebastian Andrzej Siewior <bigeasy@linutronix.de>
Fri, 6 Mar 2026 19:22:35 +0000 (20:22 +0100)
committerTejun Heo <tj@kernel.org>
Fri, 6 Mar 2026 22:43:25 +0000 (12:43 -1000)
commita72f73c4dd9b209c53cf8b03b6e97fcefad4262c
treef1b8c1a3ace022a974752a5323b113b02792e916
parentca174c705db52db3cc842e754fd25a5f50eb702d
cgroup: Don't expose dead tasks in cgroup

Once a task exits it has its state set to TASK_DEAD and then it is
removed from the cgroup it belonged to. The last step happens on the task
gets out of its last schedule() invocation and is delayed on PREEMPT_RT
due to locking constraints.

As a result it is possible to receive a pid via waitpid() of a task
which is still listed in cgroup.procs for the cgroup it belonged
to. This is something that systemd does not expect and as a result it
waits for its exit until a time out occurs.
This can also be reproduced on !PREEMPT_RT kernel with a significant
delay in do_exit() after exit_notify().

Hide the task from the output which have PF_EXITING set which is done
before the parent is notified. Keeping zombies with live threads
shouldn't break anything (suggested by Tejun).

Reported-by: Bert Karwatzki <spasswolf@web.de>
Closes: https://lore.kernel.org/all/20260219164648.3014-1-spasswolf@web.de/
Tested-by: Bert Karwatzki <spasswolf@web.de>
Fixes: 9311e6c29b34 ("cgroup: Fix sleeping from invalid context warning on PREEMPT_RT")
Cc: stable@vger.kernel.org # v6.19+
Signed-off-by: Sebastian Andrzej Siewior <bigeasy@linutronix.de>
Signed-off-by: Tejun Heo <tj@kernel.org>
kernel/cgroup/cgroup.c