cgroup: fix race between fork and cgroup.kill

author Shakeel Butt <shakeel.butt@linux.dev>

Fri, 31 Jan 2025 00:05:42 +0000 (16:05 -0800)

committer Greg Kroah-Hartman <gregkh@linuxfoundation.org>

Thu, 13 Mar 2025 11:50:40 +0000 (12:50 +0100)
author Shakeel Butt <shakeel.butt@linux.dev>
Fri, 31 Jan 2025 00:05:42 +0000 (16:05 -0800)
committer Greg Kroah-Hartman <gregkh@linuxfoundation.org>
Thu, 13 Mar 2025 11:50:40 +0000 (12:50 +0100)
diff --git a/include/linux/cgroup-defs.h b/include/linux/cgroup-defs.h

index 45333fcf5082a7850702e47f74307a05693ae436..e60fbdde9308bbe2a94c6e8163b8feab1f3f2c66 100644 (file)
--- a/include/linux/cgroup-defs.h
+++ b/include/linux/cgroup-defs.h
@@ -71,9 +71,6 @@ enum {
  
         /* Cgroup is frozen. */
         CGRP_FROZEN,
-
-       /* Control group has to be killed. */
-       CGRP_KILL,
  };
  
  /* cgroup_root->flags */
@@ -407,6 +404,9 @@ struct cgroup {
  
         int nr_threaded_children;       /* # of live threaded child cgroups */
  
+       /* sequence number for cgroup.kill, serialized by css_set_lock. */
+       unsigned int kill_seq;
+
         struct kernfs_node *kn;         /* cgroup kernfs entry */
         struct cgroup_file procs_file;  /* handle for "cgroup.procs" */
         struct cgroup_file events_file; /* handle for "cgroup.events" */
diff --git a/include/linux/sched/task.h b/include/linux/sched/task.h

index 0c2d008099151a285d27b80fe4d8bc3faa4eb01d..f254a7d851fe1ff31ad4370ad19a1008aa60a9db 100644 (file)
--- a/include/linux/sched/task.h
+++ b/include/linux/sched/task.h
@@ -34,6 +34,7 @@ struct kernel_clone_args {
         int io_thread;
         struct cgroup *cgrp;
         struct css_set *cset;
+       unsigned int kill_seq;
  };
  
  /*
diff --git a/kernel/cgroup/cgroup.c b/kernel/cgroup/cgroup.c

index d031e0b8bf9f61bc4708fa780c022de748f7c005..1e87257fe46924c07b0e746e754a8b174381762c 100644 (file)
--- a/kernel/cgroup/cgroup.c
+++ b/kernel/cgroup/cgroup.c
@@ -3818,7 +3818,7 @@ static void __cgroup_kill(struct cgroup *cgrp)
         lockdep_assert_held(&cgroup_mutex);
  
         spin_lock_irq(&css_set_lock);
-       set_bit(CGRP_KILL, &cgrp->flags);
+       cgrp->kill_seq++;
         spin_unlock_irq(&css_set_lock);
  
         css_task_iter_start(&cgrp->self, CSS_TASK_ITER_PROCS | CSS_TASK_ITER_THREADED, &it);
@@ -3834,10 +3834,6 @@ static void __cgroup_kill(struct cgroup *cgrp)
                 send_sig(SIGKILL, task, 0);
         }
         css_task_iter_end(&it);
-
-       spin_lock_irq(&css_set_lock);
-       clear_bit(CGRP_KILL, &cgrp->flags);
-       spin_unlock_irq(&css_set_lock);
  }
  
  static void cgroup_kill(struct cgroup *cgrp)
@@ -6202,6 +6198,10 @@ static int cgroup_css_set_fork(struct kernel_clone_args *kargs)
         spin_lock_irq(&css_set_lock);
         cset = task_css_set(current);
         get_css_set(cset);
+       if (kargs->cgrp)
+               kargs->kill_seq = kargs->cgrp->kill_seq;
+       else
+               kargs->kill_seq = cset->dfl_cgrp->kill_seq;
         spin_unlock_irq(&css_set_lock);
  
         if (!(kargs->flags & CLONE_INTO_CGROUP)) {
@@ -6369,6 +6369,7 @@ void cgroup_post_fork(struct task_struct *child,
                       struct kernel_clone_args *kargs)
         __releases(&cgroup_threadgroup_rwsem) __releases(&cgroup_mutex)
  {
+       unsigned int cgrp_kill_seq = 0;
         unsigned long cgrp_flags = 0;
         bool kill = false;
         struct cgroup_subsys *ss;
@@ -6382,10 +6383,13 @@ void cgroup_post_fork(struct task_struct *child,
  
         /* init tasks are special, only link regular threads */
         if (likely(child->pid)) {
-               if (kargs->cgrp)
+               if (kargs->cgrp) {
                         cgrp_flags = kargs->cgrp->flags;
-               else
+                       cgrp_kill_seq = kargs->cgrp->kill_seq;
+               } else {
                         cgrp_flags = cset->dfl_cgrp->flags;
+                       cgrp_kill_seq = cset->dfl_cgrp->kill_seq;
+               }
  
                 WARN_ON_ONCE(!list_empty(&child->cg_list));
                 cset->nr_tasks++;
@@ -6420,7 +6424,7 @@ void cgroup_post_fork(struct task_struct *child,
                  * child down right after we finished preparing it for
                  * userspace.
                  */
-               kill = test_bit(CGRP_KILL, &cgrp_flags);
+               kill = kargs->kill_seq != cgrp_kill_seq;
         }
  
         spin_unlock_irq(&css_set_lock);
author	Shakeel Butt <shakeel.butt@linux.dev>
	Fri, 31 Jan 2025 00:05:42 +0000 (16:05 -0800)
committer	Greg Kroah-Hartman <gregkh@linuxfoundation.org>
	Thu, 13 Mar 2025 11:50:40 +0000 (12:50 +0100)
include/linux/cgroup-defs.h		patch \| blob \| blame \| history
include/linux/sched/task.h		patch \| blob \| blame \| history
kernel/cgroup/cgroup.c		patch \| blob \| blame \| history