mm: memcontrol: don't batch updates of local VM stats and events

author Johannes Weiner <hannes@cmpxchg.org>

Thu, 13 Jun 2019 22:55:46 +0000 (15:55 -0700)

committer Linus Torvalds <torvalds@linux-foundation.org>

Fri, 14 Jun 2019 03:34:56 +0000 (17:34 -1000)
author Johannes Weiner <hannes@cmpxchg.org>
Thu, 13 Jun 2019 22:55:46 +0000 (15:55 -0700)
committer Linus Torvalds <torvalds@linux-foundation.org>
Fri, 14 Jun 2019 03:34:56 +0000 (17:34 -1000)
diff --git a/include/linux/memcontrol.h b/include/linux/memcontrol.h

index edf9e8f32d7025fd53412f414f4d136fb6867d1f..1dcb763bb610a85295893645fe285f2659532f1a 100644 (file)
--- a/include/linux/memcontrol.h
+++ b/include/linux/memcontrol.h
@@ -117,9 +117,12 @@ struct memcg_shrinker_map {
  struct mem_cgroup_per_node {
         struct lruvec           lruvec;
  
+       /* Legacy local VM stats */
+       struct lruvec_stat __percpu *lruvec_stat_local;
+
+       /* Subtree VM stats (batched updates) */
         struct lruvec_stat __percpu *lruvec_stat_cpu;
         atomic_long_t           lruvec_stat[NR_VM_NODE_STAT_ITEMS];
-       atomic_long_t           lruvec_stat_local[NR_VM_NODE_STAT_ITEMS];
  
         unsigned long           lru_zone_size[MAX_NR_ZONES][NR_LRU_LISTS];
  
@@ -265,17 +268,18 @@ struct mem_cgroup {
         atomic_t                moving_account;
         struct task_struct      *move_lock_task;
  
-       /* memory.stat */
+       /* Legacy local VM stats and events */
+       struct memcg_vmstats_percpu __percpu *vmstats_local;
+
+       /* Subtree VM stats and events (batched updates) */
         struct memcg_vmstats_percpu __percpu *vmstats_percpu;
  
         MEMCG_PADDING(_pad2_);
  
         atomic_long_t           vmstats[MEMCG_NR_STAT];
-       atomic_long_t           vmstats_local[MEMCG_NR_STAT];
-
         atomic_long_t           vmevents[NR_VM_EVENT_ITEMS];
-       atomic_long_t           vmevents_local[NR_VM_EVENT_ITEMS];
  
+       /* memory.events */
         atomic_long_t           memory_events[MEMCG_NR_MEMORY_EVENTS];
  
         unsigned long           socket_pressure;
@@ -567,7 +571,11 @@ static inline unsigned long memcg_page_state(struct mem_cgroup *memcg, int idx)
  static inline unsigned long memcg_page_state_local(struct mem_cgroup *memcg,
                                                    int idx)
  {
-       long x = atomic_long_read(&memcg->vmstats_local[idx]);
+       long x = 0;
+       int cpu;
+
+       for_each_possible_cpu(cpu)
+               x += per_cpu(memcg->vmstats_local->stat[idx], cpu);
  #ifdef CONFIG_SMP
         if (x < 0)
                 x = 0;
@@ -641,13 +649,15 @@ static inline unsigned long lruvec_page_state_local(struct lruvec *lruvec,
                                                     enum node_stat_item idx)
  {
         struct mem_cgroup_per_node *pn;
-       long x;
+       long x = 0;
+       int cpu;
  
         if (mem_cgroup_disabled())
                 return node_page_state(lruvec_pgdat(lruvec), idx);
  
         pn = container_of(lruvec, struct mem_cgroup_per_node, lruvec);
-       x = atomic_long_read(&pn->lruvec_stat_local[idx]);
+       for_each_possible_cpu(cpu)
+               x += per_cpu(pn->lruvec_stat_local->count[idx], cpu);
  #ifdef CONFIG_SMP
         if (x < 0)
                 x = 0;
diff --git a/mm/memcontrol.c b/mm/memcontrol.c

index ca0bc6e6be1316602def0ac42bc4ffddef14cf08..ba9138a4a1de37f744eaf488fc0930b82f60b3e1 100644 (file)
--- a/mm/memcontrol.c
+++ b/mm/memcontrol.c
@@ -691,11 +691,12 @@ void __mod_memcg_state(struct mem_cgroup *memcg, int idx, int val)
         if (mem_cgroup_disabled())
                 return;
  
+       __this_cpu_add(memcg->vmstats_local->stat[idx], val);
+
         x = val + __this_cpu_read(memcg->vmstats_percpu->stat[idx]);
         if (unlikely(abs(x) > MEMCG_CHARGE_BATCH)) {
                 struct mem_cgroup *mi;
  
-               atomic_long_add(x, &memcg->vmstats_local[idx]);
                 for (mi = memcg; mi; mi = parent_mem_cgroup(mi))
                         atomic_long_add(x, &mi->vmstats[idx]);
                 x = 0;
@@ -745,11 +746,12 @@ void __mod_lruvec_state(struct lruvec *lruvec, enum node_stat_item idx,
         __mod_memcg_state(memcg, idx, val);
  
         /* Update lruvec */
+       __this_cpu_add(pn->lruvec_stat_local->count[idx], val);
+
         x = val + __this_cpu_read(pn->lruvec_stat_cpu->count[idx]);
         if (unlikely(abs(x) > MEMCG_CHARGE_BATCH)) {
                 struct mem_cgroup_per_node *pi;
  
-               atomic_long_add(x, &pn->lruvec_stat_local[idx]);
                 for (pi = pn; pi; pi = parent_nodeinfo(pi, pgdat->node_id))
                         atomic_long_add(x, &pi->lruvec_stat[idx]);
                 x = 0;
@@ -771,11 +773,12 @@ void __count_memcg_events(struct mem_cgroup *memcg, enum vm_event_item idx,
         if (mem_cgroup_disabled())
                 return;
  
+       __this_cpu_add(memcg->vmstats_local->events[idx], count);
+
         x = count + __this_cpu_read(memcg->vmstats_percpu->events[idx]);
         if (unlikely(x > MEMCG_CHARGE_BATCH)) {
                 struct mem_cgroup *mi;
  
-               atomic_long_add(x, &memcg->vmevents_local[idx]);
                 for (mi = memcg; mi; mi = parent_mem_cgroup(mi))
                         atomic_long_add(x, &mi->vmevents[idx]);
                 x = 0;
@@ -790,7 +793,12 @@ static unsigned long memcg_events(struct mem_cgroup *memcg, int event)
  
  static unsigned long memcg_events_local(struct mem_cgroup *memcg, int event)
  {
-       return atomic_long_read(&memcg->vmevents_local[event]);
+       long x = 0;
+       int cpu;
+
+       for_each_possible_cpu(cpu)
+               x += per_cpu(memcg->vmstats_local->events[event], cpu);
+       return x;
  }
  
  static void mem_cgroup_charge_statistics(struct mem_cgroup *memcg,
@@ -2191,11 +2199,9 @@ static int memcg_hotplug_cpu_dead(unsigned int cpu)
                         long x;
  
                         x = this_cpu_xchg(memcg->vmstats_percpu->stat[i], 0);
-                       if (x) {
-                               atomic_long_add(x, &memcg->vmstats_local[i]);
+                       if (x)
                                 for (mi = memcg; mi; mi = parent_mem_cgroup(mi))
                                         atomic_long_add(x, &memcg->vmstats[i]);
-                       }
  
                         if (i >= NR_VM_NODE_STAT_ITEMS)
                                 continue;
@@ -2205,12 +2211,10 @@ static int memcg_hotplug_cpu_dead(unsigned int cpu)
  
                                 pn = mem_cgroup_nodeinfo(memcg, nid);
                                 x = this_cpu_xchg(pn->lruvec_stat_cpu->count[i], 0);
-                               if (x) {
-                                       atomic_long_add(x, &pn->lruvec_stat_local[i]);
+                               if (x)
                                         do {
                                                 atomic_long_add(x, &pn->lruvec_stat[i]);
                                         } while ((pn = parent_nodeinfo(pn, nid)));
-                               }
                         }
                 }
  
@@ -2218,11 +2222,9 @@ static int memcg_hotplug_cpu_dead(unsigned int cpu)
                         long x;
  
                         x = this_cpu_xchg(memcg->vmstats_percpu->events[i], 0);
-                       if (x) {
-                               atomic_long_add(x, &memcg->vmevents_local[i]);
+                       if (x)
                                 for (mi = memcg; mi; mi = parent_mem_cgroup(mi))
                                         atomic_long_add(x, &memcg->vmevents[i]);
-                       }
                 }
         }
  
@@ -4483,8 +4485,15 @@ static int alloc_mem_cgroup_per_node_info(struct mem_cgroup *memcg, int node)
         if (!pn)
                 return 1;
  
+       pn->lruvec_stat_local = alloc_percpu(struct lruvec_stat);
+       if (!pn->lruvec_stat_local) {
+               kfree(pn);
+               return 1;
+       }
+
         pn->lruvec_stat_cpu = alloc_percpu(struct lruvec_stat);
         if (!pn->lruvec_stat_cpu) {
+               free_percpu(pn->lruvec_stat_local);
                 kfree(pn);
                 return 1;
         }
@@ -4506,6 +4515,7 @@ static void free_mem_cgroup_per_node_info(struct mem_cgroup *memcg, int node)
                 return;
  
         free_percpu(pn->lruvec_stat_cpu);
+       free_percpu(pn->lruvec_stat_local);
         kfree(pn);
  }
  
@@ -4516,6 +4526,7 @@ static void __mem_cgroup_free(struct mem_cgroup *memcg)
         for_each_node(node)
                 free_mem_cgroup_per_node_info(memcg, node);
         free_percpu(memcg->vmstats_percpu);
+       free_percpu(memcg->vmstats_local);
         kfree(memcg);
  }
  
@@ -4544,6 +4555,10 @@ static struct mem_cgroup *mem_cgroup_alloc(void)
         if (memcg->id.id < 0)
                 goto fail;
  
+       memcg->vmstats_local = alloc_percpu(struct memcg_vmstats_percpu);
+       if (!memcg->vmstats_local)
+               goto fail;
+
         memcg->vmstats_percpu = alloc_percpu(struct memcg_vmstats_percpu);
         if (!memcg->vmstats_percpu)
                 goto fail;
author	Johannes Weiner <hannes@cmpxchg.org>
	Thu, 13 Jun 2019 22:55:46 +0000 (15:55 -0700)
committer	Linus Torvalds <torvalds@linux-foundation.org>
	Fri, 14 Jun 2019 03:34:56 +0000 (17:34 -1000)
include/linux/memcontrol.h		patch \| blob \| blame \| history
mm/memcontrol.c		patch \| blob \| blame \| history