]> git.ipfire.org Git - thirdparty/kernel/linux.git/commitdiff
mm/slab: place slabobj_ext metadata in unused space within s->size
authorHarry Yoo <harry.yoo@oracle.com>
Tue, 13 Jan 2026 06:18:45 +0000 (15:18 +0900)
committerVlastimil Babka <vbabka@suse.cz>
Wed, 4 Feb 2026 09:05:36 +0000 (10:05 +0100)
When a cache has high s->align value and s->object_size is not aligned
to it, each object ends up with some unused space because of alignment.
If this wasted space is big enough, we can use it to store the
slabobj_ext metadata instead of wasting it.

On my system, this happens with caches like kmem_cache, mm_struct, pid,
task_struct, sighand_cache, xfs_inode, and others.

To place the slabobj_ext metadata within each object, the existing
slab_obj_ext() logic can still be used by setting:

  - slab->obj_exts = slab_address(slab) + (slabobj_ext offset)
  - stride = s->size

slab_obj_ext() doesn't need know where the metadata is stored,
so this method works without adding extra overhead to slab_obj_ext().

A good example benefiting from this optimization is xfs_inode
(object_size: 992, align: 64). To measure memory savings, 2 millions of
files were created on XFS.

[ MEMCG=y, MEM_ALLOC_PROFILING=n ]

Before patch (creating ~2.64M directories on xfs):
  Slab:            5175976 kB
  SReclaimable:    3837524 kB
  SUnreclaim:      1338452 kB

After patch (creating ~2.64M directories on xfs):
  Slab:            5152912 kB
  SReclaimable:    3838568 kB
  SUnreclaim:      1314344 kB (-23.54 MiB)

Enjoy the memory savings!

Suggested-by: Vlastimil Babka <vbabka@suse.cz>
Signed-off-by: Harry Yoo <harry.yoo@oracle.com>
Link: https://patch.msgid.link/20260113061845.159790-10-harry.yoo@oracle.com
Signed-off-by: Vlastimil Babka <vbabka@suse.cz>
include/linux/slab.h
mm/slab_common.c
mm/slub.c

index 93e367b6a5f6c573d786cdea2985d34fe332a008..34db237319c1b58378e9b3b8e65eb9263f4f5d86 100644 (file)
@@ -59,6 +59,9 @@ enum _slab_flag_bits {
        _SLAB_CMPXCHG_DOUBLE,
 #ifdef CONFIG_SLAB_OBJ_EXT
        _SLAB_NO_OBJ_EXT,
+#endif
+#if defined(CONFIG_SLAB_OBJ_EXT) && defined(CONFIG_64BIT)
+       _SLAB_OBJ_EXT_IN_OBJ,
 #endif
        _SLAB_FLAGS_LAST_BIT
 };
@@ -244,6 +247,12 @@ enum _slab_flag_bits {
 #define SLAB_NO_OBJ_EXT                __SLAB_FLAG_UNUSED
 #endif
 
+#if defined(CONFIG_SLAB_OBJ_EXT) && defined(CONFIG_64BIT)
+#define SLAB_OBJ_EXT_IN_OBJ    __SLAB_FLAG_BIT(_SLAB_OBJ_EXT_IN_OBJ)
+#else
+#define SLAB_OBJ_EXT_IN_OBJ    __SLAB_FLAG_UNUSED
+#endif
+
 /*
  * ZERO_SIZE_PTR will be returned for zero sized kmalloc requests.
  *
index b2db8f8f3cf072dd04ec5dd64240f964d9dfeda5..886d02fa94fb02416e766d83d6c64ff177be2694 100644 (file)
@@ -43,10 +43,13 @@ DEFINE_MUTEX(slab_mutex);
 struct kmem_cache *kmem_cache;
 
 /*
- * Set of flags that will prevent slab merging
+ * Set of flags that will prevent slab merging.
+ * Any flag that adds per-object metadata should be included,
+ * since slab merging can update s->inuse that affects the metadata layout.
  */
 #define SLAB_NEVER_MERGE (SLAB_DEBUG_FLAGS | SLAB_TYPESAFE_BY_RCU | \
-               SLAB_NOLEAKTRACE | SLAB_FAILSLAB | SLAB_NO_MERGE)
+               SLAB_NOLEAKTRACE | SLAB_FAILSLAB | SLAB_NO_MERGE | \
+               SLAB_OBJ_EXT_IN_OBJ)
 
 #define SLAB_MERGE_SAME (SLAB_RECLAIM_ACCOUNT | SLAB_CACHE_DMA | \
                         SLAB_CACHE_DMA32 | SLAB_ACCOUNT)
index 782685433580b3b27e75f90d1424da6141b91f6c..0805c09d4b5581d7d52e1d6279744e4e8f379aae 100644 (file)
--- a/mm/slub.c
+++ b/mm/slub.c
@@ -972,6 +972,46 @@ static inline bool obj_exts_in_slab(struct kmem_cache *s, struct slab *slab)
 {
        return false;
 }
+
+#endif
+
+#if defined(CONFIG_SLAB_OBJ_EXT) && defined(CONFIG_64BIT)
+static bool obj_exts_in_object(struct kmem_cache *s, struct slab *slab)
+{
+       /*
+        * Note we cannot rely on the SLAB_OBJ_EXT_IN_OBJ flag here and need to
+        * check the stride. A cache can have SLAB_OBJ_EXT_IN_OBJ set, but
+        * allocations within_slab_leftover are preferred. And those may be
+        * possible or not depending on the particular slab's size.
+        */
+       return obj_exts_in_slab(s, slab) &&
+              (slab_get_stride(slab) == s->size);
+}
+
+static unsigned int obj_exts_offset_in_object(struct kmem_cache *s)
+{
+       unsigned int offset = get_info_end(s);
+
+       if (kmem_cache_debug_flags(s, SLAB_STORE_USER))
+               offset += sizeof(struct track) * 2;
+
+       if (slub_debug_orig_size(s))
+               offset += sizeof(unsigned long);
+
+       offset += kasan_metadata_size(s, false);
+
+       return offset;
+}
+#else
+static inline bool obj_exts_in_object(struct kmem_cache *s, struct slab *slab)
+{
+       return false;
+}
+
+static inline unsigned int obj_exts_offset_in_object(struct kmem_cache *s)
+{
+       return 0;
+}
 #endif
 
 #ifdef CONFIG_SLUB_DEBUG
@@ -1272,6 +1312,9 @@ static void print_trailer(struct kmem_cache *s, struct slab *slab, u8 *p)
 
        off += kasan_metadata_size(s, false);
 
+       if (obj_exts_in_object(s, slab))
+               off += sizeof(struct slabobj_ext);
+
        if (off != size_from_object(s))
                /* Beginning of the filler is the free pointer */
                print_section(KERN_ERR, "Padding  ", p + off,
@@ -1453,8 +1496,11 @@ skip_bug_print:
  *     between metadata and the next object, independent of alignment.
  *   - Filled with 0x5a (POISON_INUSE) when SLAB_POISON is set.
  * [Final alignment padding]
- *   - Any bytes added by ALIGN(size, s->align) to reach s->size.
- *   - Filled with 0x5a (POISON_INUSE) when SLAB_POISON is set.
+ *   - Bytes added by ALIGN(size, s->align) to reach s->size.
+ *   - When the padding is large enough, it can be used to store
+ *     struct slabobj_ext for accounting metadata (obj_exts_in_object()).
+ *   - The remaining bytes (if any) are filled with 0x5a (POISON_INUSE)
+ *     when SLAB_POISON is set.
  *
  * Notes:
  * - Redzones are filled by init_object() with SLUB_RED_ACTIVE/INACTIVE.
@@ -1485,6 +1531,9 @@ static int check_pad_bytes(struct kmem_cache *s, struct slab *slab, u8 *p)
 
        off += kasan_metadata_size(s, false);
 
+       if (obj_exts_in_object(s, slab))
+               off += sizeof(struct slabobj_ext);
+
        if (size_from_object(s) == off)
                return 1;
 
@@ -1510,7 +1559,7 @@ slab_pad_check(struct kmem_cache *s, struct slab *slab)
        length = slab_size(slab);
        end = start + length;
 
-       if (obj_exts_in_slab(s, slab)) {
+       if (obj_exts_in_slab(s, slab) && !obj_exts_in_object(s, slab)) {
                remainder = length;
                remainder -= obj_exts_offset_in_slab(s, slab);
                remainder -= obj_exts_size_in_slab(slab);
@@ -2384,6 +2433,24 @@ static void alloc_slab_obj_exts_early(struct kmem_cache *s, struct slab *slab)
 #endif
                slab->obj_exts = obj_exts;
                slab_set_stride(slab, sizeof(struct slabobj_ext));
+       } else if (s->flags & SLAB_OBJ_EXT_IN_OBJ) {
+               unsigned int offset = obj_exts_offset_in_object(s);
+
+               obj_exts = (unsigned long)slab_address(slab);
+               obj_exts += s->red_left_pad;
+               obj_exts += offset;
+
+               get_slab_obj_exts(obj_exts);
+               for_each_object(addr, s, slab_address(slab), slab->objects)
+                       memset(kasan_reset_tag(addr) + offset, 0,
+                              sizeof(struct slabobj_ext));
+               put_slab_obj_exts(obj_exts);
+
+#ifdef CONFIG_MEMCG
+               obj_exts |= MEMCG_DATA_OBJEXTS;
+#endif
+               slab->obj_exts = obj_exts;
+               slab_set_stride(slab, s->size);
        }
 }
 
@@ -7028,8 +7095,10 @@ void kmem_cache_free(struct kmem_cache *s, void *x)
 }
 EXPORT_SYMBOL(kmem_cache_free);
 
-static inline size_t slab_ksize(const struct kmem_cache *s)
+static inline size_t slab_ksize(struct slab *slab)
 {
+       struct kmem_cache *s = slab->slab_cache;
+
 #ifdef CONFIG_SLUB_DEBUG
        /*
         * Debugging requires use of the padding between object
@@ -7042,11 +7111,13 @@ static inline size_t slab_ksize(const struct kmem_cache *s)
                return s->object_size;
        /*
         * If we have the need to store the freelist pointer
-        * back there or track user information then we can
+        * or any other metadata back there then we can
         * only use the space before that information.
         */
        if (s->flags & (SLAB_TYPESAFE_BY_RCU | SLAB_STORE_USER))
                return s->inuse;
+       else if (obj_exts_in_object(s, slab))
+               return s->inuse;
        /*
         * Else we can use all the padding etc for the allocation
         */
@@ -7055,8 +7126,8 @@ static inline size_t slab_ksize(const struct kmem_cache *s)
 
 static size_t __ksize(const void *object)
 {
-       const struct page *page;
-       const struct slab *slab;
+       struct page *page;
+       struct slab *slab;
 
        if (unlikely(object == ZERO_SIZE_PTR))
                return 0;
@@ -7075,7 +7146,7 @@ static size_t __ksize(const void *object)
        skip_orig_size_check(slab->slab_cache, object);
 #endif
 
-       return slab_ksize(slab->slab_cache);
+       return slab_ksize(slab);
 }
 
 /**
@@ -8199,6 +8270,7 @@ static int calculate_sizes(struct kmem_cache_args *args, struct kmem_cache *s)
 {
        slab_flags_t flags = s->flags;
        unsigned int size = s->object_size;
+       unsigned int aligned_size;
        unsigned int order;
 
        /*
@@ -8308,7 +8380,13 @@ static int calculate_sizes(struct kmem_cache_args *args, struct kmem_cache *s)
         * offset 0. In order to align the objects we have to simply size
         * each object to conform to the alignment.
         */
-       size = ALIGN(size, s->align);
+       aligned_size = ALIGN(size, s->align);
+#if defined(CONFIG_SLAB_OBJ_EXT) && defined(CONFIG_64BIT)
+       if (aligned_size - size >= sizeof(struct slabobj_ext))
+               s->flags |= SLAB_OBJ_EXT_IN_OBJ;
+#endif
+       size = aligned_size;
+
        s->size = size;
        s->reciprocal_size = reciprocal_value(size);
        order = calculate_order(size);