tcp: reduce tcp sockets size by one cache line

author Eric Dumazet <edumazet@google.com>

Thu, 29 Jan 2026 15:34:58 +0000 (15:34 +0000)

committer Jakub Kicinski <kuba@kernel.org>

Sat, 31 Jan 2026 01:15:51 +0000 (17:15 -0800)
author Eric Dumazet <edumazet@google.com>
Thu, 29 Jan 2026 15:34:58 +0000 (15:34 +0000)
committer Jakub Kicinski <kuba@kernel.org>
Sat, 31 Jan 2026 01:15:51 +0000 (17:15 -0800)
diff --git a/include/net/sock.h b/include/net/sock.h

index aafe8bdb2c0f936bc3a179e394c2df6830419997..66b56288c1d3850439b2a0bed00be801d5770efa 100644 (file)
--- a/include/net/sock.h
+++ b/include/net/sock.h
@@ -341,6 +341,7 @@ struct sk_filter;
    *    @sk_reuseport_cb: reuseport group container
    *    @sk_bpf_storage: ptr to cache and control for bpf_sk_storage
    *    @sk_rcu: used during RCU grace period
+  *    @sk_freeptr: used for SLAB_TYPESAFE_BY_RCU managed sockets
    *    @sk_clockid: clockid used by time-based scheduling (SO_TXTIME)
    *    @sk_txtime_deadline_mode: set deadline mode for SO_TXTIME
    *    @sk_txtime_report_errors: set report errors mode for SO_TXTIME
@@ -582,7 +583,14 @@ struct sock {
         struct bpf_local_storage __rcu  *sk_bpf_storage;
  #endif
         struct numa_drop_counters *sk_drop_counters;
-       struct rcu_head         sk_rcu;
+       /* sockets using SLAB_TYPESAFE_BY_RCU can use sk_freeptr.
+        * By the time kfree() is called, sk_rcu can not be in
+        * use and can be mangled.
+        */
+       union {
+               struct rcu_head sk_rcu;
+               freeptr_t       sk_freeptr;
+       };
         netns_tracker           ns_tracker;
         struct xarray           sk_user_frags;
  
@@ -1368,6 +1376,7 @@ struct proto {
  
         struct kmem_cache       *slab;
         unsigned int            obj_size;
+       unsigned int            freeptr_offset;
         unsigned int            ipv6_pinfo_offset;
         slab_flags_t            slab_flags;
         unsigned int            useroffset;     /* Usercopy region offset */
diff --git a/net/core/sock.c b/net/core/sock.c

index a1c8b47b0d5662b882dc0f9257c54ed312c383b4..693e6d80f501ef552aa58928f28b78a578169536 100644 (file)
--- a/net/core/sock.c
+++ b/net/core/sock.c
@@ -4193,13 +4193,17 @@ int proto_register(struct proto *prot, int alloc_slab)
                 return -EINVAL;
         }
         if (alloc_slab) {
-               prot->slab = kmem_cache_create_usercopy(prot->name,
-                                       prot->obj_size, 0,
-                                       SLAB_HWCACHE_ALIGN | SLAB_ACCOUNT |
-                                       prot->slab_flags,
-                                       prot->useroffset, prot->usersize,
-                                       NULL);
+               struct kmem_cache_args args = {
+                       .useroffset     = prot->useroffset,
+                       .usersize       = prot->usersize,
+                       .freeptr_offset = prot->freeptr_offset,
+                       .use_freeptr_offset = !!prot->freeptr_offset,
+               };
  
+               prot->slab = kmem_cache_create(prot->name, prot->obj_size,
+                                       &args,
+                                       SLAB_HWCACHE_ALIGN | SLAB_ACCOUNT |
+                                       prot->slab_flags);
                 if (prot->slab == NULL) {
                         pr_crit("%s: Can't create sock SLAB cache!\n",
                                 prot->name);
diff --git a/net/ipv4/tcp_ipv4.c b/net/ipv4/tcp_ipv4.c

index ffdf52fbf6463b41d7c712f3710b681ecdf6e2d7..0fc8a42921aabac27dcb7c6a9db811498edbb31c 100644 (file)
--- a/net/ipv4/tcp_ipv4.c
+++ b/net/ipv4/tcp_ipv4.c
@@ -3460,6 +3460,8 @@ struct proto tcp_prot = {
         .sysctl_rmem_offset     = offsetof(struct net, ipv4.sysctl_tcp_rmem),
         .max_header             = MAX_TCP_HEADER,
         .obj_size               = sizeof(struct tcp_sock),
+       .freeptr_offset         = offsetof(struct tcp_sock,
+                                          inet_conn.icsk_inet.sk.sk_freeptr),
         .slab_flags             = SLAB_TYPESAFE_BY_RCU,
         .twsk_prot              = &tcp_timewait_sock_ops,
         .rsk_prot               = &tcp_request_sock_ops,
diff --git a/net/ipv6/tcp_ipv6.c b/net/ipv6/tcp_ipv6.c

index 4ae664b05fa9171ed996bf8f3b6e7b2aaa63d5c9..8bf29186c15f99dd2ab63d2b0b3890ed0c68d514 100644 (file)
--- a/net/ipv6/tcp_ipv6.c
+++ b/net/ipv6/tcp_ipv6.c
@@ -2332,6 +2332,8 @@ struct proto tcpv6_prot = {
         .sysctl_rmem_offset     = offsetof(struct net, ipv4.sysctl_tcp_rmem),
         .max_header             = MAX_TCP_HEADER,
         .obj_size               = sizeof(struct tcp6_sock),
+       .freeptr_offset         = offsetof(struct tcp6_sock,
+                                          tcp.inet_conn.icsk_inet.sk.sk_freeptr),
         .ipv6_pinfo_offset = offsetof(struct tcp6_sock, inet6),
         .slab_flags             = SLAB_TYPESAFE_BY_RCU,
         .twsk_prot              = &tcp6_timewait_sock_ops,
author	Eric Dumazet <edumazet@google.com>
	Thu, 29 Jan 2026 15:34:58 +0000 (15:34 +0000)
committer	Jakub Kicinski <kuba@kernel.org>
	Sat, 31 Jan 2026 01:15:51 +0000 (17:15 -0800)
include/net/sock.h		patch \| blob \| blame \| history
net/core/sock.c		patch \| blob \| blame \| history
net/ipv4/tcp_ipv4.c		patch \| blob \| blame \| history
net/ipv6/tcp_ipv6.c		patch \| blob \| blame \| history