]> git.ipfire.org Git - thirdparty/kernel/stable-queue.git/commitdiff
Drop udp-deal-with-race-between-udp-socket-address-change.patch from older trees
authorSasha Levin <sashal@kernel.org>
Sun, 2 Feb 2025 18:49:53 +0000 (13:49 -0500)
committerSasha Levin <sashal@kernel.org>
Sun, 2 Feb 2025 19:53:35 +0000 (14:53 -0500)
Signed-off-by: Sasha Levin <sashal@kernel.org>
queue-5.15/series
queue-5.15/udp-deal-with-race-between-udp-socket-address-change.patch [deleted file]
queue-6.1/series
queue-6.1/udp-deal-with-race-between-udp-socket-address-change.patch [deleted file]
queue-6.6/ipv6-udp-constify-struct-net-parameter-of-socket-loo.patch [deleted file]
queue-6.6/series
queue-6.6/udp-constify-struct-net-parameter-of-socket-lookups.patch [deleted file]
queue-6.6/udp-deal-with-race-between-udp-socket-address-change.patch [deleted file]

index fa6fc978e4fa20e22bb24282327d600f5ae68135..adb8a3b5035cf2aa2a8805aba1091bf1b612ab5e 100644 (file)
@@ -56,9 +56,6 @@ cpupower-fix-tsc-mhz-calculation.patch
 dt-bindings-mfd-bd71815-fix-rsense-and-typos.patch
 leds-netxbig-fix-an-of-node-reference-leak-in-netxbi.patch
 cpufreq-schedutil-fix-superfluous-updates-caused-by-.patch
-ipv6-udp-constify-struct-net-parameter-of-socket-loo.patch
-udp-constify-struct-net-parameter-of-socket-lookups.patch
-udp-deal-with-race-between-udp-socket-address-change.patch
 clk-imx8mp-fix-clkout1-2-support.patch
 team-prevent-adding-a-device-which-is-already-a-team.patch
 regulator-of-implement-the-unwind-path-of-of_regulat.patch
diff --git a/queue-5.15/udp-deal-with-race-between-udp-socket-address-change.patch b/queue-5.15/udp-deal-with-race-between-udp-socket-address-change.patch
deleted file mode 100644 (file)
index 3601cc7..0000000
+++ /dev/null
@@ -1,301 +0,0 @@
-From 176d1b6e5679f1a36776339dbe0b1f280a649446 Mon Sep 17 00:00:00 2001
-From: Sasha Levin <sashal@kernel.org>
-Date: Wed, 18 Dec 2024 17:21:16 +0100
-Subject: udp: Deal with race between UDP socket address change and rehash
-
-From: Stefano Brivio <sbrivio@redhat.com>
-
-[ Upstream commit a502ea6fa94b1f7be72a24bcf9e3f5f6b7e6e90c ]
-
-If a UDP socket changes its local address while it's receiving
-datagrams, as a result of connect(), there is a period during which
-a lookup operation might fail to find it, after the address is changed
-but before the secondary hash (port and address) and the four-tuple
-hash (local and remote ports and addresses) are updated.
-
-Secondary hash chains were introduced by commit 30fff9231fad ("udp:
-bind() optimisation") and, as a result, a rehash operation became
-needed to make a bound socket reachable again after a connect().
-
-This operation was introduced by commit 719f835853a9 ("udp: add
-rehash on connect()") which isn't however a complete fix: the
-socket will be found once the rehashing completes, but not while
-it's pending.
-
-This is noticeable with a socat(1) server in UDP4-LISTEN mode, and a
-client sending datagrams to it. After the server receives the first
-datagram (cf. _xioopen_ipdgram_listen()), it issues a connect() to
-the address of the sender, in order to set up a directed flow.
-
-Now, if the client, running on a different CPU thread, happens to
-send a (subsequent) datagram while the server's socket changes its
-address, but is not rehashed yet, this will result in a failed
-lookup and a port unreachable error delivered to the client, as
-apparent from the following reproducer:
-
-  LEN=$(($(cat /proc/sys/net/core/wmem_default) / 4))
-  dd if=/dev/urandom bs=1 count=${LEN} of=tmp.in
-
-  while :; do
-       taskset -c 1 socat UDP4-LISTEN:1337,null-eof OPEN:tmp.out,create,trunc &
-       sleep 0.1 || sleep 1
-       taskset -c 2 socat OPEN:tmp.in UDP4:localhost:1337,shut-null
-       wait
-  done
-
-where the client will eventually get ECONNREFUSED on a write()
-(typically the second or third one of a given iteration):
-
-  2024/11/13 21:28:23 socat[46901] E write(6, 0x556db2e3c000, 8192): Connection refused
-
-This issue was first observed as a seldom failure in Podman's tests
-checking UDP functionality while using pasta(1) to connect the
-container's network namespace, which leads us to a reproducer with
-the lookup error resulting in an ICMP packet on a tap device:
-
-  LOCAL_ADDR="$(ip -j -4 addr show|jq -rM '.[] | .addr_info[0] | select(.scope == "global").local')"
-
-  while :; do
-       ./pasta --config-net -p pasta.pcap -u 1337 socat UDP4-LISTEN:1337,null-eof OPEN:tmp.out,create,trunc &
-       sleep 0.2 || sleep 1
-       socat OPEN:tmp.in UDP4:${LOCAL_ADDR}:1337,shut-null
-       wait
-       cmp tmp.in tmp.out
-  done
-
-Once this fails:
-
-  tmp.in tmp.out differ: char 8193, line 29
-
-we can finally have a look at what's going on:
-
-  $ tshark -r pasta.pcap
-      1   0.000000           :: ? ff02::16     ICMPv6 110 Multicast Listener Report Message v2
-      2   0.168690 88.198.0.161 ? 88.198.0.164 UDP 8234 60260 ? 1337 Len=8192
-      3   0.168767 88.198.0.161 ? 88.198.0.164 UDP 8234 60260 ? 1337 Len=8192
-      4   0.168806 88.198.0.161 ? 88.198.0.164 UDP 8234 60260 ? 1337 Len=8192
-      5   0.168827 c6:47:05:8d:dc:04 ? Broadcast    ARP 42 Who has 88.198.0.161? Tell 88.198.0.164
-      6   0.168851 9a:55:9a:55:9a:55 ? c6:47:05:8d:dc:04 ARP 42 88.198.0.161 is at 9a:55:9a:55:9a:55
-      7   0.168875 88.198.0.161 ? 88.198.0.164 UDP 8234 60260 ? 1337 Len=8192
-      8   0.168896 88.198.0.164 ? 88.198.0.161 ICMP 590 Destination unreachable (Port unreachable)
-      9   0.168926 88.198.0.161 ? 88.198.0.164 UDP 8234 60260 ? 1337 Len=8192
-     10   0.168959 88.198.0.161 ? 88.198.0.164 UDP 8234 60260 ? 1337 Len=8192
-     11   0.168989 88.198.0.161 ? 88.198.0.164 UDP 4138 60260 ? 1337 Len=4096
-     12   0.169010 88.198.0.161 ? 88.198.0.164 UDP 42 60260 ? 1337 Len=0
-
-On the third datagram received, the network namespace of the container
-initiates an ARP lookup to deliver the ICMP message.
-
-In another variant of this reproducer, starting the client with:
-
-  strace -f pasta --config-net -u 1337 socat UDP4-LISTEN:1337,null-eof OPEN:tmp.out,create,trunc 2>strace.log &
-
-and connecting to the socat server using a loopback address:
-
-  socat OPEN:tmp.in UDP4:localhost:1337,shut-null
-
-we can more clearly observe a sendmmsg() call failing after the
-first datagram is delivered:
-
-  [pid 278012] connect(173, 0x7fff96c95fc0, 16) = 0
-  [...]
-  [pid 278012] recvmmsg(173, 0x7fff96c96020, 1024, MSG_DONTWAIT, NULL) = -1 EAGAIN (Resource temporarily unavailable)
-  [pid 278012] sendmmsg(173, 0x561c5ad0a720, 1, MSG_NOSIGNAL) = 1
-  [...]
-  [pid 278012] sendmmsg(173, 0x561c5ad0a720, 1, MSG_NOSIGNAL) = -1 ECONNREFUSED (Connection refused)
-
-and, somewhat confusingly, after a connect() on the same socket
-succeeded.
-
-Until commit 4cdeeee9252a ("net: udp: prefer listeners bound to an
-address"), the race between receive address change and lookup didn't
-actually cause visible issues, because, once the lookup based on the
-secondary hash chain failed, we would still attempt a lookup based on
-the primary hash (destination port only), and find the socket with the
-outdated secondary hash.
-
-That change, however, dropped port-only lookups altogether, as side
-effect, making the race visible.
-
-To fix this, while avoiding the need to make address changes and
-rehash atomic against lookups, reintroduce primary hash lookups as
-fallback, if lookups based on four-tuple and secondary hashes fail.
-
-To this end, introduce a simplified lookup implementation, which
-doesn't take care of SO_REUSEPORT groups: if we have one, there are
-multiple sockets that would match the four-tuple or secondary hash,
-meaning that we can't run into this race at all.
-
-v2:
-  - instead of synchronising lookup operations against address change
-    plus rehash, reintroduce a simplified version of the original
-    primary hash lookup as fallback
-
-v1:
-  - fix build with CONFIG_IPV6=n: add ifdef around sk_v6_rcv_saddr
-    usage (Kuniyuki Iwashima)
-  - directly use sk_rcv_saddr for IPv4 receive addresses instead of
-    fetching inet_rcv_saddr (Kuniyuki Iwashima)
-  - move inet_update_saddr() to inet_hashtables.h and use that
-    to set IPv4/IPv6 addresses as suitable (Kuniyuki Iwashima)
-  - rebase onto net-next, update commit message accordingly
-
-Reported-by: Ed Santiago <santiago@redhat.com>
-Link: https://github.com/containers/podman/issues/24147
-Analysed-by: David Gibson <david@gibson.dropbear.id.au>
-Fixes: 30fff9231fad ("udp: bind() optimisation")
-Signed-off-by: Stefano Brivio <sbrivio@redhat.com>
-Reviewed-by: Eric Dumazet <edumazet@google.com>
-Reviewed-by: Willem de Bruijn <willemb@google.com>
-Signed-off-by: David S. Miller <davem@davemloft.net>
-Signed-off-by: Sasha Levin <sashal@kernel.org>
----
- net/ipv4/udp.c | 56 ++++++++++++++++++++++++++++++++++++++++++++++++++
- net/ipv6/udp.c | 50 ++++++++++++++++++++++++++++++++++++++++++++
- 2 files changed, 106 insertions(+)
-
-diff --git a/net/ipv4/udp.c b/net/ipv4/udp.c
-index 138fef35e7071..e25ccec527ed0 100644
---- a/net/ipv4/udp.c
-+++ b/net/ipv4/udp.c
-@@ -412,6 +412,49 @@ u32 udp_ehashfn(const struct net *net, const __be32 laddr, const __u16 lport,
-                             udp_ehash_secret + net_hash_mix(net));
- }
-+/**
-+ * udp4_lib_lookup1() - Simplified lookup using primary hash (destination port)
-+ * @net:      Network namespace
-+ * @saddr:    Source address, network order
-+ * @sport:    Source port, network order
-+ * @daddr:    Destination address, network order
-+ * @hnum:     Destination port, host order
-+ * @dif:      Destination interface index
-+ * @sdif:     Destination bridge port index, if relevant
-+ * @udptable: Set of UDP hash tables
-+ *
-+ * Simplified lookup to be used as fallback if no sockets are found due to a
-+ * potential race between (receive) address change, and lookup happening before
-+ * the rehash operation. This function ignores SO_REUSEPORT groups while scoring
-+ * result sockets, because if we have one, we don't need the fallback at all.
-+ *
-+ * Called under rcu_read_lock().
-+ *
-+ * Return: socket with highest matching score if any, NULL if none
-+ */
-+static struct sock *udp4_lib_lookup1(const struct net *net,
-+                                   __be32 saddr, __be16 sport,
-+                                   __be32 daddr, unsigned int hnum,
-+                                   int dif, int sdif,
-+                                   const struct udp_table *udptable)
-+{
-+      unsigned int slot = udp_hashfn(net, hnum, udptable->mask);
-+      struct udp_hslot *hslot = &udptable->hash[slot];
-+      struct sock *sk, *result = NULL;
-+      int score, badness = 0;
-+
-+      sk_for_each_rcu(sk, &hslot->head) {
-+              score = compute_score(sk, net,
-+                                    saddr, sport, daddr, hnum, dif, sdif);
-+              if (score > badness) {
-+                      result = sk;
-+                      badness = score;
-+              }
-+      }
-+
-+      return result;
-+}
-+
- /* called with rcu_read_lock() */
- static struct sock *udp4_lib_lookup2(struct net *net,
-                                    __be32 saddr, __be16 sport,
-@@ -539,6 +582,19 @@ struct sock *__udp4_lib_lookup(struct net *net, __be32 saddr,
-       result = udp4_lib_lookup2(net, saddr, sport,
-                                 htonl(INADDR_ANY), hnum, dif, sdif,
-                                 hslot2, skb);
-+      if (!IS_ERR_OR_NULL(result))
-+              goto done;
-+
-+      /* Primary hash (destination port) lookup as fallback for this race:
-+       *   1. __ip4_datagram_connect() sets sk_rcv_saddr
-+       *   2. lookup (this function): new sk_rcv_saddr, hashes not updated yet
-+       *   3. rehash operation updating _secondary and four-tuple_ hashes
-+       * The primary hash doesn't need an update after 1., so, thanks to this
-+       * further step, 1. and 3. don't need to be atomic against the lookup.
-+       */
-+      result = udp4_lib_lookup1(net, saddr, sport, daddr, hnum, dif, sdif,
-+                                udptable);
-+
- done:
-       if (IS_ERR(result))
-               return NULL;
-diff --git a/net/ipv6/udp.c b/net/ipv6/udp.c
-index c60162ea0aa8a..9a72562716ebb 100644
---- a/net/ipv6/udp.c
-+++ b/net/ipv6/udp.c
-@@ -157,6 +157,49 @@ static int compute_score(struct sock *sk, struct net *net,
-       return score;
- }
-+/**
-+ * udp6_lib_lookup1() - Simplified lookup using primary hash (destination port)
-+ * @net:      Network namespace
-+ * @saddr:    Source address, network order
-+ * @sport:    Source port, network order
-+ * @daddr:    Destination address, network order
-+ * @hnum:     Destination port, host order
-+ * @dif:      Destination interface index
-+ * @sdif:     Destination bridge port index, if relevant
-+ * @udptable: Set of UDP hash tables
-+ *
-+ * Simplified lookup to be used as fallback if no sockets are found due to a
-+ * potential race between (receive) address change, and lookup happening before
-+ * the rehash operation. This function ignores SO_REUSEPORT groups while scoring
-+ * result sockets, because if we have one, we don't need the fallback at all.
-+ *
-+ * Called under rcu_read_lock().
-+ *
-+ * Return: socket with highest matching score if any, NULL if none
-+ */
-+static struct sock *udp6_lib_lookup1(const struct net *net,
-+                                   const struct in6_addr *saddr, __be16 sport,
-+                                   const struct in6_addr *daddr,
-+                                   unsigned int hnum, int dif, int sdif,
-+                                   const struct udp_table *udptable)
-+{
-+      unsigned int slot = udp_hashfn(net, hnum, udptable->mask);
-+      struct udp_hslot *hslot = &udptable->hash[slot];
-+      struct sock *sk, *result = NULL;
-+      int score, badness = 0;
-+
-+      sk_for_each_rcu(sk, &hslot->head) {
-+              score = compute_score(sk, net,
-+                                    saddr, sport, daddr, hnum, dif, sdif);
-+              if (score > badness) {
-+                      result = sk;
-+                      badness = score;
-+              }
-+      }
-+
-+      return result;
-+}
-+
- /* called with rcu_read_lock() */
- static struct sock *udp6_lib_lookup2(struct net *net,
-               const struct in6_addr *saddr, __be16 sport,
-@@ -285,6 +328,13 @@ struct sock *__udp6_lib_lookup(struct net *net,
-       result = udp6_lib_lookup2(net, saddr, sport,
-                                 &in6addr_any, hnum, dif, sdif,
-                                 hslot2, skb);
-+      if (!IS_ERR_OR_NULL(result))
-+              goto done;
-+
-+      /* Cover address change/lookup/rehash race: see __udp4_lib_lookup() */
-+      result = udp6_lib_lookup1(net, saddr, sport, daddr, hnum, dif, sdif,
-+                                udptable);
-+
- done:
-       if (IS_ERR(result))
-               return NULL;
--- 
-2.39.5
-
index b8c82e55df1f0439d2fb979d817e5eeee04e0388..2bb0c34ad1d1e6e496525c8fd6ccc6f8c5c43d18 100644 (file)
@@ -67,9 +67,6 @@ inetpeer-update-inetpeer-timestamp-in-inet_getpeer.patch
 inetpeer-do-not-get-a-refcount-in-inet_getpeer.patch
 pwm-stm32-lp-add-check-for-clk_enable.patch
 cpufreq-schedutil-fix-superfluous-updates-caused-by-.patch
-udp-constify-struct-net-parameter-of-socket-lookups.patch
-ipv6-udp-constify-struct-net-parameter-of-socket-loo.patch
-udp-deal-with-race-between-udp-socket-address-change.patch
 clk-imx8mp-fix-clkout1-2-support.patch
 team-prevent-adding-a-device-which-is-already-a-team.patch
 regulator-of-implement-the-unwind-path-of-of_regulat.patch
diff --git a/queue-6.1/udp-deal-with-race-between-udp-socket-address-change.patch b/queue-6.1/udp-deal-with-race-between-udp-socket-address-change.patch
deleted file mode 100644 (file)
index 6b7ac5e..0000000
+++ /dev/null
@@ -1,301 +0,0 @@
-From 0fd40ef9fdca8dbf4b28a79714526444054f084e Mon Sep 17 00:00:00 2001
-From: Sasha Levin <sashal@kernel.org>
-Date: Wed, 18 Dec 2024 17:21:16 +0100
-Subject: udp: Deal with race between UDP socket address change and rehash
-
-From: Stefano Brivio <sbrivio@redhat.com>
-
-[ Upstream commit a502ea6fa94b1f7be72a24bcf9e3f5f6b7e6e90c ]
-
-If a UDP socket changes its local address while it's receiving
-datagrams, as a result of connect(), there is a period during which
-a lookup operation might fail to find it, after the address is changed
-but before the secondary hash (port and address) and the four-tuple
-hash (local and remote ports and addresses) are updated.
-
-Secondary hash chains were introduced by commit 30fff9231fad ("udp:
-bind() optimisation") and, as a result, a rehash operation became
-needed to make a bound socket reachable again after a connect().
-
-This operation was introduced by commit 719f835853a9 ("udp: add
-rehash on connect()") which isn't however a complete fix: the
-socket will be found once the rehashing completes, but not while
-it's pending.
-
-This is noticeable with a socat(1) server in UDP4-LISTEN mode, and a
-client sending datagrams to it. After the server receives the first
-datagram (cf. _xioopen_ipdgram_listen()), it issues a connect() to
-the address of the sender, in order to set up a directed flow.
-
-Now, if the client, running on a different CPU thread, happens to
-send a (subsequent) datagram while the server's socket changes its
-address, but is not rehashed yet, this will result in a failed
-lookup and a port unreachable error delivered to the client, as
-apparent from the following reproducer:
-
-  LEN=$(($(cat /proc/sys/net/core/wmem_default) / 4))
-  dd if=/dev/urandom bs=1 count=${LEN} of=tmp.in
-
-  while :; do
-       taskset -c 1 socat UDP4-LISTEN:1337,null-eof OPEN:tmp.out,create,trunc &
-       sleep 0.1 || sleep 1
-       taskset -c 2 socat OPEN:tmp.in UDP4:localhost:1337,shut-null
-       wait
-  done
-
-where the client will eventually get ECONNREFUSED on a write()
-(typically the second or third one of a given iteration):
-
-  2024/11/13 21:28:23 socat[46901] E write(6, 0x556db2e3c000, 8192): Connection refused
-
-This issue was first observed as a seldom failure in Podman's tests
-checking UDP functionality while using pasta(1) to connect the
-container's network namespace, which leads us to a reproducer with
-the lookup error resulting in an ICMP packet on a tap device:
-
-  LOCAL_ADDR="$(ip -j -4 addr show|jq -rM '.[] | .addr_info[0] | select(.scope == "global").local')"
-
-  while :; do
-       ./pasta --config-net -p pasta.pcap -u 1337 socat UDP4-LISTEN:1337,null-eof OPEN:tmp.out,create,trunc &
-       sleep 0.2 || sleep 1
-       socat OPEN:tmp.in UDP4:${LOCAL_ADDR}:1337,shut-null
-       wait
-       cmp tmp.in tmp.out
-  done
-
-Once this fails:
-
-  tmp.in tmp.out differ: char 8193, line 29
-
-we can finally have a look at what's going on:
-
-  $ tshark -r pasta.pcap
-      1   0.000000           :: ? ff02::16     ICMPv6 110 Multicast Listener Report Message v2
-      2   0.168690 88.198.0.161 ? 88.198.0.164 UDP 8234 60260 ? 1337 Len=8192
-      3   0.168767 88.198.0.161 ? 88.198.0.164 UDP 8234 60260 ? 1337 Len=8192
-      4   0.168806 88.198.0.161 ? 88.198.0.164 UDP 8234 60260 ? 1337 Len=8192
-      5   0.168827 c6:47:05:8d:dc:04 ? Broadcast    ARP 42 Who has 88.198.0.161? Tell 88.198.0.164
-      6   0.168851 9a:55:9a:55:9a:55 ? c6:47:05:8d:dc:04 ARP 42 88.198.0.161 is at 9a:55:9a:55:9a:55
-      7   0.168875 88.198.0.161 ? 88.198.0.164 UDP 8234 60260 ? 1337 Len=8192
-      8   0.168896 88.198.0.164 ? 88.198.0.161 ICMP 590 Destination unreachable (Port unreachable)
-      9   0.168926 88.198.0.161 ? 88.198.0.164 UDP 8234 60260 ? 1337 Len=8192
-     10   0.168959 88.198.0.161 ? 88.198.0.164 UDP 8234 60260 ? 1337 Len=8192
-     11   0.168989 88.198.0.161 ? 88.198.0.164 UDP 4138 60260 ? 1337 Len=4096
-     12   0.169010 88.198.0.161 ? 88.198.0.164 UDP 42 60260 ? 1337 Len=0
-
-On the third datagram received, the network namespace of the container
-initiates an ARP lookup to deliver the ICMP message.
-
-In another variant of this reproducer, starting the client with:
-
-  strace -f pasta --config-net -u 1337 socat UDP4-LISTEN:1337,null-eof OPEN:tmp.out,create,trunc 2>strace.log &
-
-and connecting to the socat server using a loopback address:
-
-  socat OPEN:tmp.in UDP4:localhost:1337,shut-null
-
-we can more clearly observe a sendmmsg() call failing after the
-first datagram is delivered:
-
-  [pid 278012] connect(173, 0x7fff96c95fc0, 16) = 0
-  [...]
-  [pid 278012] recvmmsg(173, 0x7fff96c96020, 1024, MSG_DONTWAIT, NULL) = -1 EAGAIN (Resource temporarily unavailable)
-  [pid 278012] sendmmsg(173, 0x561c5ad0a720, 1, MSG_NOSIGNAL) = 1
-  [...]
-  [pid 278012] sendmmsg(173, 0x561c5ad0a720, 1, MSG_NOSIGNAL) = -1 ECONNREFUSED (Connection refused)
-
-and, somewhat confusingly, after a connect() on the same socket
-succeeded.
-
-Until commit 4cdeeee9252a ("net: udp: prefer listeners bound to an
-address"), the race between receive address change and lookup didn't
-actually cause visible issues, because, once the lookup based on the
-secondary hash chain failed, we would still attempt a lookup based on
-the primary hash (destination port only), and find the socket with the
-outdated secondary hash.
-
-That change, however, dropped port-only lookups altogether, as side
-effect, making the race visible.
-
-To fix this, while avoiding the need to make address changes and
-rehash atomic against lookups, reintroduce primary hash lookups as
-fallback, if lookups based on four-tuple and secondary hashes fail.
-
-To this end, introduce a simplified lookup implementation, which
-doesn't take care of SO_REUSEPORT groups: if we have one, there are
-multiple sockets that would match the four-tuple or secondary hash,
-meaning that we can't run into this race at all.
-
-v2:
-  - instead of synchronising lookup operations against address change
-    plus rehash, reintroduce a simplified version of the original
-    primary hash lookup as fallback
-
-v1:
-  - fix build with CONFIG_IPV6=n: add ifdef around sk_v6_rcv_saddr
-    usage (Kuniyuki Iwashima)
-  - directly use sk_rcv_saddr for IPv4 receive addresses instead of
-    fetching inet_rcv_saddr (Kuniyuki Iwashima)
-  - move inet_update_saddr() to inet_hashtables.h and use that
-    to set IPv4/IPv6 addresses as suitable (Kuniyuki Iwashima)
-  - rebase onto net-next, update commit message accordingly
-
-Reported-by: Ed Santiago <santiago@redhat.com>
-Link: https://github.com/containers/podman/issues/24147
-Analysed-by: David Gibson <david@gibson.dropbear.id.au>
-Fixes: 30fff9231fad ("udp: bind() optimisation")
-Signed-off-by: Stefano Brivio <sbrivio@redhat.com>
-Reviewed-by: Eric Dumazet <edumazet@google.com>
-Reviewed-by: Willem de Bruijn <willemb@google.com>
-Signed-off-by: David S. Miller <davem@davemloft.net>
-Signed-off-by: Sasha Levin <sashal@kernel.org>
----
- net/ipv4/udp.c | 56 ++++++++++++++++++++++++++++++++++++++++++++++++++
- net/ipv6/udp.c | 50 ++++++++++++++++++++++++++++++++++++++++++++
- 2 files changed, 106 insertions(+)
-
-diff --git a/net/ipv4/udp.c b/net/ipv4/udp.c
-index 3f9c4b74fdc0c..20c3983ab34e9 100644
---- a/net/ipv4/udp.c
-+++ b/net/ipv4/udp.c
-@@ -414,6 +414,49 @@ u32 udp_ehashfn(const struct net *net, const __be32 laddr, const __u16 lport,
-                             udp_ehash_secret + net_hash_mix(net));
- }
-+/**
-+ * udp4_lib_lookup1() - Simplified lookup using primary hash (destination port)
-+ * @net:      Network namespace
-+ * @saddr:    Source address, network order
-+ * @sport:    Source port, network order
-+ * @daddr:    Destination address, network order
-+ * @hnum:     Destination port, host order
-+ * @dif:      Destination interface index
-+ * @sdif:     Destination bridge port index, if relevant
-+ * @udptable: Set of UDP hash tables
-+ *
-+ * Simplified lookup to be used as fallback if no sockets are found due to a
-+ * potential race between (receive) address change, and lookup happening before
-+ * the rehash operation. This function ignores SO_REUSEPORT groups while scoring
-+ * result sockets, because if we have one, we don't need the fallback at all.
-+ *
-+ * Called under rcu_read_lock().
-+ *
-+ * Return: socket with highest matching score if any, NULL if none
-+ */
-+static struct sock *udp4_lib_lookup1(const struct net *net,
-+                                   __be32 saddr, __be16 sport,
-+                                   __be32 daddr, unsigned int hnum,
-+                                   int dif, int sdif,
-+                                   const struct udp_table *udptable)
-+{
-+      unsigned int slot = udp_hashfn(net, hnum, udptable->mask);
-+      struct udp_hslot *hslot = &udptable->hash[slot];
-+      struct sock *sk, *result = NULL;
-+      int score, badness = 0;
-+
-+      sk_for_each_rcu(sk, &hslot->head) {
-+              score = compute_score(sk, net,
-+                                    saddr, sport, daddr, hnum, dif, sdif);
-+              if (score > badness) {
-+                      result = sk;
-+                      badness = score;
-+              }
-+      }
-+
-+      return result;
-+}
-+
- /* called with rcu_read_lock() */
- static struct sock *udp4_lib_lookup2(struct net *net,
-                                    __be32 saddr, __be16 sport,
-@@ -541,6 +584,19 @@ struct sock *__udp4_lib_lookup(struct net *net, __be32 saddr,
-       result = udp4_lib_lookup2(net, saddr, sport,
-                                 htonl(INADDR_ANY), hnum, dif, sdif,
-                                 hslot2, skb);
-+      if (!IS_ERR_OR_NULL(result))
-+              goto done;
-+
-+      /* Primary hash (destination port) lookup as fallback for this race:
-+       *   1. __ip4_datagram_connect() sets sk_rcv_saddr
-+       *   2. lookup (this function): new sk_rcv_saddr, hashes not updated yet
-+       *   3. rehash operation updating _secondary and four-tuple_ hashes
-+       * The primary hash doesn't need an update after 1., so, thanks to this
-+       * further step, 1. and 3. don't need to be atomic against the lookup.
-+       */
-+      result = udp4_lib_lookup1(net, saddr, sport, daddr, hnum, dif, sdif,
-+                                udptable);
-+
- done:
-       if (IS_ERR(result))
-               return NULL;
-diff --git a/net/ipv6/udp.c b/net/ipv6/udp.c
-index f55d08d2096ae..78361e5da8477 100644
---- a/net/ipv6/udp.c
-+++ b/net/ipv6/udp.c
-@@ -160,6 +160,49 @@ static int compute_score(struct sock *sk, struct net *net,
-       return score;
- }
-+/**
-+ * udp6_lib_lookup1() - Simplified lookup using primary hash (destination port)
-+ * @net:      Network namespace
-+ * @saddr:    Source address, network order
-+ * @sport:    Source port, network order
-+ * @daddr:    Destination address, network order
-+ * @hnum:     Destination port, host order
-+ * @dif:      Destination interface index
-+ * @sdif:     Destination bridge port index, if relevant
-+ * @udptable: Set of UDP hash tables
-+ *
-+ * Simplified lookup to be used as fallback if no sockets are found due to a
-+ * potential race between (receive) address change, and lookup happening before
-+ * the rehash operation. This function ignores SO_REUSEPORT groups while scoring
-+ * result sockets, because if we have one, we don't need the fallback at all.
-+ *
-+ * Called under rcu_read_lock().
-+ *
-+ * Return: socket with highest matching score if any, NULL if none
-+ */
-+static struct sock *udp6_lib_lookup1(const struct net *net,
-+                                   const struct in6_addr *saddr, __be16 sport,
-+                                   const struct in6_addr *daddr,
-+                                   unsigned int hnum, int dif, int sdif,
-+                                   const struct udp_table *udptable)
-+{
-+      unsigned int slot = udp_hashfn(net, hnum, udptable->mask);
-+      struct udp_hslot *hslot = &udptable->hash[slot];
-+      struct sock *sk, *result = NULL;
-+      int score, badness = 0;
-+
-+      sk_for_each_rcu(sk, &hslot->head) {
-+              score = compute_score(sk, net,
-+                                    saddr, sport, daddr, hnum, dif, sdif);
-+              if (score > badness) {
-+                      result = sk;
-+                      badness = score;
-+              }
-+      }
-+
-+      return result;
-+}
-+
- /* called with rcu_read_lock() */
- static struct sock *udp6_lib_lookup2(struct net *net,
-               const struct in6_addr *saddr, __be16 sport,
-@@ -288,6 +331,13 @@ struct sock *__udp6_lib_lookup(struct net *net,
-       result = udp6_lib_lookup2(net, saddr, sport,
-                                 &in6addr_any, hnum, dif, sdif,
-                                 hslot2, skb);
-+      if (!IS_ERR_OR_NULL(result))
-+              goto done;
-+
-+      /* Cover address change/lookup/rehash race: see __udp4_lib_lookup() */
-+      result = udp6_lib_lookup1(net, saddr, sport, daddr, hnum, dif, sdif,
-+                                udptable);
-+
- done:
-       if (IS_ERR(result))
-               return NULL;
--- 
-2.39.5
-
diff --git a/queue-6.6/ipv6-udp-constify-struct-net-parameter-of-socket-loo.patch b/queue-6.6/ipv6-udp-constify-struct-net-parameter-of-socket-loo.patch
deleted file mode 100644 (file)
index 9e8361f..0000000
+++ /dev/null
@@ -1,99 +0,0 @@
-From 8d29ccb3f84fea85dbcb5f8c2f01fa2bfd91b9b5 Mon Sep 17 00:00:00 2001
-From: Sasha Levin <sashal@kernel.org>
-Date: Fri, 2 Aug 2024 13:40:29 +0000
-Subject: ipv6: udp: constify 'struct net' parameter of socket lookups
-
-From: Eric Dumazet <edumazet@google.com>
-
-[ Upstream commit 87d973e8ddeeddf1777e6689df86d5d369cbcbb3 ]
-
-Following helpers do not touch their 'struct net' argument.
-
-- udp6_lib_lookup()
-- __udp6_lib_lookup()
-
-Signed-off-by: Eric Dumazet <edumazet@google.com>
-Reviewed-by: Simon Horman <horms@kernel.org>
-Link: https://patch.msgid.link/20240802134029.3748005-6-edumazet@google.com
-Signed-off-by: Jakub Kicinski <kuba@kernel.org>
-Signed-off-by: Sasha Levin <sashal@kernel.org>
----
- include/net/ipv6_stubs.h | 2 +-
- include/net/udp.h        | 4 ++--
- net/ipv6/udp.c           | 8 ++++----
- 3 files changed, 7 insertions(+), 7 deletions(-)
-
-diff --git a/include/net/ipv6_stubs.h b/include/net/ipv6_stubs.h
-index 21da31e1dff5d..705d3fbc79b95 100644
---- a/include/net/ipv6_stubs.h
-+++ b/include/net/ipv6_stubs.h
-@@ -76,7 +76,7 @@ extern const struct ipv6_stub *ipv6_stub __read_mostly;
- struct ipv6_bpf_stub {
-       int (*inet6_bind)(struct sock *sk, struct sockaddr *uaddr, int addr_len,
-                         u32 flags);
--      struct sock *(*udp6_lib_lookup)(struct net *net,
-+      struct sock *(*udp6_lib_lookup)(const struct net *net,
-                                    const struct in6_addr *saddr, __be16 sport,
-                                    const struct in6_addr *daddr, __be16 dport,
-                                    int dif, int sdif, struct udp_table *tbl,
-diff --git a/include/net/udp.h b/include/net/udp.h
-index 488a6d2babccf..471bff463d7db 100644
---- a/include/net/udp.h
-+++ b/include/net/udp.h
-@@ -303,11 +303,11 @@ struct sock *__udp4_lib_lookup(struct net *net, __be32 saddr, __be16 sport,
-                              struct udp_table *tbl, struct sk_buff *skb);
- struct sock *udp4_lib_lookup_skb(const struct sk_buff *skb,
-                                __be16 sport, __be16 dport);
--struct sock *udp6_lib_lookup(struct net *net,
-+struct sock *udp6_lib_lookup(const struct net *net,
-                            const struct in6_addr *saddr, __be16 sport,
-                            const struct in6_addr *daddr, __be16 dport,
-                            int dif);
--struct sock *__udp6_lib_lookup(struct net *net,
-+struct sock *__udp6_lib_lookup(const struct net *net,
-                              const struct in6_addr *saddr, __be16 sport,
-                              const struct in6_addr *daddr, __be16 dport,
-                              int dif, int sdif, struct udp_table *tbl,
-diff --git a/net/ipv6/udp.c b/net/ipv6/udp.c
-index 954afe6ba883e..a67bbb3bde954 100644
---- a/net/ipv6/udp.c
-+++ b/net/ipv6/udp.c
-@@ -117,7 +117,7 @@ void udp_v6_rehash(struct sock *sk)
-       udp_lib_rehash(sk, new_hash);
- }
--static int compute_score(struct sock *sk, struct net *net,
-+static int compute_score(struct sock *sk, const struct net *net,
-                        const struct in6_addr *saddr, __be16 sport,
-                        const struct in6_addr *daddr, unsigned short hnum,
-                        int dif, int sdif)
-@@ -163,7 +163,7 @@ static int compute_score(struct sock *sk, struct net *net,
- }
- /* called with rcu_read_lock() */
--static struct sock *udp6_lib_lookup2(struct net *net,
-+static struct sock *udp6_lib_lookup2(const struct net *net,
-               const struct in6_addr *saddr, __be16 sport,
-               const struct in6_addr *daddr, unsigned int hnum,
-               int dif, int sdif, struct udp_hslot *hslot2,
-@@ -220,7 +220,7 @@ static struct sock *udp6_lib_lookup2(struct net *net,
- }
- /* rcu_read_lock() must be held */
--struct sock *__udp6_lib_lookup(struct net *net,
-+struct sock *__udp6_lib_lookup(const struct net *net,
-                              const struct in6_addr *saddr, __be16 sport,
-                              const struct in6_addr *daddr, __be16 dport,
-                              int dif, int sdif, struct udp_table *udptable,
-@@ -303,7 +303,7 @@ struct sock *udp6_lib_lookup_skb(const struct sk_buff *skb,
-  * Does increment socket refcount.
-  */
- #if IS_ENABLED(CONFIG_NF_TPROXY_IPV6) || IS_ENABLED(CONFIG_NF_SOCKET_IPV6)
--struct sock *udp6_lib_lookup(struct net *net, const struct in6_addr *saddr, __be16 sport,
-+struct sock *udp6_lib_lookup(const struct net *net, const struct in6_addr *saddr, __be16 sport,
-                            const struct in6_addr *daddr, __be16 dport, int dif)
- {
-       struct sock *sk;
--- 
-2.39.5
-
index f5a38ddf8fd021a6474d993170885673540a19ae..68c31489b58a85b7fb8cba17c521ef5a06e16481 100644 (file)
@@ -89,9 +89,6 @@ gpio-pca953x-fully-convert-to-device-managed-resourc.patch
 gpio-pca953x-log-an-error-when-failing-to-get-the-re.patch
 cpufreq-qcom-fix-qcom_cpufreq_hw_recalc_rate-to-quer.patch
 cpufreq-qcom-implement-clk_ops-determine_rate-for-qc.patch
-ipv6-udp-constify-struct-net-parameter-of-socket-loo.patch
-udp-constify-struct-net-parameter-of-socket-lookups.patch
-udp-deal-with-race-between-udp-socket-address-change.patch
 clk-imx8mp-fix-clkout1-2-support.patch
 team-prevent-adding-a-device-which-is-already-a-team.patch
 dt-bindings-clock-sunxi-export-pll_video_2x-and-pll_.patch
diff --git a/queue-6.6/udp-constify-struct-net-parameter-of-socket-lookups.patch b/queue-6.6/udp-constify-struct-net-parameter-of-socket-lookups.patch
deleted file mode 100644 (file)
index d67a26c..0000000
+++ /dev/null
@@ -1,104 +0,0 @@
-From ab43f971dcd74cc99a84d546a638ad6d14866816 Mon Sep 17 00:00:00 2001
-From: Sasha Levin <sashal@kernel.org>
-Date: Fri, 2 Aug 2024 13:40:27 +0000
-Subject: udp: constify 'struct net' parameter of socket lookups
-
-From: Eric Dumazet <edumazet@google.com>
-
-[ Upstream commit b9abcbb1239cd782f76532397a7c45458de9a73e ]
-
-Following helpers do not touch their 'struct net' argument.
-
-- udp_sk_bound_dev_eq()
-- udp4_lib_lookup()
-- __udp4_lib_lookup()
-
-Signed-off-by: Eric Dumazet <edumazet@google.com>
-Reviewed-by: Simon Horman <horms@kernel.org>
-Link: https://patch.msgid.link/20240802134029.3748005-4-edumazet@google.com
-Signed-off-by: Jakub Kicinski <kuba@kernel.org>
-Signed-off-by: Sasha Levin <sashal@kernel.org>
----
- include/net/udp.h | 10 ++++++----
- net/ipv4/udp.c    |  8 ++++----
- 2 files changed, 10 insertions(+), 8 deletions(-)
-
-diff --git a/include/net/udp.h b/include/net/udp.h
-index 471bff463d7db..92f7ed547abc7 100644
---- a/include/net/udp.h
-+++ b/include/net/udp.h
-@@ -79,7 +79,8 @@ struct udp_table {
- extern struct udp_table udp_table;
- void udp_table_init(struct udp_table *, const char *);
- static inline struct udp_hslot *udp_hashslot(struct udp_table *table,
--                                           struct net *net, unsigned int num)
-+                                           const struct net *net,
-+                                           unsigned int num)
- {
-       return &table->hash[udp_hashfn(net, num, table->mask)];
- }
-@@ -245,7 +246,7 @@ static inline int udp_rqueue_get(struct sock *sk)
-       return sk_rmem_alloc_get(sk) - READ_ONCE(udp_sk(sk)->forward_deficit);
- }
--static inline bool udp_sk_bound_dev_eq(struct net *net, int bound_dev_if,
-+static inline bool udp_sk_bound_dev_eq(const struct net *net, int bound_dev_if,
-                                      int dif, int sdif)
- {
- #if IS_ENABLED(CONFIG_NET_L3_MASTER_DEV)
-@@ -296,9 +297,10 @@ int udp_lib_getsockopt(struct sock *sk, int level, int optname,
- int udp_lib_setsockopt(struct sock *sk, int level, int optname,
-                      sockptr_t optval, unsigned int optlen,
-                      int (*push_pending_frames)(struct sock *));
--struct sock *udp4_lib_lookup(struct net *net, __be32 saddr, __be16 sport,
-+struct sock *udp4_lib_lookup(const struct net *net, __be32 saddr, __be16 sport,
-                            __be32 daddr, __be16 dport, int dif);
--struct sock *__udp4_lib_lookup(struct net *net, __be32 saddr, __be16 sport,
-+struct sock *__udp4_lib_lookup(const struct net *net, __be32 saddr,
-+                             __be16 sport,
-                              __be32 daddr, __be16 dport, int dif, int sdif,
-                              struct udp_table *tbl, struct sk_buff *skb);
- struct sock *udp4_lib_lookup_skb(const struct sk_buff *skb,
-diff --git a/net/ipv4/udp.c b/net/ipv4/udp.c
-index 2e4e535603948..7bb0587c78874 100644
---- a/net/ipv4/udp.c
-+++ b/net/ipv4/udp.c
-@@ -365,7 +365,7 @@ int udp_v4_get_port(struct sock *sk, unsigned short snum)
-       return udp_lib_get_port(sk, snum, hash2_nulladdr);
- }
--static int compute_score(struct sock *sk, struct net *net,
-+static int compute_score(struct sock *sk, const struct net *net,
-                        __be32 saddr, __be16 sport,
-                        __be32 daddr, unsigned short hnum,
-                        int dif, int sdif)
-@@ -422,7 +422,7 @@ u32 udp_ehashfn(const struct net *net, const __be32 laddr, const __u16 lport,
- }
- /* called with rcu_read_lock() */
--static struct sock *udp4_lib_lookup2(struct net *net,
-+static struct sock *udp4_lib_lookup2(const struct net *net,
-                                    __be32 saddr, __be16 sport,
-                                    __be32 daddr, unsigned int hnum,
-                                    int dif, int sdif,
-@@ -482,7 +482,7 @@ static struct sock *udp4_lib_lookup2(struct net *net,
- /* UDP is nearly always wildcards out the wazoo, it makes no sense to try
-  * harder than this. -DaveM
-  */
--struct sock *__udp4_lib_lookup(struct net *net, __be32 saddr,
-+struct sock *__udp4_lib_lookup(const struct net *net, __be32 saddr,
-               __be16 sport, __be32 daddr, __be16 dport, int dif,
-               int sdif, struct udp_table *udptable, struct sk_buff *skb)
- {
-@@ -563,7 +563,7 @@ struct sock *udp4_lib_lookup_skb(const struct sk_buff *skb,
-  * Does increment socket refcount.
-  */
- #if IS_ENABLED(CONFIG_NF_TPROXY_IPV4) || IS_ENABLED(CONFIG_NF_SOCKET_IPV4)
--struct sock *udp4_lib_lookup(struct net *net, __be32 saddr, __be16 sport,
-+struct sock *udp4_lib_lookup(const struct net *net, __be32 saddr, __be16 sport,
-                            __be32 daddr, __be16 dport, int dif)
- {
-       struct sock *sk;
--- 
-2.39.5
-
diff --git a/queue-6.6/udp-deal-with-race-between-udp-socket-address-change.patch b/queue-6.6/udp-deal-with-race-between-udp-socket-address-change.patch
deleted file mode 100644 (file)
index e87ed81..0000000
+++ /dev/null
@@ -1,301 +0,0 @@
-From 9d7d54c6596f7510b5c28b803f7f99967b9ca9e1 Mon Sep 17 00:00:00 2001
-From: Sasha Levin <sashal@kernel.org>
-Date: Wed, 18 Dec 2024 17:21:16 +0100
-Subject: udp: Deal with race between UDP socket address change and rehash
-
-From: Stefano Brivio <sbrivio@redhat.com>
-
-[ Upstream commit a502ea6fa94b1f7be72a24bcf9e3f5f6b7e6e90c ]
-
-If a UDP socket changes its local address while it's receiving
-datagrams, as a result of connect(), there is a period during which
-a lookup operation might fail to find it, after the address is changed
-but before the secondary hash (port and address) and the four-tuple
-hash (local and remote ports and addresses) are updated.
-
-Secondary hash chains were introduced by commit 30fff9231fad ("udp:
-bind() optimisation") and, as a result, a rehash operation became
-needed to make a bound socket reachable again after a connect().
-
-This operation was introduced by commit 719f835853a9 ("udp: add
-rehash on connect()") which isn't however a complete fix: the
-socket will be found once the rehashing completes, but not while
-it's pending.
-
-This is noticeable with a socat(1) server in UDP4-LISTEN mode, and a
-client sending datagrams to it. After the server receives the first
-datagram (cf. _xioopen_ipdgram_listen()), it issues a connect() to
-the address of the sender, in order to set up a directed flow.
-
-Now, if the client, running on a different CPU thread, happens to
-send a (subsequent) datagram while the server's socket changes its
-address, but is not rehashed yet, this will result in a failed
-lookup and a port unreachable error delivered to the client, as
-apparent from the following reproducer:
-
-  LEN=$(($(cat /proc/sys/net/core/wmem_default) / 4))
-  dd if=/dev/urandom bs=1 count=${LEN} of=tmp.in
-
-  while :; do
-       taskset -c 1 socat UDP4-LISTEN:1337,null-eof OPEN:tmp.out,create,trunc &
-       sleep 0.1 || sleep 1
-       taskset -c 2 socat OPEN:tmp.in UDP4:localhost:1337,shut-null
-       wait
-  done
-
-where the client will eventually get ECONNREFUSED on a write()
-(typically the second or third one of a given iteration):
-
-  2024/11/13 21:28:23 socat[46901] E write(6, 0x556db2e3c000, 8192): Connection refused
-
-This issue was first observed as a seldom failure in Podman's tests
-checking UDP functionality while using pasta(1) to connect the
-container's network namespace, which leads us to a reproducer with
-the lookup error resulting in an ICMP packet on a tap device:
-
-  LOCAL_ADDR="$(ip -j -4 addr show|jq -rM '.[] | .addr_info[0] | select(.scope == "global").local')"
-
-  while :; do
-       ./pasta --config-net -p pasta.pcap -u 1337 socat UDP4-LISTEN:1337,null-eof OPEN:tmp.out,create,trunc &
-       sleep 0.2 || sleep 1
-       socat OPEN:tmp.in UDP4:${LOCAL_ADDR}:1337,shut-null
-       wait
-       cmp tmp.in tmp.out
-  done
-
-Once this fails:
-
-  tmp.in tmp.out differ: char 8193, line 29
-
-we can finally have a look at what's going on:
-
-  $ tshark -r pasta.pcap
-      1   0.000000           :: ? ff02::16     ICMPv6 110 Multicast Listener Report Message v2
-      2   0.168690 88.198.0.161 ? 88.198.0.164 UDP 8234 60260 ? 1337 Len=8192
-      3   0.168767 88.198.0.161 ? 88.198.0.164 UDP 8234 60260 ? 1337 Len=8192
-      4   0.168806 88.198.0.161 ? 88.198.0.164 UDP 8234 60260 ? 1337 Len=8192
-      5   0.168827 c6:47:05:8d:dc:04 ? Broadcast    ARP 42 Who has 88.198.0.161? Tell 88.198.0.164
-      6   0.168851 9a:55:9a:55:9a:55 ? c6:47:05:8d:dc:04 ARP 42 88.198.0.161 is at 9a:55:9a:55:9a:55
-      7   0.168875 88.198.0.161 ? 88.198.0.164 UDP 8234 60260 ? 1337 Len=8192
-      8   0.168896 88.198.0.164 ? 88.198.0.161 ICMP 590 Destination unreachable (Port unreachable)
-      9   0.168926 88.198.0.161 ? 88.198.0.164 UDP 8234 60260 ? 1337 Len=8192
-     10   0.168959 88.198.0.161 ? 88.198.0.164 UDP 8234 60260 ? 1337 Len=8192
-     11   0.168989 88.198.0.161 ? 88.198.0.164 UDP 4138 60260 ? 1337 Len=4096
-     12   0.169010 88.198.0.161 ? 88.198.0.164 UDP 42 60260 ? 1337 Len=0
-
-On the third datagram received, the network namespace of the container
-initiates an ARP lookup to deliver the ICMP message.
-
-In another variant of this reproducer, starting the client with:
-
-  strace -f pasta --config-net -u 1337 socat UDP4-LISTEN:1337,null-eof OPEN:tmp.out,create,trunc 2>strace.log &
-
-and connecting to the socat server using a loopback address:
-
-  socat OPEN:tmp.in UDP4:localhost:1337,shut-null
-
-we can more clearly observe a sendmmsg() call failing after the
-first datagram is delivered:
-
-  [pid 278012] connect(173, 0x7fff96c95fc0, 16) = 0
-  [...]
-  [pid 278012] recvmmsg(173, 0x7fff96c96020, 1024, MSG_DONTWAIT, NULL) = -1 EAGAIN (Resource temporarily unavailable)
-  [pid 278012] sendmmsg(173, 0x561c5ad0a720, 1, MSG_NOSIGNAL) = 1
-  [...]
-  [pid 278012] sendmmsg(173, 0x561c5ad0a720, 1, MSG_NOSIGNAL) = -1 ECONNREFUSED (Connection refused)
-
-and, somewhat confusingly, after a connect() on the same socket
-succeeded.
-
-Until commit 4cdeeee9252a ("net: udp: prefer listeners bound to an
-address"), the race between receive address change and lookup didn't
-actually cause visible issues, because, once the lookup based on the
-secondary hash chain failed, we would still attempt a lookup based on
-the primary hash (destination port only), and find the socket with the
-outdated secondary hash.
-
-That change, however, dropped port-only lookups altogether, as side
-effect, making the race visible.
-
-To fix this, while avoiding the need to make address changes and
-rehash atomic against lookups, reintroduce primary hash lookups as
-fallback, if lookups based on four-tuple and secondary hashes fail.
-
-To this end, introduce a simplified lookup implementation, which
-doesn't take care of SO_REUSEPORT groups: if we have one, there are
-multiple sockets that would match the four-tuple or secondary hash,
-meaning that we can't run into this race at all.
-
-v2:
-  - instead of synchronising lookup operations against address change
-    plus rehash, reintroduce a simplified version of the original
-    primary hash lookup as fallback
-
-v1:
-  - fix build with CONFIG_IPV6=n: add ifdef around sk_v6_rcv_saddr
-    usage (Kuniyuki Iwashima)
-  - directly use sk_rcv_saddr for IPv4 receive addresses instead of
-    fetching inet_rcv_saddr (Kuniyuki Iwashima)
-  - move inet_update_saddr() to inet_hashtables.h and use that
-    to set IPv4/IPv6 addresses as suitable (Kuniyuki Iwashima)
-  - rebase onto net-next, update commit message accordingly
-
-Reported-by: Ed Santiago <santiago@redhat.com>
-Link: https://github.com/containers/podman/issues/24147
-Analysed-by: David Gibson <david@gibson.dropbear.id.au>
-Fixes: 30fff9231fad ("udp: bind() optimisation")
-Signed-off-by: Stefano Brivio <sbrivio@redhat.com>
-Reviewed-by: Eric Dumazet <edumazet@google.com>
-Reviewed-by: Willem de Bruijn <willemb@google.com>
-Signed-off-by: David S. Miller <davem@davemloft.net>
-Signed-off-by: Sasha Levin <sashal@kernel.org>
----
- net/ipv4/udp.c | 56 ++++++++++++++++++++++++++++++++++++++++++++++++++
- net/ipv6/udp.c | 50 ++++++++++++++++++++++++++++++++++++++++++++
- 2 files changed, 106 insertions(+)
-
-diff --git a/net/ipv4/udp.c b/net/ipv4/udp.c
-index 2e4e535603948..fd379a973a9eb 100644
---- a/net/ipv4/udp.c
-+++ b/net/ipv4/udp.c
-@@ -421,6 +421,49 @@ u32 udp_ehashfn(const struct net *net, const __be32 laddr, const __u16 lport,
-                             udp_ehash_secret + net_hash_mix(net));
- }
-+/**
-+ * udp4_lib_lookup1() - Simplified lookup using primary hash (destination port)
-+ * @net:      Network namespace
-+ * @saddr:    Source address, network order
-+ * @sport:    Source port, network order
-+ * @daddr:    Destination address, network order
-+ * @hnum:     Destination port, host order
-+ * @dif:      Destination interface index
-+ * @sdif:     Destination bridge port index, if relevant
-+ * @udptable: Set of UDP hash tables
-+ *
-+ * Simplified lookup to be used as fallback if no sockets are found due to a
-+ * potential race between (receive) address change, and lookup happening before
-+ * the rehash operation. This function ignores SO_REUSEPORT groups while scoring
-+ * result sockets, because if we have one, we don't need the fallback at all.
-+ *
-+ * Called under rcu_read_lock().
-+ *
-+ * Return: socket with highest matching score if any, NULL if none
-+ */
-+static struct sock *udp4_lib_lookup1(const struct net *net,
-+                                   __be32 saddr, __be16 sport,
-+                                   __be32 daddr, unsigned int hnum,
-+                                   int dif, int sdif,
-+                                   const struct udp_table *udptable)
-+{
-+      unsigned int slot = udp_hashfn(net, hnum, udptable->mask);
-+      struct udp_hslot *hslot = &udptable->hash[slot];
-+      struct sock *sk, *result = NULL;
-+      int score, badness = 0;
-+
-+      sk_for_each_rcu(sk, &hslot->head) {
-+              score = compute_score(sk, net,
-+                                    saddr, sport, daddr, hnum, dif, sdif);
-+              if (score > badness) {
-+                      result = sk;
-+                      badness = score;
-+              }
-+      }
-+
-+      return result;
-+}
-+
- /* called with rcu_read_lock() */
- static struct sock *udp4_lib_lookup2(struct net *net,
-                                    __be32 saddr, __be16 sport,
-@@ -526,6 +569,19 @@ struct sock *__udp4_lib_lookup(struct net *net, __be32 saddr,
-       result = udp4_lib_lookup2(net, saddr, sport,
-                                 htonl(INADDR_ANY), hnum, dif, sdif,
-                                 hslot2, skb);
-+      if (!IS_ERR_OR_NULL(result))
-+              goto done;
-+
-+      /* Primary hash (destination port) lookup as fallback for this race:
-+       *   1. __ip4_datagram_connect() sets sk_rcv_saddr
-+       *   2. lookup (this function): new sk_rcv_saddr, hashes not updated yet
-+       *   3. rehash operation updating _secondary and four-tuple_ hashes
-+       * The primary hash doesn't need an update after 1., so, thanks to this
-+       * further step, 1. and 3. don't need to be atomic against the lookup.
-+       */
-+      result = udp4_lib_lookup1(net, saddr, sport, daddr, hnum, dif, sdif,
-+                                udptable);
-+
- done:
-       if (IS_ERR(result))
-               return NULL;
-diff --git a/net/ipv6/udp.c b/net/ipv6/udp.c
-index 954afe6ba883e..b0d9636bf330f 100644
---- a/net/ipv6/udp.c
-+++ b/net/ipv6/udp.c
-@@ -162,6 +162,49 @@ static int compute_score(struct sock *sk, struct net *net,
-       return score;
- }
-+/**
-+ * udp6_lib_lookup1() - Simplified lookup using primary hash (destination port)
-+ * @net:      Network namespace
-+ * @saddr:    Source address, network order
-+ * @sport:    Source port, network order
-+ * @daddr:    Destination address, network order
-+ * @hnum:     Destination port, host order
-+ * @dif:      Destination interface index
-+ * @sdif:     Destination bridge port index, if relevant
-+ * @udptable: Set of UDP hash tables
-+ *
-+ * Simplified lookup to be used as fallback if no sockets are found due to a
-+ * potential race between (receive) address change, and lookup happening before
-+ * the rehash operation. This function ignores SO_REUSEPORT groups while scoring
-+ * result sockets, because if we have one, we don't need the fallback at all.
-+ *
-+ * Called under rcu_read_lock().
-+ *
-+ * Return: socket with highest matching score if any, NULL if none
-+ */
-+static struct sock *udp6_lib_lookup1(const struct net *net,
-+                                   const struct in6_addr *saddr, __be16 sport,
-+                                   const struct in6_addr *daddr,
-+                                   unsigned int hnum, int dif, int sdif,
-+                                   const struct udp_table *udptable)
-+{
-+      unsigned int slot = udp_hashfn(net, hnum, udptable->mask);
-+      struct udp_hslot *hslot = &udptable->hash[slot];
-+      struct sock *sk, *result = NULL;
-+      int score, badness = 0;
-+
-+      sk_for_each_rcu(sk, &hslot->head) {
-+              score = compute_score(sk, net,
-+                                    saddr, sport, daddr, hnum, dif, sdif);
-+              if (score > badness) {
-+                      result = sk;
-+                      badness = score;
-+              }
-+      }
-+
-+      return result;
-+}
-+
- /* called with rcu_read_lock() */
- static struct sock *udp6_lib_lookup2(struct net *net,
-               const struct in6_addr *saddr, __be16 sport,
-@@ -266,6 +309,13 @@ struct sock *__udp6_lib_lookup(struct net *net,
-       result = udp6_lib_lookup2(net, saddr, sport,
-                                 &in6addr_any, hnum, dif, sdif,
-                                 hslot2, skb);
-+      if (!IS_ERR_OR_NULL(result))
-+              goto done;
-+
-+      /* Cover address change/lookup/rehash race: see __udp4_lib_lookup() */
-+      result = udp6_lib_lookup1(net, saddr, sport, daddr, hnum, dif, sdif,
-+                                udptable);
-+
- done:
-       if (IS_ERR(result))
-               return NULL;
--- 
-2.39.5
-