netfilter: flowtable: fix inline vlan encapsulation in xmit path

author Pablo Neira Ayuso <pablo@netfilter.org>

Thu, 30 Apr 2026 14:49:51 +0000 (16:49 +0200)

committer Pablo Neira Ayuso <pablo@netfilter.org>

Thu, 30 Apr 2026 23:23:47 +0000 (01:23 +0200)
author Pablo Neira Ayuso <pablo@netfilter.org>
Thu, 30 Apr 2026 14:49:51 +0000 (16:49 +0200)
committer Pablo Neira Ayuso <pablo@netfilter.org>
Thu, 30 Apr 2026 23:23:47 +0000 (01:23 +0200)
diff --git a/net/netfilter/nf_flow_table_ip.c b/net/netfilter/nf_flow_table_ip.c

index 8d5fb7e940a173b1222304b6173df3f64494b511..0ce3c209050ce3e6f45dfdf1d1c02f63771c6b8f 100644 (file)
--- a/net/netfilter/nf_flow_table_ip.c
+++ b/net/netfilter/nf_flow_table_ip.c
@@ -462,32 +462,6 @@ static void nf_flow_encap_pop(struct nf_flowtable_ctx *ctx,
                 nf_flow_ip_tunnel_pop(ctx, skb);
  }
  
-struct nf_flow_xmit {
-       const void              *dest;
-       const void              *source;
-       struct net_device       *outdev;
-};
-
-static unsigned int nf_flow_queue_xmit(struct net *net, struct sk_buff *skb,
-                                      struct nf_flow_xmit *xmit)
-{
-       struct net_device *dev = xmit->outdev;
-       unsigned int hh_len = LL_RESERVED_SPACE(dev);
-
-       if (unlikely(skb_headroom(skb) < hh_len && dev->header_ops)) {
-               skb = skb_expand_head(skb, hh_len);
-               if (!skb)
-                       return NF_STOLEN;
-       }
-
-       skb->dev = dev;
-       dev_hard_header(skb, dev, ntohs(skb->protocol),
-                       xmit->dest, xmit->source, skb->len);
-       dev_queue_xmit(skb);
-
-       return NF_STOLEN;
-}
-
  static struct flow_offload_tuple_rhash *
  nf_flow_offload_lookup(struct nf_flowtable_ctx *ctx,
                        struct nf_flowtable *flow_table, struct sk_buff *skb)
@@ -553,6 +527,32 @@ static int nf_flow_offload_forward(struct nf_flowtable_ctx *ctx,
         return 1;
  }
  
+/* Similar to skb_vlan_push. */
+static int nf_flow_vlan_push(struct sk_buff *skb, __be16 proto, u16 id,
+                            u32 needed_headroom)
+{
+       if (skb_vlan_tag_present(skb)) {
+               struct vlan_hdr *vhdr;
+
+               if (skb_cow_head(skb, needed_headroom + VLAN_HLEN))
+                       return -1;
+
+               __skb_push(skb, VLAN_HLEN);
+               if (skb_mac_header_was_set(skb))
+                       skb->mac_header -= VLAN_HLEN;
+
+               vhdr = (struct vlan_hdr *)skb->data;
+               skb->network_header -= VLAN_HLEN;
+               vhdr->h_vlan_TCI = htons(skb_vlan_tag_get(skb));
+               vhdr->h_vlan_encapsulated_proto = skb->protocol;
+               skb->protocol = skb->vlan_proto;
+               skb_postpush_rcsum(skb, skb->data, VLAN_HLEN);
+       }
+       __vlan_hwaccel_put_tag(skb, proto, id);
+
+       return 0;
+}
+
  static int nf_flow_pppoe_push(struct sk_buff *skb, u16 id)
  {
         int data_len = skb->len + sizeof(__be16);
@@ -739,17 +739,19 @@ static int nf_flow_tunnel_v6_push(struct net *net, struct sk_buff *skb,
  }
  
  static int nf_flow_encap_push(struct sk_buff *skb,
-                             struct flow_offload_tuple *tuple)
+                             struct flow_offload_tuple *tuple,
+                             struct net_device *outdev)
  {
+       u32 needed_headroom = LL_RESERVED_SPACE(outdev);
         int i;
  
-       for (i = 0; i < tuple->encap_num; i++) {
+       for (i = tuple->encap_num - 1; i >= 0; i--) {
                 switch (tuple->encap[i].proto) {
                 case htons(ETH_P_8021Q):
                 case htons(ETH_P_8021AD):
-                       skb_reset_mac_header(skb);
-                       if (skb_vlan_push(skb, tuple->encap[i].proto,
-                                         tuple->encap[i].id) < 0)
+                       if (nf_flow_vlan_push(skb, tuple->encap[i].proto,
+                                             tuple->encap[i].id,
+                                             needed_headroom) < 0)
                                 return -1;
                         break;
                 case htons(ETH_P_PPP_SES):
@@ -762,6 +764,44 @@ static int nf_flow_encap_push(struct sk_buff *skb,
         return 0;
  }
  
+struct nf_flow_xmit {
+       const void              *dest;
+       const void              *source;
+       struct net_device       *outdev;
+       struct flow_offload_tuple *tuple;
+};
+
+static void __nf_flow_queue_xmit(struct net *net, struct sk_buff *skb,
+                                struct nf_flow_xmit *xmit)
+{
+       struct net_device *dev = xmit->outdev;
+       unsigned int hh_len = LL_RESERVED_SPACE(dev);
+
+       if (unlikely(skb_headroom(skb) < hh_len && dev->header_ops)) {
+               skb = skb_expand_head(skb, hh_len);
+               if (!skb)
+                       return;
+       }
+
+       skb->dev = dev;
+       dev_hard_header(skb, dev, ntohs(skb->protocol),
+                       xmit->dest, xmit->source, skb->len);
+       dev_queue_xmit(skb);
+}
+
+static unsigned int nf_flow_queue_xmit(struct net *net, struct sk_buff *skb,
+                                      struct nf_flow_xmit *xmit)
+{
+       if (xmit->tuple->encap_num) {
+               if (nf_flow_encap_push(skb, xmit->tuple, xmit->outdev) < 0)
+                       return NF_DROP;
+       }
+
+       __nf_flow_queue_xmit(net, skb, xmit);
+
+       return NF_STOLEN;
+}
+
  unsigned int
  nf_flow_offload_ip_hook(void *priv, struct sk_buff *skb,
                         const struct nf_hook_state *state)
@@ -806,9 +846,6 @@ nf_flow_offload_ip_hook(void *priv, struct sk_buff *skb,
         if (nf_flow_tunnel_v4_push(state->net, skb, other_tuple, &ip_daddr) < 0)
                 return NF_DROP;
  
-       if (nf_flow_encap_push(skb, other_tuple) < 0)
-               return NF_DROP;
-
         switch (tuplehash->tuple.xmit_type) {
         case FLOW_OFFLOAD_XMIT_NEIGH:
                 rt = dst_rtable(tuplehash->tuple.dst_cache);
@@ -838,6 +875,7 @@ nf_flow_offload_ip_hook(void *priv, struct sk_buff *skb,
                 WARN_ON_ONCE(1);
                 return NF_DROP;
         }
+       xmit.tuple = other_tuple;
  
         return nf_flow_queue_xmit(state->net, skb, &xmit);
  }
@@ -1128,9 +1166,6 @@ nf_flow_offload_ipv6_hook(void *priv, struct sk_buff *skb,
                                    &ip6_daddr, encap_limit) < 0)
                 return NF_DROP;
  
-       if (nf_flow_encap_push(skb, other_tuple) < 0)
-               return NF_DROP;
-
         switch (tuplehash->tuple.xmit_type) {
         case FLOW_OFFLOAD_XMIT_NEIGH:
                 rt = dst_rt6_info(tuplehash->tuple.dst_cache);
@@ -1160,6 +1195,7 @@ nf_flow_offload_ipv6_hook(void *priv, struct sk_buff *skb,
                 WARN_ON_ONCE(1);
                 return NF_DROP;
         }
+       xmit.tuple = other_tuple;
  
         return nf_flow_queue_xmit(state->net, skb, &xmit);
  }
author	Pablo Neira Ayuso <pablo@netfilter.org>
	Thu, 30 Apr 2026 14:49:51 +0000 (16:49 +0200)
committer	Pablo Neira Ayuso <pablo@netfilter.org>
	Thu, 30 Apr 2026 23:23:47 +0000 (01:23 +0200)