]> git.ipfire.org Git - thirdparty/linux.git/commitdiff
net: bcmgenet: Use weighted round-robin TX DMA arbitration
authorOvidiu Panait <ovidiu.panait.rb@renesas.com>
Wed, 10 Jun 2026 08:52:38 +0000 (08:52 +0000)
committerJakub Kicinski <kuba@kernel.org>
Sat, 13 Jun 2026 21:49:10 +0000 (14:49 -0700)
Under heavy network traffic, we observed sporadic TX queue timeouts on the
Raspberry Pi 4. The timeouts can be reproduced by stress testing the TX
path with multiple concurrent iperf UDP streams:

    iperf3 -c <ip> -u -b0 -P16 -t60
    NETDEV WATCHDOG: CPU: 0: transmit queue 0 timed out 2044 ms
    NETDEV WATCHDOG: CPU: 3: transmit queue 0 timed out 2004 ms

Investigation showed that the timeouts are caused by the priority-based
arbiter. Under heavy load the highest priority queue starves the lower
priority ones, causing timeouts. The TX strict priority arbiter is not
suitable for the default use case where all the traffic gets spread
across all the TX queues.

Therefore, to fix this, switch the TX DMA arbiter to Weighted Round-Robin,
which services all queues, so they do not stall. The weights were chosen
to follow the existing priority scheme: q0 gets the smallest weight, while
q1-4 get the bulk of the TX bandwidth.

Fixes: 1c1008c793fa ("net: bcmgenet: add main driver file")
Signed-off-by: Ovidiu Panait <ovidiu.panait.rb@renesas.com>
Link: https://patch.msgid.link/20260610085238.56300-1-ovidiu.panait.rb@renesas.com
Signed-off-by: Jakub Kicinski <kuba@kernel.org>
drivers/net/ethernet/broadcom/genet/bcmgenet.c

index 7c11cf9167620c9e2b543294db8004c717adeb4a..ad08c67269be5413fdbbe5ac6b22b45bc8816260 100644 (file)
@@ -40,9 +40,8 @@
 
 #include "bcmgenet.h"
 
-/* Default highest priority queue for multi queue support */
-#define GENET_Q1_PRIORITY      0
-#define GENET_Q0_PRIORITY      1
+#define GENET_Q0_WEIGHT                1
+#define GENET_Q1_WEIGHT                4
 
 #define GENET_Q0_RX_BD_CNT     \
        (TOTAL_DESC - priv->hw_params->rx_queues * priv->hw_params->rx_bds_per_q)
@@ -2129,13 +2128,6 @@ static netdev_tx_t bcmgenet_xmit(struct sk_buff *skb, struct net_device *dev)
        int i;
 
        index = skb_get_queue_mapping(skb);
-       /* Mapping strategy:
-        * queue_mapping = 0, unclassified, packet xmited through ring 0
-        * queue_mapping = 1, goes to ring 1. (highest priority queue)
-        * queue_mapping = 2, goes to ring 2.
-        * queue_mapping = 3, goes to ring 3.
-        * queue_mapping = 4, goes to ring 4.
-        */
        ring = &priv->tx_rings[index];
        txq = netdev_get_tx_queue(dev, index);
 
@@ -2881,8 +2873,9 @@ static int bcmgenet_rdma_disable(struct bcmgenet_priv *priv)
 
 /* Initialize Tx queues
  *
- * Queues 1-4 are priority-based, each one has 32 descriptors,
- * with queue 1 being the highest priority queue.
+ * Queues 1-4 are the priority queues, each one has 32 descriptors.
+ * The weighted round-robin arbiter gives them a larger share of TX
+ * bandwidth than the default queue 0.
  *
  * Queue 0 is the default Tx queue with
  * GENET_Q0_TX_BD_CNT = 256 - 4 * 32 = 128 descriptors.
@@ -2900,8 +2893,8 @@ static void bcmgenet_init_tx_queues(struct net_device *dev)
        unsigned int start = 0, end = GENET_Q0_TX_BD_CNT;
        u32 i, ring_mask, dma_priority[3] = {0, 0, 0};
 
-       /* Enable strict priority arbiter mode */
-       bcmgenet_tdma_writel(priv, DMA_ARBITER_SP, DMA_ARB_CTRL);
+       /* Enable Weighted Round-Robin arbiter mode */
+       bcmgenet_tdma_writel(priv, DMA_ARBITER_WRR, DMA_ARB_CTRL);
 
        /* Initialize Tx priority queues */
        for (i = 0; i <= priv->hw_params->tx_queues; i++) {
@@ -2909,7 +2902,7 @@ static void bcmgenet_init_tx_queues(struct net_device *dev)
                start = end;
                end += priv->hw_params->tx_bds_per_q;
                dma_priority[DMA_PRIO_REG_INDEX(i)] |=
-                       (i ? GENET_Q1_PRIORITY : GENET_Q0_PRIORITY)
+                       (i ? GENET_Q1_WEIGHT : GENET_Q0_WEIGHT)
                        << DMA_PRIO_REG_SHIFT(i);
        }