drm/amdgpu: Convert amdgpu userqueue management from IDR to XArray

author Jesse.Zhang <Jesse.Zhang@amd.com>

Tue, 21 Oct 2025 05:01:06 +0000 (13:01 +0800)

committer Alex Deucher <alexander.deucher@amd.com>

Tue, 28 Oct 2025 13:59:22 +0000 (09:59 -0400)
author Jesse.Zhang <Jesse.Zhang@amd.com>
Tue, 21 Oct 2025 05:01:06 +0000 (13:01 +0800)
committer Alex Deucher <alexander.deucher@amd.com>
Tue, 28 Oct 2025 13:59:22 +0000 (09:59 -0400)
diff --git a/drivers/gpu/drm/amd/amdgpu/amdgpu.h b/drivers/gpu/drm/amd/amdgpu/amdgpu.h

index a5574e84694ba6c3834d8aafa31a347ecb4e3e20..50079209c4727e3ccf66916415bf3a070a68e65d 100644 (file)
--- a/drivers/gpu/drm/amd/amdgpu/amdgpu.h
+++ b/drivers/gpu/drm/amd/amdgpu/amdgpu.h
@@ -1176,6 +1176,12 @@ struct amdgpu_device {
          * queue fence.
          */
         struct xarray                   userq_xa;
+       /**
+        * @userq_doorbell_xa: Global user queue map (doorbell index → queue)
+        * Key: doorbell_index (unique global identifier for the queue)
+        * Value: struct amdgpu_usermode_queue
+        */
+       struct xarray userq_doorbell_xa;
  
         /* df */
         struct amdgpu_df                df;
@@ -1309,8 +1315,6 @@ struct amdgpu_device {
          */
         bool                            apu_prefer_gtt;
  
-       struct list_head                userq_mgr_list;
-       struct mutex                    userq_mutex;
         bool                            userq_halt_for_enforce_isolation;
         struct amdgpu_uid *uid_info;
  
diff --git a/drivers/gpu/drm/amd/amdgpu/amdgpu_device.c b/drivers/gpu/drm/amd/amdgpu/amdgpu_device.c

index 3ffb9bb1ec0b9fafb55f2020f41603b528692bf1..b8d91247f51a34d2033b906f74e2fafea254fb55 100644 (file)
--- a/drivers/gpu/drm/amd/amdgpu/amdgpu_device.c
+++ b/drivers/gpu/drm/amd/amdgpu/amdgpu_device.c
@@ -4558,7 +4558,6 @@ int amdgpu_device_init(struct amdgpu_device *adev,
         mutex_init(&adev->gfx.userq_sch_mutex);
         mutex_init(&adev->gfx.workload_profile_mutex);
         mutex_init(&adev->vcn.workload_profile_mutex);
-       mutex_init(&adev->userq_mutex);
  
         amdgpu_device_init_apu_flags(adev);
  
@@ -4586,7 +4585,7 @@ int amdgpu_device_init(struct amdgpu_device *adev,
  
         INIT_LIST_HEAD(&adev->pm.od_kobj_list);
  
-       INIT_LIST_HEAD(&adev->userq_mgr_list);
+       xa_init(&adev->userq_doorbell_xa);
  
         INIT_DELAYED_WORK(&adev->delayed_init_work,
                           amdgpu_device_delayed_init_work_handler);
diff --git a/drivers/gpu/drm/amd/amdgpu/amdgpu_drv.c b/drivers/gpu/drm/amd/amdgpu/amdgpu_drv.c

index a36e15beafeb9c8876c24c1158655c928a9787df..cee90f9e58a991f698e4acb5788d859fa13d895f 100644 (file)
--- a/drivers/gpu/drm/amd/amdgpu/amdgpu_drv.c
+++ b/drivers/gpu/drm/amd/amdgpu/amdgpu_drv.c
@@ -2772,22 +2772,8 @@ static int amdgpu_runtime_idle_check_userq(struct device *dev)
         struct pci_dev *pdev = to_pci_dev(dev);
         struct drm_device *drm_dev = pci_get_drvdata(pdev);
         struct amdgpu_device *adev = drm_to_adev(drm_dev);
-       struct amdgpu_usermode_queue *queue;
-       struct amdgpu_userq_mgr *uqm, *tmp;
-       int queue_id;
-       int ret = 0;
-
-       mutex_lock(&adev->userq_mutex);
-       list_for_each_entry_safe(uqm, tmp, &adev->userq_mgr_list, list) {
-               idr_for_each_entry(&uqm->userq_idr, queue, queue_id) {
-                       ret = -EBUSY;
-                       goto done;
-               }
-       }
-done:
-       mutex_unlock(&adev->userq_mutex);
  
-       return ret;
+       return xa_empty(&adev->userq_doorbell_xa) ? 0 : -EBUSY;
  }
  
  static int amdgpu_pmops_runtime_suspend(struct device *dev)
diff --git a/drivers/gpu/drm/amd/amdgpu/amdgpu_userq.c b/drivers/gpu/drm/amd/amdgpu/amdgpu_userq.c

index 2200e0bbf040abd9bdfeaceba6070e471f91799c..3b1811b110a494fe7c23d70e9bca2bfb16ebb585 100644 (file)
--- a/drivers/gpu/drm/amd/amdgpu/amdgpu_userq.c
+++ b/drivers/gpu/drm/amd/amdgpu/amdgpu_userq.c
@@ -30,6 +30,7 @@
  #include "amdgpu_vm.h"
  #include "amdgpu_userq.h"
  #include "amdgpu_hmm.h"
+#include "amdgpu_reset.h"
  #include "amdgpu_userq_fence.h"
  
  u32 amdgpu_userq_get_supported_ip_mask(struct amdgpu_device *adev)
@@ -278,19 +279,27 @@ amdgpu_userq_cleanup(struct amdgpu_userq_mgr *uq_mgr,
         struct amdgpu_device *adev = uq_mgr->adev;
         const struct amdgpu_userq_funcs *uq_funcs = adev->userq_funcs[queue->queue_type];
  
+       /* Wait for mode-1 reset to complete */
+       down_read(&adev->reset_domain->sem);
+
         /* Drop the userq reference. */
         amdgpu_userq_buffer_vas_list_cleanup(adev, queue);
         uq_funcs->mqd_destroy(uq_mgr, queue);
         amdgpu_userq_fence_driver_free(queue);
-       idr_remove(&uq_mgr->userq_idr, queue_id);
+       /* Use interrupt-safe locking since IRQ handlers may access these XArrays */
+       xa_erase_irq(&uq_mgr->userq_mgr_xa, (unsigned long)queue_id);
+       xa_erase_irq(&adev->userq_doorbell_xa, queue->doorbell_index);
+       queue->userq_mgr = NULL;
         list_del(&queue->userq_va_list);
         kfree(queue);
+
+       up_read(&adev->reset_domain->sem);
  }
  
  static struct amdgpu_usermode_queue *
  amdgpu_userq_find(struct amdgpu_userq_mgr *uq_mgr, int qid)
  {
-       return idr_find(&uq_mgr->userq_idr, qid);
+       return xa_load(&uq_mgr->userq_mgr_xa, qid);
  }
  
  void
@@ -551,8 +560,9 @@ amdgpu_userq_create(struct drm_file *filp, union drm_amdgpu_userq *args)
         struct amdgpu_db_info db_info;
         char *queue_name;
         bool skip_map_queue;
+       u32 qid;
         uint64_t index;
-       int qid, r = 0;
+       int r = 0;
         int priority =
                 (args->in.flags & AMDGPU_USERQ_CREATE_FLAGS_QUEUE_PRIORITY_MASK) >>
                 AMDGPU_USERQ_CREATE_FLAGS_QUEUE_PRIORITY_SHIFT;
@@ -575,7 +585,6 @@ amdgpu_userq_create(struct drm_file *filp, union drm_amdgpu_userq *args)
          *
          * This will also make sure we have a valid eviction fence ready to be used.
          */
-       mutex_lock(&adev->userq_mutex);
         amdgpu_userq_ensure_ev_fence(&fpriv->userq_mgr, &fpriv->evf_mgr);
  
         uq_funcs = adev->userq_funcs[args->in.ip_type];
@@ -638,15 +647,27 @@ amdgpu_userq_create(struct drm_file *filp, union drm_amdgpu_userq *args)
                 goto unlock;
         }
  
-       qid = idr_alloc(&uq_mgr->userq_idr, queue, 1, AMDGPU_MAX_USERQ_COUNT, GFP_KERNEL);
-       if (qid < 0) {
+       /* Wait for mode-1 reset to complete */
+       down_read(&adev->reset_domain->sem);
+       r = xa_err(xa_store_irq(&adev->userq_doorbell_xa, index, queue, GFP_KERNEL));
+       if (r) {
+               kfree(queue);
+               up_read(&adev->reset_domain->sem);
+               goto unlock;
+       }
+
+       r = xa_alloc(&uq_mgr->userq_mgr_xa, &qid, queue, XA_LIMIT(1, AMDGPU_MAX_USERQ_COUNT), GFP_KERNEL);
+       if (r) {
                 drm_file_err(uq_mgr->file, "Failed to allocate a queue id\n");
                 amdgpu_userq_fence_driver_free(queue);
                 uq_funcs->mqd_destroy(uq_mgr, queue);
                 kfree(queue);
                 r = -ENOMEM;
+               up_read(&adev->reset_domain->sem);
                 goto unlock;
         }
+       up_read(&adev->reset_domain->sem);
+       queue->userq_mgr = uq_mgr;
  
         /* don't map the queue if scheduling is halted */
         if (adev->userq_halt_for_enforce_isolation &&
@@ -659,7 +680,7 @@ amdgpu_userq_create(struct drm_file *filp, union drm_amdgpu_userq *args)
                 r = amdgpu_userq_map_helper(uq_mgr, queue);
                 if (r) {
                         drm_file_err(uq_mgr->file, "Failed to map Queue\n");
-                       idr_remove(&uq_mgr->userq_idr, qid);
+                       xa_erase(&uq_mgr->userq_mgr_xa, qid);
                         amdgpu_userq_fence_driver_free(queue);
                         uq_funcs->mqd_destroy(uq_mgr, queue);
                         kfree(queue);
@@ -684,7 +705,6 @@ amdgpu_userq_create(struct drm_file *filp, union drm_amdgpu_userq *args)
  
  unlock:
         mutex_unlock(&uq_mgr->userq_mutex);
-       mutex_unlock(&adev->userq_mutex);
  
         return r;
  }
@@ -782,11 +802,11 @@ static int
  amdgpu_userq_restore_all(struct amdgpu_userq_mgr *uq_mgr)
  {
         struct amdgpu_usermode_queue *queue;
-       int queue_id;
+       unsigned long queue_id;
         int ret = 0, r;
  
         /* Resume all the queues for this process */
-       idr_for_each_entry(&uq_mgr->userq_idr, queue, queue_id) {
+       xa_for_each(&uq_mgr->userq_mgr_xa, queue_id, queue) {
  
                 if (!amdgpu_userq_buffer_vas_mapped(queue)) {
                         drm_file_err(uq_mgr->file,
@@ -1023,11 +1043,11 @@ static int
  amdgpu_userq_evict_all(struct amdgpu_userq_mgr *uq_mgr)
  {
         struct amdgpu_usermode_queue *queue;
-       int queue_id;
+       unsigned long queue_id;
         int ret = 0, r;
  
         /* Try to unmap all the queues in this process ctx */
-       idr_for_each_entry(&uq_mgr->userq_idr, queue, queue_id) {
+       xa_for_each(&uq_mgr->userq_mgr_xa, queue_id, queue) {
                 r = amdgpu_userq_preempt_helper(uq_mgr, queue);
                 if (r)
                         ret = r;
@@ -1042,9 +1062,10 @@ static int
  amdgpu_userq_wait_for_signal(struct amdgpu_userq_mgr *uq_mgr)
  {
         struct amdgpu_usermode_queue *queue;
-       int queue_id, ret;
+       unsigned long queue_id;
+       int ret;
  
-       idr_for_each_entry(&uq_mgr->userq_idr, queue, queue_id) {
+       xa_for_each(&uq_mgr->userq_mgr_xa, queue_id, queue) {
                 struct dma_fence *f = queue->last_fence;
  
                 if (!f || dma_fence_is_signaled(f))
@@ -1097,44 +1118,30 @@ int amdgpu_userq_mgr_init(struct amdgpu_userq_mgr *userq_mgr, struct drm_file *f
                           struct amdgpu_device *adev)
  {
         mutex_init(&userq_mgr->userq_mutex);
-       idr_init_base(&userq_mgr->userq_idr, 1);
+       xa_init_flags(&userq_mgr->userq_mgr_xa, XA_FLAGS_ALLOC);
         userq_mgr->adev = adev;
         userq_mgr->file = file_priv;
  
-       mutex_lock(&adev->userq_mutex);
-       list_add(&userq_mgr->list, &adev->userq_mgr_list);
-       mutex_unlock(&adev->userq_mutex);
-
         INIT_DELAYED_WORK(&userq_mgr->resume_work, amdgpu_userq_restore_worker);
         return 0;
  }
  
  void amdgpu_userq_mgr_fini(struct amdgpu_userq_mgr *userq_mgr)
  {
-       struct amdgpu_device *adev = userq_mgr->adev;
         struct amdgpu_usermode_queue *queue;
-       struct amdgpu_userq_mgr *uqm, *tmp;
-       uint32_t queue_id;
+       unsigned long queue_id;
  
         cancel_delayed_work_sync(&userq_mgr->resume_work);
  
-       mutex_lock(&adev->userq_mutex);
         mutex_lock(&userq_mgr->userq_mutex);
-       idr_for_each_entry(&userq_mgr->userq_idr, queue, queue_id) {
+       xa_for_each(&userq_mgr->userq_mgr_xa, queue_id, queue) {
                 amdgpu_userq_wait_for_last_fence(userq_mgr, queue);
                 amdgpu_userq_unmap_helper(userq_mgr, queue);
                 amdgpu_userq_cleanup(userq_mgr, queue, queue_id);
         }
  
-       list_for_each_entry_safe(uqm, tmp, &adev->userq_mgr_list, list) {
-               if (uqm == userq_mgr) {
-                       list_del(&uqm->list);
-                       break;
-               }
-       }
-       idr_destroy(&userq_mgr->userq_idr);
+       xa_destroy(&userq_mgr->userq_mgr_xa);
         mutex_unlock(&userq_mgr->userq_mutex);
-       mutex_unlock(&adev->userq_mutex);
         mutex_destroy(&userq_mgr->userq_mutex);
  }
  
@@ -1142,25 +1149,23 @@ int amdgpu_userq_suspend(struct amdgpu_device *adev)
  {
         u32 ip_mask = amdgpu_userq_get_supported_ip_mask(adev);
         struct amdgpu_usermode_queue *queue;
-       struct amdgpu_userq_mgr *uqm, *tmp;
-       int queue_id;
+       struct amdgpu_userq_mgr *uqm;
+       unsigned long queue_id;
         int r;
  
         if (!ip_mask)
                 return 0;
  
-       guard(mutex)(&adev->userq_mutex);
-       list_for_each_entry_safe(uqm, tmp, &adev->userq_mgr_list, list) {
+       xa_for_each(&adev->userq_doorbell_xa, queue_id, queue) {
+               uqm = queue->userq_mgr;
                 cancel_delayed_work_sync(&uqm->resume_work);
                 guard(mutex)(&uqm->userq_mutex);
-               idr_for_each_entry(&uqm->userq_idr, queue, queue_id) {
-                       if (adev->in_s0ix)
-                               r = amdgpu_userq_preempt_helper(uqm, queue);
-                       else
-                               r = amdgpu_userq_unmap_helper(uqm, queue);
-                       if (r)
-                               return r;
-               }
+               if (adev->in_s0ix)
+                       r = amdgpu_userq_preempt_helper(uqm, queue);
+               else
+                       r = amdgpu_userq_unmap_helper(uqm, queue);
+               if (r)
+                       return r;
         }
         return 0;
  }
@@ -1169,24 +1174,22 @@ int amdgpu_userq_resume(struct amdgpu_device *adev)
  {
         u32 ip_mask = amdgpu_userq_get_supported_ip_mask(adev);
         struct amdgpu_usermode_queue *queue;
-       struct amdgpu_userq_mgr *uqm, *tmp;
-       int queue_id;
+       struct amdgpu_userq_mgr *uqm;
+       unsigned long queue_id;
         int r;
  
         if (!ip_mask)
                 return 0;
  
-       guard(mutex)(&adev->userq_mutex);
-       list_for_each_entry_safe(uqm, tmp, &adev->userq_mgr_list, list) {
+       xa_for_each(&adev->userq_doorbell_xa, queue_id, queue) {
+               uqm = queue->userq_mgr;
                 guard(mutex)(&uqm->userq_mutex);
-               idr_for_each_entry(&uqm->userq_idr, queue, queue_id) {
-                       if (adev->in_s0ix)
-                               r = amdgpu_userq_restore_helper(uqm, queue);
-                       else
-                               r = amdgpu_userq_map_helper(uqm, queue);
-                       if (r)
-                               return r;
-               }
+               if (adev->in_s0ix)
+                       r = amdgpu_userq_restore_helper(uqm, queue);
+               else
+                       r = amdgpu_userq_map_helper(uqm, queue);
+               if (r)
+                       return r;
         }
  
         return 0;
@@ -1197,33 +1200,31 @@ int amdgpu_userq_stop_sched_for_enforce_isolation(struct amdgpu_device *adev,
  {
         u32 ip_mask = amdgpu_userq_get_supported_ip_mask(adev);
         struct amdgpu_usermode_queue *queue;
-       struct amdgpu_userq_mgr *uqm, *tmp;
-       int queue_id;
+       struct amdgpu_userq_mgr *uqm;
+       unsigned long queue_id;
         int ret = 0, r;
  
         /* only need to stop gfx/compute */
         if (!(ip_mask & ((1 << AMDGPU_HW_IP_GFX) | (1 << AMDGPU_HW_IP_COMPUTE))))
                 return 0;
  
-       mutex_lock(&adev->userq_mutex);
         if (adev->userq_halt_for_enforce_isolation)
                 dev_warn(adev->dev, "userq scheduling already stopped!\n");
         adev->userq_halt_for_enforce_isolation = true;
-       list_for_each_entry_safe(uqm, tmp, &adev->userq_mgr_list, list) {
+       xa_for_each(&adev->userq_doorbell_xa, queue_id, queue) {
+               uqm = queue->userq_mgr;
                 cancel_delayed_work_sync(&uqm->resume_work);
                 mutex_lock(&uqm->userq_mutex);
-               idr_for_each_entry(&uqm->userq_idr, queue, queue_id) {
-                       if (((queue->queue_type == AMDGPU_HW_IP_GFX) ||
-                            (queue->queue_type == AMDGPU_HW_IP_COMPUTE)) &&
-                           (queue->xcp_id == idx)) {
-                               r = amdgpu_userq_preempt_helper(uqm, queue);
-                               if (r)
-                                       ret = r;
-                       }
+               if (((queue->queue_type == AMDGPU_HW_IP_GFX) ||
+                    (queue->queue_type == AMDGPU_HW_IP_COMPUTE)) &&
+                   (queue->xcp_id == idx)) {
+                       r = amdgpu_userq_preempt_helper(uqm, queue);
+                       if (r)
+                               ret = r;
                 }
                 mutex_unlock(&uqm->userq_mutex);
         }
-       mutex_unlock(&adev->userq_mutex);
+
         return ret;
  }
  
@@ -1232,21 +1233,20 @@ int amdgpu_userq_start_sched_for_enforce_isolation(struct amdgpu_device *adev,
  {
         u32 ip_mask = amdgpu_userq_get_supported_ip_mask(adev);
         struct amdgpu_usermode_queue *queue;
-       struct amdgpu_userq_mgr *uqm, *tmp;
-       int queue_id;
+       struct amdgpu_userq_mgr *uqm;
+       unsigned long queue_id;
         int ret = 0, r;
  
         /* only need to stop gfx/compute */
         if (!(ip_mask & ((1 << AMDGPU_HW_IP_GFX) | (1 << AMDGPU_HW_IP_COMPUTE))))
                 return 0;
  
-       mutex_lock(&adev->userq_mutex);
         if (!adev->userq_halt_for_enforce_isolation)
                 dev_warn(adev->dev, "userq scheduling already started!\n");
         adev->userq_halt_for_enforce_isolation = false;
-       list_for_each_entry_safe(uqm, tmp, &adev->userq_mgr_list, list) {
+       xa_for_each(&adev->userq_doorbell_xa, queue_id, queue) {
+               uqm = queue->userq_mgr;
                 mutex_lock(&uqm->userq_mutex);
-               idr_for_each_entry(&uqm->userq_idr, queue, queue_id) {
                         if (((queue->queue_type == AMDGPU_HW_IP_GFX) ||
                              (queue->queue_type == AMDGPU_HW_IP_COMPUTE)) &&
                             (queue->xcp_id == idx)) {
@@ -1254,10 +1254,9 @@ int amdgpu_userq_start_sched_for_enforce_isolation(struct amdgpu_device *adev,
                                 if (r)
                                         ret = r;
                         }
-               }
                 mutex_unlock(&uqm->userq_mutex);
         }
-       mutex_unlock(&adev->userq_mutex);
+
         return ret;
  }
  
diff --git a/drivers/gpu/drm/amd/amdgpu/amdgpu_userq.h b/drivers/gpu/drm/amd/amdgpu/amdgpu_userq.h

index 036d8dd585cd106be50be5f1ddd2808d52166aca..09da0617bfa20ae560d22c4ccc071825b71f2e6d 100644 (file)
--- a/drivers/gpu/drm/amd/amdgpu/amdgpu_userq.h
+++ b/drivers/gpu/drm/amd/amdgpu/amdgpu_userq.h
@@ -96,11 +96,15 @@ struct amdgpu_userq_funcs {
  
  /* Usermode queues for gfx */
  struct amdgpu_userq_mgr {
-       struct idr                      userq_idr;
+       /**
+        * @userq_mgr_xa: Per-process user queue map (queue ID → queue)
+        * Key: queue_id (unique ID within the process's userq manager)
+        * Value: struct amdgpu_usermode_queue
+        */
+       struct xarray                   userq_mgr_xa;
         struct mutex                    userq_mutex;
         struct amdgpu_device            *adev;
         struct delayed_work             resume_work;
-       struct list_head                list;
         struct drm_file                 *file;
  };
  
diff --git a/drivers/gpu/drm/amd/amdgpu/amdgpu_userq_fence.c b/drivers/gpu/drm/amd/amdgpu/amdgpu_userq_fence.c

index 761bad98da3ec45b7519df72725daa02eb5346c3..2aeeaa9548820b55dc74654ae6e0970b578f80db 100644 (file)
--- a/drivers/gpu/drm/amd/amdgpu/amdgpu_userq_fence.c
+++ b/drivers/gpu/drm/amd/amdgpu/amdgpu_userq_fence.c
@@ -537,7 +537,7 @@ int amdgpu_userq_signal_ioctl(struct drm_device *dev, void *data,
         }
  
         /* Retrieve the user queue */
-       queue = idr_find(&userq_mgr->userq_idr, args->queue_id);
+       queue = xa_load(&userq_mgr->userq_mgr_xa, args->queue_id);
         if (!queue) {
                 r = -ENOENT;
                 goto put_gobj_write;
@@ -899,7 +899,7 @@ int amdgpu_userq_wait_ioctl(struct drm_device *dev, void *data,
                  */
                 num_fences = dma_fence_dedup_array(fences, num_fences);
  
-               waitq = idr_find(&userq_mgr->userq_idr, wait_info->waitq_id);
+               waitq = xa_load(&userq_mgr->userq_mgr_xa, wait_info->waitq_id);
                 if (!waitq) {
                         r = -EINVAL;
                         goto free_fences;
diff --git a/drivers/gpu/drm/amd/amdgpu/mes_userqueue.c b/drivers/gpu/drm/amd/amdgpu/mes_userqueue.c

index 5c63480dda9c4464b59c34f986d9efce95fb84dc..9894a3eed21524cf2fb329e4b259254e24eaf955 100644 (file)
--- a/drivers/gpu/drm/amd/amdgpu/mes_userqueue.c
+++ b/drivers/gpu/drm/amd/amdgpu/mes_userqueue.c
@@ -205,10 +205,10 @@ static int mes_userq_detect_and_reset(struct amdgpu_device *adev,
         int db_array_size = amdgpu_mes_get_hung_queue_db_array_size(adev);
         struct mes_detect_and_reset_queue_input input;
         struct amdgpu_usermode_queue *queue;
-       struct amdgpu_userq_mgr *uqm, *tmp;
         unsigned int hung_db_num = 0;
-       int queue_id, r, i;
+       unsigned long queue_id;
         u32 db_array[8];
+       int r, i;
  
         if (db_array_size > 8) {
                 dev_err(adev->dev, "DB array size (%d vs 8) too small\n",
@@ -227,16 +227,14 @@ static int mes_userq_detect_and_reset(struct amdgpu_device *adev,
         if (r) {
                 dev_err(adev->dev, "Failed to detect and reset queues, err (%d)\n", r);
         } else if (hung_db_num) {
-               list_for_each_entry_safe(uqm, tmp, &adev->userq_mgr_list, list) {
-                       idr_for_each_entry(&uqm->userq_idr, queue, queue_id) {
-                               if (queue->queue_type == queue_type) {
-                                       for (i = 0; i < hung_db_num; i++) {
-                                               if (queue->doorbell_index == db_array[i]) {
-                                                       queue->state = AMDGPU_USERQ_STATE_HUNG;
-                                                       atomic_inc(&adev->gpu_reset_counter);
-                                                       amdgpu_userq_fence_driver_force_completion(queue);
-                                                       drm_dev_wedged_event(adev_to_drm(adev), DRM_WEDGE_RECOVERY_NONE, NULL);
-                                               }
+               xa_for_each(&adev->userq_doorbell_xa, queue_id, queue) {
+                       if (queue->queue_type == queue_type) {
+                               for (i = 0; i < hung_db_num; i++) {
+                                       if (queue->doorbell_index == db_array[i]) {
+                                               queue->state = AMDGPU_USERQ_STATE_HUNG;
+                                               atomic_inc(&adev->gpu_reset_counter);
+                                               amdgpu_userq_fence_driver_force_completion(queue);
+                                               drm_dev_wedged_event(adev_to_drm(adev), DRM_WEDGE_RECOVERY_NONE, NULL);
                                         }
                                 }
                         }
author	Jesse.Zhang <Jesse.Zhang@amd.com>
	Tue, 21 Oct 2025 05:01:06 +0000 (13:01 +0800)
committer	Alex Deucher <alexander.deucher@amd.com>
	Tue, 28 Oct 2025 13:59:22 +0000 (09:59 -0400)
drivers/gpu/drm/amd/amdgpu/amdgpu.h		patch \| blob \| blame \| history
drivers/gpu/drm/amd/amdgpu/amdgpu_device.c		patch \| blob \| blame \| history
drivers/gpu/drm/amd/amdgpu/amdgpu_drv.c		patch \| blob \| blame \| history
drivers/gpu/drm/amd/amdgpu/amdgpu_userq.c		patch \| blob \| blame \| history
drivers/gpu/drm/amd/amdgpu/amdgpu_userq.h		patch \| blob \| blame \| history
drivers/gpu/drm/amd/amdgpu/amdgpu_userq_fence.c		patch \| blob \| blame \| history
drivers/gpu/drm/amd/amdgpu/mes_userqueue.c		patch \| blob \| blame \| history