drm/amdgpu: Implement userqueue signal/wait IOCTL

author Arunpravin Paneer Selvam <Arunpravin.PaneerSelvam@amd.com>

Wed, 30 Oct 2024 04:56:07 +0000 (10:26 +0530)

committer Alex Deucher <alexander.deucher@amd.com>

Tue, 8 Apr 2025 20:48:16 +0000 (16:48 -0400)
author Arunpravin Paneer Selvam <Arunpravin.PaneerSelvam@amd.com>
Wed, 30 Oct 2024 04:56:07 +0000 (10:26 +0530)
committer Alex Deucher <alexander.deucher@amd.com>
Tue, 8 Apr 2025 20:48:16 +0000 (16:48 -0400)
diff --git a/drivers/gpu/drm/amd/amdgpu/amdgpu.h b/drivers/gpu/drm/amd/amdgpu/amdgpu.h

index 02511b6eb6afeeda3b9f220fbca32f9f9840eb62..be10fbe293e4fe305f9e93bc30b00f8212505c00 100644 (file)
--- a/drivers/gpu/drm/amd/amdgpu/amdgpu.h
+++ b/drivers/gpu/drm/amd/amdgpu/amdgpu.h
@@ -1094,6 +1094,12 @@ struct amdgpu_device {
         struct amdgpu_mqd               mqds[AMDGPU_HW_IP_NUM];
         const struct amdgpu_userq_funcs *userq_funcs[AMDGPU_HW_IP_NUM];
  
+       /* xarray used to retrieve the user queue fence driver reference
+        * in the EOP interrupt handler to signal the particular user
+        * queue fence.
+        */
+       struct xarray                   userq_xa;
+
         /* df */
         struct amdgpu_df                df;
  
diff --git a/drivers/gpu/drm/amd/amdgpu/amdgpu_drv.c b/drivers/gpu/drm/amd/amdgpu/amdgpu_drv.c

index 0221e79289894fd45c30d6aab663f1cdc6ced6dc..148f859c3b9893724ad57e221e6beb2990dbc226 100644 (file)
--- a/drivers/gpu/drm/amd/amdgpu/amdgpu_drv.c
+++ b/drivers/gpu/drm/amd/amdgpu/amdgpu_drv.c
@@ -2950,6 +2950,8 @@ const struct drm_ioctl_desc amdgpu_ioctls_kms[] = {
         DRM_IOCTL_DEF_DRV(AMDGPU_GEM_OP, amdgpu_gem_op_ioctl, DRM_AUTH|DRM_RENDER_ALLOW),
         DRM_IOCTL_DEF_DRV(AMDGPU_GEM_USERPTR, amdgpu_gem_userptr_ioctl, DRM_AUTH|DRM_RENDER_ALLOW),
         DRM_IOCTL_DEF_DRV(AMDGPU_USERQ, amdgpu_userq_ioctl, DRM_AUTH|DRM_RENDER_ALLOW),
+       DRM_IOCTL_DEF_DRV(AMDGPU_USERQ_SIGNAL, amdgpu_userq_signal_ioctl, DRM_AUTH|DRM_RENDER_ALLOW),
+       DRM_IOCTL_DEF_DRV(AMDGPU_USERQ_WAIT, amdgpu_userq_wait_ioctl, DRM_AUTH|DRM_RENDER_ALLOW),
  };
  
  static const struct drm_driver amdgpu_kms_driver = {
diff --git a/drivers/gpu/drm/amd/amdgpu/amdgpu_userq_fence.c b/drivers/gpu/drm/amd/amdgpu/amdgpu_userq_fence.c

index 3693453d8b601c7ba9fd31ea22d7974ec9d06ac2..8f9d2427d38001f3fb082a1470b39d445d63dca9 100644 (file)
--- a/drivers/gpu/drm/amd/amdgpu/amdgpu_userq_fence.c
+++ b/drivers/gpu/drm/amd/amdgpu/amdgpu_userq_fence.c
@@ -25,6 +25,7 @@
  #include <linux/kref.h>
  #include <linux/slab.h>
  
+#include <drm/drm_exec.h>
  #include <drm/drm_syncobj.h>
  
  #include "amdgpu.h"
@@ -92,6 +93,7 @@ int amdgpu_userq_fence_driver_alloc(struct amdgpu_device *adev,
         spin_lock_init(&fence_drv->fence_list_lock);
  
         fence_drv->adev = adev;
+       fence_drv->uq_fence_drv_xa_ref = &userq->uq_fence_drv_xa;
         fence_drv->context = dma_fence_context_alloc(1);
         get_task_comm(fence_drv->timeline_name, current);
  
@@ -105,6 +107,7 @@ void amdgpu_userq_fence_driver_process(struct amdgpu_userq_fence_driver *fence_d
         struct amdgpu_userq_fence *userq_fence, *tmp;
         struct dma_fence *fence;
         u64 rptr;
+       int i;
  
         if (!fence_drv)
                 return;
@@ -115,14 +118,16 @@ void amdgpu_userq_fence_driver_process(struct amdgpu_userq_fence_driver *fence_d
         list_for_each_entry_safe(userq_fence, tmp, &fence_drv->fences, link) {
                 fence = &userq_fence->base;
  
-               if (rptr >= fence->seqno) {
-                       dma_fence_signal(fence);
-                       list_del(&userq_fence->link);
-
-                       dma_fence_put(fence);
-               } else {
+               if (rptr < fence->seqno)
                         break;
-               }
+
+               dma_fence_signal(fence);
+
+               for (i = 0; i < userq_fence->fence_drv_array_count; i++)
+                       amdgpu_userq_fence_driver_put(userq_fence->fence_drv_array[i]);
+
+               list_del(&userq_fence->link);
+               dma_fence_put(fence);
         }
         spin_unlock(&fence_drv->fence_list_lock);
  }
@@ -132,8 +137,11 @@ void amdgpu_userq_fence_driver_destroy(struct kref *ref)
         struct amdgpu_userq_fence_driver *fence_drv = container_of(ref,
                                          struct amdgpu_userq_fence_driver,
                                          refcount);
+       struct amdgpu_userq_fence_driver *xa_fence_drv;
         struct amdgpu_device *adev = fence_drv->adev;
         struct amdgpu_userq_fence *fence, *tmp;
+       struct xarray *xa = &adev->userq_xa;
+       unsigned long index;
         struct dma_fence *f;
  
         spin_lock(&fence_drv->fence_list_lock);
@@ -150,6 +158,12 @@ void amdgpu_userq_fence_driver_destroy(struct kref *ref)
         }
         spin_unlock(&fence_drv->fence_list_lock);
  
+       xa_lock(xa);
+       xa_for_each(xa, index, xa_fence_drv)
+               if (xa_fence_drv == fence_drv)
+                       __xa_erase(xa, index);
+       xa_unlock(xa);
+
         /* Free seq64 memory */
         amdgpu_seq64_free(adev, fence_drv->gpu_addr);
         kfree(fence_drv);
@@ -192,6 +206,33 @@ int amdgpu_userq_fence_create(struct amdgpu_usermode_queue *userq,
         amdgpu_userq_fence_driver_get(fence_drv);
         dma_fence_get(fence);
  
+       if (!xa_empty(&userq->uq_fence_drv_xa)) {
+               struct amdgpu_userq_fence_driver *stored_fence_drv;
+               unsigned long index, count = 0;
+               int i = 0;
+
+               xa_for_each(&userq->uq_fence_drv_xa, index, stored_fence_drv)
+                       count++;
+
+               userq_fence->fence_drv_array =
+                       kvmalloc_array(count,
+                                      sizeof(struct amdgpu_userq_fence_driver *),
+                                      GFP_KERNEL);
+
+               if (userq_fence->fence_drv_array) {
+                       xa_for_each(&userq->uq_fence_drv_xa, index, stored_fence_drv) {
+                               userq_fence->fence_drv_array[i] = stored_fence_drv;
+                               xa_erase(&userq->uq_fence_drv_xa, index);
+                               i++;
+                       }
+               }
+
+               userq_fence->fence_drv_array_count = i;
+       } else {
+               userq_fence->fence_drv_array = NULL;
+               userq_fence->fence_drv_array_count = 0;
+       }
+
         /* Check if hardware has already processed the job */
         spin_lock_irqsave(&fence_drv->fence_list_lock, flags);
         if (!dma_fence_is_signaled_locked(fence))
@@ -241,6 +282,8 @@ static void amdgpu_userq_fence_free(struct rcu_head *rcu)
  
         /* Release the fence driver reference */
         amdgpu_userq_fence_driver_put(fence_drv);
+
+       kvfree(userq_fence->fence_drv_array);
         kmem_cache_free(amdgpu_userq_fence_slab, userq_fence);
  }
  
@@ -256,3 +299,392 @@ static const struct dma_fence_ops amdgpu_userq_fence_ops = {
         .signaled = amdgpu_userq_fence_signaled,
         .release = amdgpu_userq_fence_release,
  };
+
+/**
+ * amdgpu_userq_fence_read_wptr - Read the userq wptr value
+ *
+ * @filp: drm file private data structure
+ * @queue: user mode queue structure pointer
+ * @wptr: write pointer value
+ *
+ * Read the wptr value from userq's MQD. The userq signal IOCTL
+ * creates a dma_fence for the shared buffers that expects the
+ * RPTR value written to seq64 memory >= WPTR.
+ *
+ * Returns wptr value on success, error on failure.
+ */
+static int amdgpu_userq_fence_read_wptr(struct drm_file *filp,
+                                       struct amdgpu_usermode_queue *queue,
+                                       u64 *wptr)
+{
+       struct amdgpu_fpriv *fpriv = filp->driver_priv;
+       struct amdgpu_bo_va_mapping *mapping;
+       struct amdgpu_vm *vm = &fpriv->vm;
+       struct amdgpu_bo *bo;
+       u64 addr, *ptr;
+       int r;
+
+       addr = queue->userq_prop->wptr_gpu_addr;
+       addr &= AMDGPU_GMC_HOLE_MASK;
+
+       mapping = amdgpu_vm_bo_lookup_mapping(vm, addr >> PAGE_SHIFT);
+       if (!mapping)
+               return -EINVAL;
+
+       bo = mapping->bo_va->base.bo;
+       r = amdgpu_bo_reserve(bo, true);
+       if (r) {
+               DRM_ERROR("Failed to reserve userqueue wptr bo");
+               return r;
+       }
+
+       r = amdgpu_bo_kmap(bo, (void **)&ptr);
+       if (r) {
+               DRM_ERROR("Failed mapping the userqueue wptr bo");
+               goto map_error;
+       }
+
+       *wptr = le64_to_cpu(*ptr);
+
+       amdgpu_bo_kunmap(bo);
+       amdgpu_bo_unreserve(bo);
+
+       return 0;
+
+map_error:
+       amdgpu_bo_unreserve(bo);
+       return r;
+}
+
+int amdgpu_userq_signal_ioctl(struct drm_device *dev, void *data,
+                             struct drm_file *filp)
+{
+       struct amdgpu_fpriv *fpriv = filp->driver_priv;
+       struct amdgpu_userq_mgr *userq_mgr = &fpriv->userq_mgr;
+       struct drm_amdgpu_userq_signal *args = data;
+       struct amdgpu_usermode_queue *queue;
+       struct drm_gem_object **gobj = NULL;
+       struct drm_syncobj **syncobj = NULL;
+       u32 *syncobj_handles, num_syncobj_handles;
+       u32 *bo_handles, num_bo_handles;
+       int r, i, entry, boentry;
+       struct dma_fence *fence;
+       struct drm_exec exec;
+       u64 wptr;
+
+       /* Array of syncobj handles */
+       num_syncobj_handles = args->num_syncobj_handles;
+       syncobj_handles = memdup_user(u64_to_user_ptr(args->syncobj_handles_array),
+                                     sizeof(u32) * num_syncobj_handles);
+       if (IS_ERR(syncobj_handles))
+               return PTR_ERR(syncobj_handles);
+
+       /* Array of pointers to the looked up syncobjs */
+       syncobj = kmalloc_array(num_syncobj_handles, sizeof(*syncobj), GFP_KERNEL);
+       if (!syncobj) {
+               r = -ENOMEM;
+               goto free_syncobj_handles;
+       }
+
+       for (entry = 0; entry < num_syncobj_handles; entry++) {
+               syncobj[entry] = drm_syncobj_find(filp, syncobj_handles[entry]);
+               if (!syncobj[entry]) {
+                       r = -ENOENT;
+                       goto free_syncobj;
+               }
+       }
+
+       /* Array of bo handles */
+       num_bo_handles = args->num_bo_handles;
+       bo_handles = memdup_user(u64_to_user_ptr(args->bo_handles_array),
+                                sizeof(u32) * num_bo_handles);
+       if (IS_ERR(bo_handles))
+               goto free_syncobj;
+
+       /* Array of pointers to the GEM objects */
+       gobj = kmalloc_array(num_bo_handles, sizeof(*gobj), GFP_KERNEL);
+       if (!gobj) {
+               r = -ENOMEM;
+               goto free_bo_handles;
+       }
+
+       for (boentry = 0; boentry < num_bo_handles; boentry++) {
+               gobj[boentry] = drm_gem_object_lookup(filp, bo_handles[boentry]);
+               if (!gobj[boentry]) {
+                       r = -ENOENT;
+                       goto put_gobj;
+               }
+       }
+
+       drm_exec_init(&exec, DRM_EXEC_INTERRUPTIBLE_WAIT, 0);
+       drm_exec_until_all_locked(&exec) {
+               r = drm_exec_prepare_array(&exec, gobj, num_bo_handles, 1);
+               drm_exec_retry_on_contention(&exec);
+               if (r)
+                       goto exec_fini;
+       }
+
+       /*Retrieve the user queue */
+       queue = idr_find(&userq_mgr->userq_idr, args->queue_id);
+       if (!queue) {
+               r = -ENOENT;
+               goto exec_fini;
+       }
+
+       r = amdgpu_userq_fence_read_wptr(filp, queue, &wptr);
+       if (r)
+               goto exec_fini;
+
+       /* Create a new fence */
+       r = amdgpu_userq_fence_create(queue, wptr, &fence);
+       if (r)
+               goto exec_fini;
+
+       for (i = 0; i < num_bo_handles; i++)
+               dma_resv_add_fence(gobj[i]->resv, fence,
+                                  dma_resv_usage_rw(args->bo_flags &
+                                  AMDGPU_USERQ_BO_WRITE));
+
+       /* Add the created fence to syncobj/BO's */
+       for (i = 0; i < num_syncobj_handles; i++)
+               drm_syncobj_replace_fence(syncobj[i], fence);
+
+       /* drop the reference acquired in fence creation function */
+       dma_fence_put(fence);
+
+exec_fini:
+       drm_exec_fini(&exec);
+put_gobj:
+       while (boentry-- > 0)
+               drm_gem_object_put(gobj[boentry]);
+       kfree(gobj);
+free_bo_handles:
+       kfree(bo_handles);
+free_syncobj:
+       while (entry-- > 0)
+               if (syncobj[entry])
+                       drm_syncobj_put(syncobj[entry]);
+       kfree(syncobj);
+free_syncobj_handles:
+       kfree(syncobj_handles);
+
+       return r;
+}
+
+int amdgpu_userq_wait_ioctl(struct drm_device *dev, void *data,
+                           struct drm_file *filp)
+{
+       struct drm_amdgpu_userq_fence_info *fence_info = NULL;
+       struct drm_amdgpu_userq_wait *wait_info = data;
+       u32 *syncobj_handles, *bo_handles;
+       struct dma_fence **fences = NULL;
+       u32 num_syncobj, num_bo_handles;
+       struct drm_gem_object **gobj;
+       struct drm_exec exec;
+       int r, i, entry, cnt;
+       u64 num_fences = 0;
+
+       num_bo_handles = wait_info->num_bo_handles;
+       bo_handles = memdup_user(u64_to_user_ptr(wait_info->bo_handles_array),
+                                sizeof(u32) * num_bo_handles);
+       if (IS_ERR(bo_handles))
+               return PTR_ERR(bo_handles);
+
+       num_syncobj = wait_info->num_syncobj_handles;
+       syncobj_handles = memdup_user(u64_to_user_ptr(wait_info->syncobj_handles_array),
+                                     sizeof(u32) * num_syncobj);
+       if (IS_ERR(syncobj_handles)) {
+               r = PTR_ERR(syncobj_handles);
+               goto free_bo_handles;
+       }
+
+       /* Array of GEM object handles */
+       gobj = kmalloc_array(num_bo_handles, sizeof(*gobj), GFP_KERNEL);
+       if (!gobj) {
+               r = -ENOMEM;
+               goto free_syncobj_handles;
+       }
+
+       for (entry = 0; entry < num_bo_handles; entry++) {
+               gobj[entry] = drm_gem_object_lookup(filp, bo_handles[entry]);
+               if (!gobj[entry]) {
+                       r = -ENOENT;
+                       goto put_gobj;
+               }
+       }
+
+       drm_exec_init(&exec, DRM_EXEC_INTERRUPTIBLE_WAIT, 0);
+       drm_exec_until_all_locked(&exec) {
+               r = drm_exec_prepare_array(&exec, gobj, num_bo_handles, 0);
+               drm_exec_retry_on_contention(&exec);
+               if (r) {
+                       drm_exec_fini(&exec);
+                       goto put_gobj;
+               }
+       }
+
+       if (!wait_info->num_fences) {
+               /* Count syncobj's fence */
+               for (i = 0; i < num_syncobj; i++) {
+                       struct dma_fence *fence;
+
+                       r = drm_syncobj_find_fence(filp, syncobj_handles[i],
+                                                  0, 0, &fence);
+                       if (r)
+                               goto exec_fini;
+
+                       num_fences++;
+                       dma_fence_put(fence);
+               }
+
+               /* Count GEM objects fence */
+               for (i = 0; i < num_bo_handles; i++) {
+                       struct dma_resv_iter resv_cursor;
+                       struct dma_fence *fence;
+
+                       dma_resv_for_each_fence(&resv_cursor, gobj[i]->resv,
+                                               dma_resv_usage_rw(wait_info->bo_wait_flags &
+                                               AMDGPU_USERQ_BO_WRITE), fence)
+                               num_fences++;
+               }
+
+               /*
+                * Passing num_fences = 0 means that userspace doesn't want to
+                * retrieve userq_fence_info. If num_fences = 0 we skip filling
+                * userq_fence_info and return the actual number of fences on
+                * args->num_fences.
+                */
+               wait_info->num_fences = num_fences;
+       } else {
+               /* Array of fence info */
+               fence_info = kmalloc_array(wait_info->num_fences, sizeof(*fence_info), GFP_KERNEL);
+               if (!fence_info) {
+                       r = -ENOMEM;
+                       goto exec_fini;
+               }
+
+               /* Array of fences */
+               fences = kmalloc_array(wait_info->num_fences, sizeof(*fences), GFP_KERNEL);
+               if (!fences) {
+                       r = -ENOMEM;
+                       goto free_fence_info;
+               }
+
+               /* Retrieve GEM objects fence */
+               for (i = 0; i < num_bo_handles; i++) {
+                       struct dma_resv_iter resv_cursor;
+                       struct dma_fence *fence;
+
+                       dma_resv_for_each_fence(&resv_cursor, gobj[i]->resv,
+                                               dma_resv_usage_rw(wait_info->bo_wait_flags &
+                                               AMDGPU_USERQ_BO_WRITE), fence) {
+                               if (WARN_ON_ONCE(num_fences >= wait_info->num_fences)) {
+                                       r = -EINVAL;
+                                       goto free_fences;
+                               }
+
+                               fences[num_fences++] = fence;
+                               dma_fence_get(fence);
+                       }
+               }
+
+               /* Retrieve syncobj's fence */
+               for (i = 0; i < num_syncobj; i++) {
+                       struct dma_fence *fence;
+
+                       r = drm_syncobj_find_fence(filp, syncobj_handles[i],
+                                                  0, 0, &fence);
+                       if (r)
+                               goto free_fences;
+
+                       if (WARN_ON_ONCE(num_fences >= wait_info->num_fences)) {
+                               r = -EINVAL;
+                               goto free_fences;
+                       }
+
+                       fences[num_fences++] = fence;
+               }
+
+               for (i = 0, cnt = 0; i < wait_info->num_fences; i++) {
+                       struct amdgpu_userq_fence_driver *fence_drv;
+                       struct amdgpu_userq_fence *userq_fence;
+                       u32 index;
+
+                       userq_fence = to_amdgpu_userq_fence(fences[i]);
+                       if (!userq_fence) {
+                               /*
+                                * Just waiting on other driver fences should
+                                * be good for now
+                                */
+                               dma_fence_wait(fences[i], false);
+                               dma_fence_put(fences[i]);
+
+                               continue;
+                       }
+
+                       fence_drv = userq_fence->fence_drv;
+                       /*
+                        * We need to make sure the user queue release their reference
+                        * to the fence drivers at some point before queue destruction.
+                        * Otherwise, we would gather those references until we don't
+                        * have any more space left and crash.
+                        */
+                       if (fence_drv->uq_fence_drv_xa_ref) {
+                               r = xa_alloc(fence_drv->uq_fence_drv_xa_ref, &index, fence_drv,
+                                            xa_limit_32b, GFP_KERNEL);
+                               if (r)
+                                       goto free_fences;
+
+                               amdgpu_userq_fence_driver_get(fence_drv);
+                       }
+
+                       /* Store drm syncobj's gpu va address and value */
+                       fence_info[cnt].va = fence_drv->gpu_addr;
+                       fence_info[cnt].value = fences[i]->seqno;
+
+                       dma_fence_put(fences[i]);
+                       /* Increment the actual userq fence count */
+                       cnt++;
+               }
+
+               wait_info->num_fences = cnt;
+               /* Copy userq fence info to user space */
+               if (copy_to_user(u64_to_user_ptr(wait_info->userq_fence_info),
+                                fence_info, wait_info->num_fences * sizeof(*fence_info))) {
+                       r = -EFAULT;
+                       goto free_fences;
+               }
+
+               kfree(fences);
+               kfree(fence_info);
+       }
+
+       drm_exec_fini(&exec);
+       for (i = 0; i < num_bo_handles; i++)
+               drm_gem_object_put(gobj[i]);
+       kfree(gobj);
+
+       kfree(syncobj_handles);
+       kfree(bo_handles);
+
+       return 0;
+
+free_fences:
+       while (num_fences-- > 0)
+               dma_fence_put(fences[num_fences]);
+       kfree(fences);
+free_fence_info:
+       kfree(fence_info);
+exec_fini:
+       drm_exec_fini(&exec);
+put_gobj:
+       while (entry-- > 0)
+               drm_gem_object_put(gobj[entry]);
+       kfree(gobj);
+free_syncobj_handles:
+       kfree(syncobj_handles);
+free_bo_handles:
+       kfree(bo_handles);
+
+       return r;
+}
diff --git a/drivers/gpu/drm/amd/amdgpu/amdgpu_userq_fence.h b/drivers/gpu/drm/amd/amdgpu/amdgpu_userq_fence.h

index c3e04cdbb9e72a72b2b6159c2abcbe9e154038cb..f72424248cc52995827455a0ca957b33075fbfd3 100644 (file)
--- a/drivers/gpu/drm/amd/amdgpu/amdgpu_userq_fence.h
+++ b/drivers/gpu/drm/amd/amdgpu/amdgpu_userq_fence.h
@@ -37,7 +37,9 @@ struct amdgpu_userq_fence {
          */
         spinlock_t lock;
         struct list_head link;
+       unsigned long fence_drv_array_count;
         struct amdgpu_userq_fence_driver *fence_drv;
+       struct amdgpu_userq_fence_driver **fence_drv_array;
  };
  
  struct amdgpu_userq_fence_driver {
@@ -52,6 +54,7 @@ struct amdgpu_userq_fence_driver {
         spinlock_t fence_list_lock;
         struct list_head fences;
         struct amdgpu_device *adev;
+       struct xarray *uq_fence_drv_xa_ref;
         char timeline_name[TASK_COMM_LEN];
  };
  
@@ -65,5 +68,9 @@ int amdgpu_userq_fence_driver_alloc(struct amdgpu_device *adev,
                                     struct amdgpu_usermode_queue *userq);
  void amdgpu_userq_fence_driver_process(struct amdgpu_userq_fence_driver *fence_drv);
  void amdgpu_userq_fence_driver_destroy(struct kref *ref);
+int amdgpu_userq_signal_ioctl(struct drm_device *dev, void *data,
+                             struct drm_file *filp);
+int amdgpu_userq_wait_ioctl(struct drm_device *dev, void *data,
+                           struct drm_file *filp);
  
  #endif
diff --git a/drivers/gpu/drm/amd/amdgpu/amdgpu_userqueue.c b/drivers/gpu/drm/amd/amdgpu/amdgpu_userqueue.c

index bcd86c1b3a7575d3a28bc31635944b5edfec7c68..34c1297d797072baa6e2954abac19cd5c9e23a49 100644 (file)
--- a/drivers/gpu/drm/amd/amdgpu/amdgpu_userqueue.c
+++ b/drivers/gpu/drm/amd/amdgpu/amdgpu_userqueue.c
@@ -27,6 +27,32 @@
  #include "amdgpu_userqueue.h"
  #include "amdgpu_userq_fence.h"
  
+static void amdgpu_userq_walk_and_drop_fence_drv(struct xarray *xa)
+{
+       struct amdgpu_userq_fence_driver *fence_drv;
+       unsigned long index;
+
+       if (xa_empty(xa))
+               return;
+
+       xa_lock(xa);
+       xa_for_each(xa, index, fence_drv) {
+               __xa_erase(xa, index);
+               amdgpu_userq_fence_driver_put(fence_drv);
+       }
+
+       xa_unlock(xa);
+}
+
+static void
+amdgpu_userq_fence_driver_free(struct amdgpu_usermode_queue *userq)
+{
+       amdgpu_userq_walk_and_drop_fence_drv(&userq->uq_fence_drv_xa);
+       xa_destroy(&userq->uq_fence_drv_xa);
+       /* Drop the fence_drv reference held by user queue */
+       amdgpu_userq_fence_driver_put(userq->fence_drv);
+}
+
  static void
  amdgpu_userqueue_cleanup(struct amdgpu_userq_mgr *uq_mgr,
                          struct amdgpu_usermode_queue *queue,
@@ -36,7 +62,7 @@ amdgpu_userqueue_cleanup(struct amdgpu_userq_mgr *uq_mgr,
         const struct amdgpu_userq_funcs *uq_funcs = adev->userq_funcs[queue->queue_type];
  
         uq_funcs->mqd_destroy(uq_mgr, queue);
-       amdgpu_userq_fence_driver_put(queue->fence_drv);
+       amdgpu_userq_fence_driver_free(queue);
         idr_remove(&uq_mgr->userq_idr, queue_id);
         kfree(queue);
  }
@@ -234,6 +260,7 @@ amdgpu_userqueue_create(struct drm_file *filp, union drm_amdgpu_userq *args)
         }
         queue->doorbell_index = index;
  
+       xa_init_flags(&queue->uq_fence_drv_xa, XA_FLAGS_ALLOC);
         r = amdgpu_userq_fence_driver_alloc(adev, queue);
         if (r) {
                 DRM_ERROR("Failed to alloc fence driver\n");
diff --git a/drivers/gpu/drm/amd/include/amdgpu_userqueue.h b/drivers/gpu/drm/amd/include/amdgpu_userqueue.h

index 76a59c350c2a2eb7bcb482e5b3e5763d053f3d7b..7df837fedce00dd9b650c1680ff009f2d83e6a1f 100644 (file)
--- a/drivers/gpu/drm/amd/include/amdgpu_userqueue.h
+++ b/drivers/gpu/drm/amd/include/amdgpu_userqueue.h
@@ -47,6 +47,7 @@ struct amdgpu_usermode_queue {
         struct amdgpu_userq_obj db_obj;
         struct amdgpu_userq_obj fw_obj;
         struct amdgpu_userq_obj wptr_obj;
+       struct xarray           uq_fence_drv_xa;
         struct amdgpu_userq_fence_driver *fence_drv;
  };
author	Arunpravin Paneer Selvam <Arunpravin.PaneerSelvam@amd.com>
	Wed, 30 Oct 2024 04:56:07 +0000 (10:26 +0530)
committer	Alex Deucher <alexander.deucher@amd.com>
	Tue, 8 Apr 2025 20:48:16 +0000 (16:48 -0400)
drivers/gpu/drm/amd/amdgpu/amdgpu.h		patch \| blob \| blame \| history
drivers/gpu/drm/amd/amdgpu/amdgpu_drv.c		patch \| blob \| blame \| history
drivers/gpu/drm/amd/amdgpu/amdgpu_userq_fence.c		patch \| blob \| blame \| history
drivers/gpu/drm/amd/amdgpu/amdgpu_userq_fence.h		patch \| blob \| blame \| history
drivers/gpu/drm/amd/amdgpu/amdgpu_userqueue.c		patch \| blob \| blame \| history
drivers/gpu/drm/amd/include/amdgpu_userqueue.h		patch \| blob \| blame \| history