drm/amdgpu: Optimize VM invalidation engine allocation and synchronize GPU TLB flush

author Jesse.zhang@amd.com <Jesse.zhang@amd.com>

Tue, 25 Feb 2025 07:25:00 +0000 (15:25 +0800)

committer Alex Deucher <alexander.deucher@amd.com>

Fri, 21 Mar 2025 16:16:35 +0000 (12:16 -0400)
author Jesse.zhang@amd.com <Jesse.zhang@amd.com>
Tue, 25 Feb 2025 07:25:00 +0000 (15:25 +0800)
committer Alex Deucher <alexander.deucher@amd.com>
Fri, 21 Mar 2025 16:16:35 +0000 (12:16 -0400)
diff --git a/drivers/gpu/drm/amd/amdgpu/amdgpu_gmc.c b/drivers/gpu/drm/amd/amdgpu/amdgpu_gmc.c

index 4eefa17fa39bdcedb09146003753dc276f04616e..464625282872aadeff85ea3b3ce1e1e6c9424a2a 100644 (file)
--- a/drivers/gpu/drm/amd/amdgpu/amdgpu_gmc.c
+++ b/drivers/gpu/drm/amd/amdgpu/amdgpu_gmc.c
@@ -573,6 +573,7 @@ int amdgpu_gmc_allocate_vm_inv_eng(struct amdgpu_device *adev)
         unsigned vm_inv_engs[AMDGPU_MAX_VMHUBS] = {0};
         unsigned i;
         unsigned vmhub, inv_eng;
+       struct amdgpu_ring *shared_ring;
  
         /* init the vm inv eng for all vmhubs */
         for_each_set_bit(i, adev->vmhubs_mask, AMDGPU_MAX_VMHUBS) {
@@ -595,6 +596,10 @@ int amdgpu_gmc_allocate_vm_inv_eng(struct amdgpu_device *adev)
                     ring == &adev->cper.ring_buf)
                         continue;
  
+               /* Skip if the ring is a shared ring */
+               if (amdgpu_sdma_is_shared_inv_eng(adev, ring))
+                       continue;
+
                 inv_eng = ffs(vm_inv_engs[vmhub]);
                 if (!inv_eng) {
                         dev_err(adev->dev, "no VM inv eng for ring %s\n",
@@ -607,6 +612,21 @@ int amdgpu_gmc_allocate_vm_inv_eng(struct amdgpu_device *adev)
  
                 dev_info(adev->dev, "ring %s uses VM inv eng %u on hub %u\n",
                          ring->name, ring->vm_inv_eng, ring->vm_hub);
+               /* SDMA has a special packet which allows it to use the same
+                * invalidation engine for all the rings in one instance.
+                * Therefore, we do not allocate a separate VM invalidation engine
+                * for SDMA page rings. Instead, they share the VM invalidation
+                * engine with the SDMA gfx ring. This change ensures efficient
+                * resource management and avoids the issue of insufficient VM
+                * invalidation engines.
+                */
+               shared_ring = amdgpu_sdma_get_shared_ring(adev, ring);
+               if (shared_ring) {
+                       shared_ring->vm_inv_eng = ring->vm_inv_eng;
+                       dev_info(adev->dev, "ring %s shares VM invalidation engine %u with ring %s on hub %u\n",
+                                       ring->name, ring->vm_inv_eng, shared_ring->name, ring->vm_hub);
+                       continue;
+               }
         }
  
         return 0;
diff --git a/drivers/gpu/drm/amd/amdgpu/amdgpu_sdma.c b/drivers/gpu/drm/amd/amdgpu/amdgpu_sdma.c

index 476e93cc5626d97283850235fb6d7db8228f28dc..529c9696c2f32a4057b1d689d0e3b8567ec2b0dd 100644 (file)
--- a/drivers/gpu/drm/amd/amdgpu/amdgpu_sdma.c
+++ b/drivers/gpu/drm/amd/amdgpu/amdgpu_sdma.c
@@ -504,6 +504,39 @@ void amdgpu_sdma_sysfs_reset_mask_fini(struct amdgpu_device *adev)
         }
  }
  
+struct amdgpu_ring *amdgpu_sdma_get_shared_ring(struct amdgpu_device *adev, struct amdgpu_ring *ring)
+{
+       if (adev->sdma.has_page_queue &&
+           (ring->me < adev->sdma.num_instances) &&
+           (ring == &adev->sdma.instance[ring->me].ring))
+               return &adev->sdma.instance[ring->me].page;
+       else
+               return NULL;
+}
+
+/**
+* amdgpu_sdma_is_shared_inv_eng - Check if a ring is an SDMA ring that shares a VM invalidation engine
+* @adev: Pointer to the AMDGPU device structure
+* @ring: Pointer to the ring structure to check
+*
+* This function checks if the given ring is an SDMA ring that shares a VM invalidation engine.
+* It returns true if the ring is such an SDMA ring, false otherwise.
+*/
+bool amdgpu_sdma_is_shared_inv_eng(struct amdgpu_device *adev, struct amdgpu_ring *ring)
+{
+       int i = ring->me;
+
+       if (!adev->sdma.has_page_queue || i >= adev->sdma.num_instances)
+               return false;
+
+       if (amdgpu_ip_version(adev, GC_HWIP, 0) == IP_VERSION(9, 4, 3) ||
+           amdgpu_ip_version(adev, GC_HWIP, 0) == IP_VERSION(9, 4, 4) ||
+           amdgpu_ip_version(adev, GC_HWIP, 0) == IP_VERSION(9, 5, 0))
+               return (ring == &adev->sdma.instance[i].page);
+       else
+               return false;
+}
+
  /**
   * amdgpu_sdma_register_on_reset_callbacks - Register SDMA reset callbacks
   * @funcs: Pointer to the callback structure containing pre_reset and post_reset functions
@@ -544,7 +577,7 @@ int amdgpu_sdma_reset_engine(struct amdgpu_device *adev, uint32_t instance_id)
  {
         struct sdma_on_reset_funcs *funcs;
         int ret = 0;
-       struct amdgpu_sdma_instance *sdma_instance = &adev->sdma.instance[instance_id];;
+       struct amdgpu_sdma_instance *sdma_instance = &adev->sdma.instance[instance_id];
         struct amdgpu_ring *gfx_ring = &sdma_instance->ring;
         struct amdgpu_ring *page_ring = &sdma_instance->page;
         bool gfx_sched_stopped = false, page_sched_stopped = false;
diff --git a/drivers/gpu/drm/amd/amdgpu/amdgpu_sdma.h b/drivers/gpu/drm/amd/amdgpu/amdgpu_sdma.h

index dc1a81c2f9af7a8246dc5da59a48f772af3daed7..47d56fd0589fc1c4677bf2578bf90cba09cd33a3 100644 (file)
--- a/drivers/gpu/drm/amd/amdgpu/amdgpu_sdma.h
+++ b/drivers/gpu/drm/amd/amdgpu/amdgpu_sdma.h
@@ -196,4 +196,7 @@ int amdgpu_sdma_ras_sw_init(struct amdgpu_device *adev);
  void amdgpu_debugfs_sdma_sched_mask_init(struct amdgpu_device *adev);
  int amdgpu_sdma_sysfs_reset_mask_init(struct amdgpu_device *adev);
  void amdgpu_sdma_sysfs_reset_mask_fini(struct amdgpu_device *adev);
+bool amdgpu_sdma_is_shared_inv_eng(struct amdgpu_device *adev, struct amdgpu_ring *ring);
+struct amdgpu_ring *amdgpu_sdma_get_shared_ring(struct amdgpu_device *adev,
+       struct amdgpu_ring *ring);
  #endif
author	Jesse.zhang@amd.com <Jesse.zhang@amd.com>
	Tue, 25 Feb 2025 07:25:00 +0000 (15:25 +0800)
committer	Alex Deucher <alexander.deucher@amd.com>
	Fri, 21 Mar 2025 16:16:35 +0000 (12:16 -0400)
drivers/gpu/drm/amd/amdgpu/amdgpu_gmc.c		patch \| blob \| blame \| history
drivers/gpu/drm/amd/amdgpu/amdgpu_sdma.c		patch \| blob \| blame \| history
drivers/gpu/drm/amd/amdgpu/amdgpu_sdma.h		patch \| blob \| blame \| history