drm/amdgpu: partially revert "reduce reset time"

author Christian König <christian.koenig@amd.com>

Thu, 12 Dec 2024 15:51:04 +0000 (16:51 +0100)

committer Alex Deucher <alexander.deucher@amd.com>

Wed, 18 Dec 2024 17:39:07 +0000 (12:39 -0500)
author Christian König <christian.koenig@amd.com>
Thu, 12 Dec 2024 15:51:04 +0000 (16:51 +0100)
committer Alex Deucher <alexander.deucher@amd.com>
Wed, 18 Dec 2024 17:39:07 +0000 (12:39 -0500)
diff --git a/drivers/gpu/drm/amd/amdgpu/amdgpu.h b/drivers/gpu/drm/amd/amdgpu/amdgpu.h

index 9f5351c013ffaf4e34a677c33271742920140593..69895fccb474aefae082fee2f6db916f4afd41ab 100644 (file)
--- a/drivers/gpu/drm/amd/amdgpu/amdgpu.h
+++ b/drivers/gpu/drm/amd/amdgpu/amdgpu.h
@@ -1175,7 +1175,6 @@ struct amdgpu_device {
  
         struct work_struct              reset_work;
  
-       bool                            job_hang;
         bool                            dc_enabled;
         /* Mask of active clusters */
         uint32_t                        aid_mask;
diff --git a/drivers/gpu/drm/amd/amdgpu/amdgpu_amdkfd.c b/drivers/gpu/drm/amd/amdgpu/amdgpu_amdkfd.c

index de30143ea51b471268bd7fba5544f90dbbb24bbf..2e5732dfd425ea7a7319f4c27a5f1def190655ac 100644 (file)
--- a/drivers/gpu/drm/amd/amdgpu/amdgpu_amdkfd.c
+++ b/drivers/gpu/drm/amd/amdgpu/amdgpu_amdkfd.c
@@ -836,7 +836,7 @@ int amdgpu_amdkfd_unmap_hiq(struct amdgpu_device *adev, u32 doorbell_off,
         if (!kiq->pmf || !kiq->pmf->kiq_unmap_queues)
                 return -EINVAL;
  
-       if (!kiq_ring->sched.ready || adev->job_hang)
+       if (!kiq_ring->sched.ready || amdgpu_in_reset(adev))
                 return 0;
  
         ring_funcs = kzalloc(sizeof(*ring_funcs), GFP_KERNEL);
diff --git a/drivers/gpu/drm/amd/amdgpu/amdgpu_gfx.c b/drivers/gpu/drm/amd/amdgpu/amdgpu_gfx.c

index 4a4e40dd25d64c2db125fc4524860e3c119ef451..6d5d81f0dc4e7bffa6f7d0e8f2aa0daf60d06199 100644 (file)
--- a/drivers/gpu/drm/amd/amdgpu/amdgpu_gfx.c
+++ b/drivers/gpu/drm/amd/amdgpu/amdgpu_gfx.c
@@ -515,7 +515,7 @@ int amdgpu_gfx_disable_kcq(struct amdgpu_device *adev, int xcc_id)
         if (!kiq->pmf || !kiq->pmf->kiq_unmap_queues)
                 return -EINVAL;
  
-       if (!kiq_ring->sched.ready || adev->job_hang || amdgpu_in_reset(adev))
+       if (!kiq_ring->sched.ready || amdgpu_in_reset(adev))
                 return 0;
  
         spin_lock(&kiq->ring_lock);
@@ -567,7 +567,7 @@ int amdgpu_gfx_disable_kgq(struct amdgpu_device *adev, int xcc_id)
         if (!kiq->pmf || !kiq->pmf->kiq_unmap_queues)
                 return -EINVAL;
  
-       if (!adev->gfx.kiq[0].ring.sched.ready || adev->job_hang)
+       if (!adev->gfx.kiq[0].ring.sched.ready || amdgpu_in_reset(adev))
                 return 0;
  
         if (amdgpu_gfx_is_master_xcc(adev, xcc_id)) {
diff --git a/drivers/gpu/drm/amd/amdgpu/amdgpu_job.c b/drivers/gpu/drm/amd/amdgpu/amdgpu_job.c

index 04691753cabf948288c8e6f4cff1f714d821a986..100f044759435e21ef7c5d14ca88fcc8b18c1c98 100644 (file)
--- a/drivers/gpu/drm/amd/amdgpu/amdgpu_job.c
+++ b/drivers/gpu/drm/amd/amdgpu/amdgpu_job.c
@@ -102,8 +102,6 @@ static enum drm_gpu_sched_stat amdgpu_job_timedout(struct drm_sched_job *s_job)
                 return DRM_GPU_SCHED_STAT_ENODEV;
         }
  
-       adev->job_hang = true;
-
         /*
          * Do the coredump immediately after a job timeout to get a very
          * close dump/snapshot/representation of GPU's current error status
@@ -181,7 +179,6 @@ static enum drm_gpu_sched_stat amdgpu_job_timedout(struct drm_sched_job *s_job)
         }
  
  exit:
-       adev->job_hang = false;
         drm_dev_exit(idx);
         return DRM_GPU_SCHED_STAT_NOMINAL;
  }
diff --git a/drivers/gpu/drm/amd/amdgpu/gfx_v10_0.c b/drivers/gpu/drm/amd/amdgpu/gfx_v10_0.c

index 9484f3b5a9b7b2c54e408697360ac7243c04ee33..003522c2d9027256a8052868789442f8a64483fd 100644 (file)
--- a/drivers/gpu/drm/amd/amdgpu/gfx_v10_0.c
+++ b/drivers/gpu/drm/amd/amdgpu/gfx_v10_0.c
@@ -5957,7 +5957,7 @@ static int gfx_v10_0_cp_gfx_enable(struct amdgpu_device *adev, bool enable)
         else
                 WREG32_SOC15(GC, 0, mmCP_ME_CNTL, tmp);
  
-       if (adev->job_hang && !enable)
+       if (amdgpu_in_reset(adev) && !enable)
                 return 0;
  
         for (i = 0; i < adev->usec_timeout; i++) {
author	Christian König <christian.koenig@amd.com>
	Thu, 12 Dec 2024 15:51:04 +0000 (16:51 +0100)
committer	Alex Deucher <alexander.deucher@amd.com>
	Wed, 18 Dec 2024 17:39:07 +0000 (12:39 -0500)
drivers/gpu/drm/amd/amdgpu/amdgpu.h		patch \| blob \| blame \| history
drivers/gpu/drm/amd/amdgpu/amdgpu_amdkfd.c		patch \| blob \| blame \| history
drivers/gpu/drm/amd/amdgpu/amdgpu_gfx.c		patch \| blob \| blame \| history
drivers/gpu/drm/amd/amdgpu/amdgpu_job.c		patch \| blob \| blame \| history
drivers/gpu/drm/amd/amdgpu/gfx_v10_0.c		patch \| blob \| blame \| history