drm/amdgpu: Report individual reset error

author Lijo Lazar <lijo.lazar@amd.com>

Mon, 6 Oct 2025 05:09:03 +0000 (10:39 +0530)

committer Greg Kroah-Hartman <gregkh@linuxfoundation.org>

Thu, 13 Nov 2025 20:37:39 +0000 (15:37 -0500)
author Lijo Lazar <lijo.lazar@amd.com>
Mon, 6 Oct 2025 05:09:03 +0000 (10:39 +0530)
committer Greg Kroah-Hartman <gregkh@linuxfoundation.org>
Thu, 13 Nov 2025 20:37:39 +0000 (15:37 -0500)
diff --git a/drivers/gpu/drm/amd/amdgpu/amdgpu_device.c b/drivers/gpu/drm/amd/amdgpu/amdgpu_device.c

index 1115af343e01351fdd41deaa9f0f47826990f2c8..ddd0e7ab82be7eb2db0555890188eeef96e3e46e 100644 (file)
--- a/drivers/gpu/drm/amd/amdgpu/amdgpu_device.c
+++ b/drivers/gpu/drm/amd/amdgpu/amdgpu_device.c
@@ -6337,23 +6337,28 @@ static int amdgpu_device_sched_resume(struct list_head *device_list,
                 if (!drm_drv_uses_atomic_modeset(adev_to_drm(tmp_adev)) && !job_signaled)
                         drm_helper_resume_force_mode(adev_to_drm(tmp_adev));
  
-               if (tmp_adev->asic_reset_res)
-                       r = tmp_adev->asic_reset_res;
-
-               tmp_adev->asic_reset_res = 0;
-
-               if (r) {
+               if (tmp_adev->asic_reset_res) {
                         /* bad news, how to tell it to userspace ?
                          * for ras error, we should report GPU bad status instead of
                          * reset failure
                          */
                         if (reset_context->src != AMDGPU_RESET_SRC_RAS ||
                             !amdgpu_ras_eeprom_check_err_threshold(tmp_adev))
-                               dev_info(tmp_adev->dev, "GPU reset(%d) failed\n",
-                                       atomic_read(&tmp_adev->gpu_reset_counter));
-                       amdgpu_vf_error_put(tmp_adev, AMDGIM_ERROR_VF_GPU_RESET_FAIL, 0, r);
+                               dev_info(
+                                       tmp_adev->dev,
+                                       "GPU reset(%d) failed with error %d \n",
+                                       atomic_read(
+                                               &tmp_adev->gpu_reset_counter),
+                                       tmp_adev->asic_reset_res);
+                       amdgpu_vf_error_put(tmp_adev,
+                                           AMDGIM_ERROR_VF_GPU_RESET_FAIL, 0,
+                                           tmp_adev->asic_reset_res);
+                       if (!r)
+                               r = tmp_adev->asic_reset_res;
+                       tmp_adev->asic_reset_res = 0;
                 } else {
-                       dev_info(tmp_adev->dev, "GPU reset(%d) succeeded!\n", atomic_read(&tmp_adev->gpu_reset_counter));
+                       dev_info(tmp_adev->dev, "GPU reset(%d) succeeded!\n",
+                                atomic_read(&tmp_adev->gpu_reset_counter));
                         if (amdgpu_acpi_smart_shift_update(tmp_adev,
                                                            AMDGPU_SS_DEV_D0))
                                 dev_warn(tmp_adev->dev,
author	Lijo Lazar <lijo.lazar@amd.com>
	Mon, 6 Oct 2025 05:09:03 +0000 (10:39 +0530)
committer	Greg Kroah-Hartman <gregkh@linuxfoundation.org>
	Thu, 13 Nov 2025 20:37:39 +0000 (15:37 -0500)