]> git.ipfire.org Git - thirdparty/kernel/linux.git/commit
drm/amdkfd: Fix OOB memory exposure in get_wave_state()
authorSunday Clement <Sunday.Clement@amd.com>
Wed, 13 May 2026 15:22:19 +0000 (11:22 -0400)
committerAlex Deucher <alexander.deucher@amd.com>
Tue, 19 May 2026 16:10:04 +0000 (12:10 -0400)
commit48b13bfbdf94e683cc5b8c5cb35b5af4221e657f
tree8236677b794d2f5e721a5f431574db88693b7655
parentd796558def777f9a9cc274861e06b8b61851b409
drm/amdkfd: Fix OOB memory exposure in get_wave_state()

The get_wave_state() function for v9 trusts cp_hqd_cntl_stack_size and
cp_hqd_cntl_stack_offset values read directly from the MQD, which are
written by GPU microcode and fully attacker-controlled on the
CRIU-restore path (via AMDKFD_IOC_RESTORE_PROCESS with H3).

this leads to an unbounded copy_to_user() that can leak adjacent
GTT/kernel memory. If offset > size, integer underflow produces a ~4 GiB
read length, if size is set to 1 MiB against a 4 KiB allocation, we leak
1 MiB of adjacent kernel memory (other queues' MQDs, ring buffers, KASLR
pointers).

Fix by clamping both cp_hqd_cntl_stack_size to the actual allocated
buffer size (q->ctl_stack_size) and cp_hqd_cntl_stack_offset to the
clamped size before performing arithmetic and copy_to_user().

This ensures we never read beyond the allocated kernel BO regardless of
attacker-supplied MQD field values.

Signed-off-by: Sunday Clement <Sunday.Clement@amd.com>
Acked-by: Alex Deucher <alexander.deucher@amd.com>
Signed-off-by: Alex Deucher <alexander.deucher@amd.com>
(cherry picked from commit 7ef144458f48d5589e36f1b3d83e83db2e5c5ba5)
drivers/gpu/drm/amd/amdkfd/kfd_mqd_manager_v9.c