]> git.ipfire.org Git - thirdparty/linux.git/commitdiff
drm/amdgpu: Handle sg size limit for contiguous allocation
authorPhilip Yang <Philip.Yang@amd.com>
Fri, 19 Apr 2024 20:27:00 +0000 (16:27 -0400)
committerAlex Deucher <alexander.deucher@amd.com>
Tue, 30 Apr 2024 13:58:08 +0000 (09:58 -0400)
Define macro AMDGPU_MAX_SG_SEGMENT_SIZE 2GB, because struct scatterlist
length is unsigned int, and some users of it cast to a signed int, so
every segment of sg table is limited to size 2GB maximum.

For contiguous VRAM allocation, don't limit the max buddy block size in
order to get contiguous VRAM memory. To workaround the sg table segment
size limit, allocate multiple segments if contiguous size is bigger than
AMDGPU_MAX_SG_SEGMENT_SIZE.

Signed-off-by: Philip Yang <Philip.Yang@amd.com>
Reviewed-by: Christian König <christian.koenig@amd.com>
Signed-off-by: Alex Deucher <alexander.deucher@amd.com>
drivers/gpu/drm/amd/amdgpu/amdgpu_vram_mgr.c

index f23002ed2b42ae50020e7e3b9bff44494633b131..eb94f943b28e64d02a19cada2caf5c5a4513be68 100644 (file)
@@ -31,6 +31,8 @@
 #include "amdgpu_atomfirmware.h"
 #include "atom.h"
 
+#define AMDGPU_MAX_SG_SEGMENT_SIZE     (2UL << 30)
+
 struct amdgpu_vram_reservation {
        u64 start;
        u64 size;
@@ -515,9 +517,7 @@ static int amdgpu_vram_mgr_new(struct ttm_resource_manager *man,
                else
                        min_block_size = mgr->default_page_size;
 
-               /* Limit maximum size to 2GiB due to SG table limitations */
-               size = min(remaining_size, 2ULL << 30);
-
+               size = remaining_size;
                if ((size >= (u64)pages_per_block << PAGE_SHIFT) &&
                    !(size & (((u64)pages_per_block << PAGE_SHIFT) - 1)))
                        min_block_size = (u64)pages_per_block << PAGE_SHIFT;
@@ -657,7 +657,7 @@ int amdgpu_vram_mgr_alloc_sgt(struct amdgpu_device *adev,
        amdgpu_res_first(res, offset, length, &cursor);
        while (cursor.remaining) {
                num_entries++;
-               amdgpu_res_next(&cursor, cursor.size);
+               amdgpu_res_next(&cursor, min(cursor.size, AMDGPU_MAX_SG_SEGMENT_SIZE));
        }
 
        r = sg_alloc_table(*sgt, num_entries, GFP_KERNEL);
@@ -677,7 +677,7 @@ int amdgpu_vram_mgr_alloc_sgt(struct amdgpu_device *adev,
        amdgpu_res_first(res, offset, length, &cursor);
        for_each_sgtable_sg((*sgt), sg, i) {
                phys_addr_t phys = cursor.start + adev->gmc.aper_base;
-               size_t size = cursor.size;
+               unsigned long size = min(cursor.size, AMDGPU_MAX_SG_SEGMENT_SIZE);
                dma_addr_t addr;
 
                addr = dma_map_resource(dev, phys, size, dir,
@@ -690,7 +690,7 @@ int amdgpu_vram_mgr_alloc_sgt(struct amdgpu_device *adev,
                sg_dma_address(sg) = addr;
                sg_dma_len(sg) = size;
 
-               amdgpu_res_next(&cursor, cursor.size);
+               amdgpu_res_next(&cursor, size);
        }
 
        return 0;