ksm: use range-walk function to jump over holes in scan_get_next_rmap_item

author Pedro Demarchi Gomes <pedrodemargomes@gmail.com>

Wed, 22 Oct 2025 15:30:59 +0000 (12:30 -0300)

committer Andrew Morton <akpm@linux-foundation.org>

Mon, 10 Nov 2025 05:19:42 +0000 (21:19 -0800)
author Pedro Demarchi Gomes <pedrodemargomes@gmail.com>
Wed, 22 Oct 2025 15:30:59 +0000 (12:30 -0300)
committer Andrew Morton <akpm@linux-foundation.org>
Mon, 10 Nov 2025 05:19:42 +0000 (21:19 -0800)
diff --git a/mm/ksm.c b/mm/ksm.c

index 7bc726b50b2f8c917611ff9f4a41e4611595922d..c4e73040994999507e579b850f81b57f0c0b6055 100644 (file)
--- a/mm/ksm.c
+++ b/mm/ksm.c
@@ -2455,6 +2455,95 @@ static bool should_skip_rmap_item(struct folio *folio,
         return true;
  }
  
+struct ksm_next_page_arg {
+       struct folio *folio;
+       struct page *page;
+       unsigned long addr;
+};
+
+static int ksm_next_page_pmd_entry(pmd_t *pmdp, unsigned long addr, unsigned long end,
+               struct mm_walk *walk)
+{
+       struct ksm_next_page_arg *private = walk->private;
+       struct vm_area_struct *vma = walk->vma;
+       pte_t *start_ptep = NULL, *ptep, pte;
+       struct mm_struct *mm = walk->mm;
+       struct folio *folio;
+       struct page *page;
+       spinlock_t *ptl;
+       pmd_t pmd;
+
+       if (ksm_test_exit(mm))
+               return 0;
+
+       cond_resched();
+
+       pmd = pmdp_get_lockless(pmdp);
+       if (!pmd_present(pmd))
+               return 0;
+
+       if (IS_ENABLED(CONFIG_TRANSPARENT_HUGEPAGE) && pmd_leaf(pmd)) {
+               ptl = pmd_lock(mm, pmdp);
+               pmd = pmdp_get(pmdp);
+
+               if (!pmd_present(pmd)) {
+                       goto not_found_unlock;
+               } else if (pmd_leaf(pmd)) {
+                       page = vm_normal_page_pmd(vma, addr, pmd);
+                       if (!page)
+                               goto not_found_unlock;
+                       folio = page_folio(page);
+
+                       if (folio_is_zone_device(folio) || !folio_test_anon(folio))
+                               goto not_found_unlock;
+
+                       page += ((addr & (PMD_SIZE - 1)) >> PAGE_SHIFT);
+                       goto found_unlock;
+               }
+               spin_unlock(ptl);
+       }
+
+       start_ptep = pte_offset_map_lock(mm, pmdp, addr, &ptl);
+       if (!start_ptep)
+               return 0;
+
+       for (ptep = start_ptep; addr < end; ptep++, addr += PAGE_SIZE) {
+               pte = ptep_get(ptep);
+
+               if (!pte_present(pte))
+                       continue;
+
+               page = vm_normal_page(vma, addr, pte);
+               if (!page)
+                       continue;
+               folio = page_folio(page);
+
+               if (folio_is_zone_device(folio) || !folio_test_anon(folio))
+                       continue;
+               goto found_unlock;
+       }
+
+not_found_unlock:
+       spin_unlock(ptl);
+       if (start_ptep)
+               pte_unmap(start_ptep);
+       return 0;
+found_unlock:
+       folio_get(folio);
+       spin_unlock(ptl);
+       if (start_ptep)
+               pte_unmap(start_ptep);
+       private->page = page;
+       private->folio = folio;
+       private->addr = addr;
+       return 1;
+}
+
+static struct mm_walk_ops ksm_next_page_ops = {
+       .pmd_entry = ksm_next_page_pmd_entry,
+       .walk_lock = PGWALK_RDLOCK,
+};
+
  static struct ksm_rmap_item *scan_get_next_rmap_item(struct page **page)
  {
         struct mm_struct *mm;
@@ -2542,21 +2631,27 @@ next_mm:
                         ksm_scan.address = vma->vm_end;
  
                 while (ksm_scan.address < vma->vm_end) {
+                       struct ksm_next_page_arg ksm_next_page_arg;
                         struct page *tmp_page = NULL;
-                       struct folio_walk fw;
                         struct folio *folio;
  
                         if (ksm_test_exit(mm))
                                 break;
  
-                       folio = folio_walk_start(&fw, vma, ksm_scan.address, 0);
-                       if (folio) {
-                               if (!folio_is_zone_device(folio) &&
-                                    folio_test_anon(folio)) {
-                                       folio_get(folio);
-                                       tmp_page = fw.page;
-                               }
-                               folio_walk_end(&fw, vma);
+                       int found;
+
+                       found = walk_page_range_vma(vma, ksm_scan.address,
+                                                   vma->vm_end,
+                                                   &ksm_next_page_ops,
+                                                   &ksm_next_page_arg);
+
+                       if (found > 0) {
+                               folio = ksm_next_page_arg.folio;
+                               tmp_page = ksm_next_page_arg.page;
+                               ksm_scan.address = ksm_next_page_arg.addr;
+                       } else {
+                               VM_WARN_ON_ONCE(found < 0);
+                               ksm_scan.address = vma->vm_end - PAGE_SIZE;
                         }
  
                         if (tmp_page) {
author	Pedro Demarchi Gomes <pedrodemargomes@gmail.com>
	Wed, 22 Oct 2025 15:30:59 +0000 (12:30 -0300)
committer	Andrew Morton <akpm@linux-foundation.org>
	Mon, 10 Nov 2025 05:19:42 +0000 (21:19 -0800)