RISC-V: KVM: Batch stage-2 TLB flushes

author Jinyu Tang <tjytimi@163.com>

Sun, 12 Apr 2026 02:38:22 +0000 (10:38 +0800)

committer Anup Patel <anup@brainfault.org>

Sun, 31 May 2026 15:25:35 +0000 (20:55 +0530)
author Jinyu Tang <tjytimi@163.com>
Sun, 12 Apr 2026 02:38:22 +0000 (10:38 +0800)
committer Anup Patel <anup@brainfault.org>
Sun, 31 May 2026 15:25:35 +0000 (20:55 +0530)
diff --git a/arch/riscv/include/asm/kvm_gstage.h b/arch/riscv/include/asm/kvm_gstage.h

index 9c908432bc173b80c766fe89b051debc7c185463..f820c6783e16302c4872bdce876c2b30e3c4bae6 100644 (file)
--- a/arch/riscv/include/asm/kvm_gstage.h
+++ b/arch/riscv/include/asm/kvm_gstage.h
@@ -70,13 +70,13 @@ enum kvm_riscv_gstage_op {
         GSTAGE_OP_WP,           /* Write-protect */
  };
  
-void kvm_riscv_gstage_op_pte(struct kvm_gstage *gstage, gpa_t addr,
+bool kvm_riscv_gstage_op_pte(struct kvm_gstage *gstage, gpa_t addr,
                              pte_t *ptep, u32 ptep_level, enum kvm_riscv_gstage_op op);
  
-void kvm_riscv_gstage_unmap_range(struct kvm_gstage *gstage,
+bool kvm_riscv_gstage_unmap_range(struct kvm_gstage *gstage,
                                   gpa_t start, gpa_t size, bool may_block);
  
-void kvm_riscv_gstage_wp_range(struct kvm_gstage *gstage, gpa_t start, gpa_t end);
+bool kvm_riscv_gstage_wp_range(struct kvm_gstage *gstage, gpa_t start, gpa_t end);
  
  void kvm_riscv_gstage_mode_detect(void);
  
diff --git a/arch/riscv/kvm/gstage.c b/arch/riscv/kvm/gstage.c

index d9fe8be2a15169318d5c9cc29fcfeaf9e084eb1c..e020b334ae6f0dcfd02e3ca5a4b051346346d2c8 100644 (file)
--- a/arch/riscv/kvm/gstage.c
+++ b/arch/riscv/kvm/gstage.c
@@ -337,35 +337,36 @@ int kvm_riscv_gstage_split_huge(struct kvm_gstage *gstage,
         return 0;
  }
  
-void kvm_riscv_gstage_op_pte(struct kvm_gstage *gstage, gpa_t addr,
+bool kvm_riscv_gstage_op_pte(struct kvm_gstage *gstage, gpa_t addr,
                              pte_t *ptep, u32 ptep_level, enum kvm_riscv_gstage_op op)
  {
         int i, ret;
         pte_t old_pte, *next_ptep;
         u32 next_ptep_level;
         unsigned long next_page_size, page_size;
+       bool flush = false;
  
         ret = gstage_level_to_page_size(gstage, ptep_level, &page_size);
         if (ret)
-               return;
+               return false;
  
         WARN_ON(addr & (page_size - 1));
  
         if (!pte_val(ptep_get(ptep)))
-               return;
+               return false;
  
         if (ptep_level && !gstage_pte_leaf(ptep)) {
                 next_ptep = (pte_t *)gstage_pte_page_vaddr(ptep_get(ptep));
                 next_ptep_level = ptep_level - 1;
                 ret = gstage_level_to_page_size(gstage, next_ptep_level, &next_page_size);
                 if (ret)
-                       return;
+                       return false;
  
                 if (op == GSTAGE_OP_CLEAR)
                         set_pte(ptep, __pte(0));
                 for (i = 0; i < PTRS_PER_PTE; i++)
-                       kvm_riscv_gstage_op_pte(gstage, addr + i * next_page_size,
-                                               &next_ptep[i], next_ptep_level, op);
+                       flush |= kvm_riscv_gstage_op_pte(gstage, addr + i * next_page_size,
+                                                        &next_ptep[i], next_ptep_level, op);
                 if (op == GSTAGE_OP_CLEAR)
                         put_page(virt_to_page(next_ptep));
         } else {
@@ -375,11 +376,13 @@ void kvm_riscv_gstage_op_pte(struct kvm_gstage *gstage, gpa_t addr,
                 else if (op == GSTAGE_OP_WP)
                         set_pte(ptep, __pte(pte_val(ptep_get(ptep)) & ~_PAGE_WRITE));
                 if (pte_val(*ptep) != pte_val(old_pte))
-                       gstage_tlb_flush(gstage, ptep_level, addr);
+                       flush = true;
         }
+
+       return flush;
  }
  
-void kvm_riscv_gstage_unmap_range(struct kvm_gstage *gstage,
+bool kvm_riscv_gstage_unmap_range(struct kvm_gstage *gstage,
                                   gpa_t start, gpa_t size, bool may_block)
  {
         int ret;
@@ -388,6 +391,7 @@ void kvm_riscv_gstage_unmap_range(struct kvm_gstage *gstage,
         bool found_leaf;
         unsigned long page_size;
         gpa_t addr = start, end = start + size;
+       bool flush = false;
  
         while (addr < end) {
                 found_leaf = kvm_riscv_gstage_get_leaf(gstage, addr, &ptep, &ptep_level);
@@ -399,8 +403,8 @@ void kvm_riscv_gstage_unmap_range(struct kvm_gstage *gstage,
                         goto next;
  
                 if (!(addr & (page_size - 1)) && ((end - addr) >= page_size))
-                       kvm_riscv_gstage_op_pte(gstage, addr, ptep,
-                                               ptep_level, GSTAGE_OP_CLEAR);
+                       flush |= kvm_riscv_gstage_op_pte(gstage, addr, ptep,
+                                                        ptep_level, GSTAGE_OP_CLEAR);
  
  next:
                 addr += page_size;
@@ -412,9 +416,11 @@ next:
                 if (!(gstage->flags & KVM_GSTAGE_FLAGS_LOCAL) && may_block && addr < end)
                         cond_resched_lock(&gstage->kvm->mmu_lock);
         }
+
+       return flush;
  }
  
-void kvm_riscv_gstage_wp_range(struct kvm_gstage *gstage, gpa_t start, gpa_t end)
+bool kvm_riscv_gstage_wp_range(struct kvm_gstage *gstage, gpa_t start, gpa_t end)
  {
         int ret;
         pte_t *ptep;
@@ -422,6 +428,7 @@ void kvm_riscv_gstage_wp_range(struct kvm_gstage *gstage, gpa_t start, gpa_t end
         bool found_leaf;
         gpa_t addr = start;
         unsigned long page_size;
+       bool flush = false;
  
         while (addr < end) {
                 found_leaf = kvm_riscv_gstage_get_leaf(gstage, addr, &ptep, &ptep_level);
@@ -433,11 +440,13 @@ void kvm_riscv_gstage_wp_range(struct kvm_gstage *gstage, gpa_t start, gpa_t end
                         goto next;
  
                 addr = ALIGN_DOWN(addr, page_size);
-               kvm_riscv_gstage_op_pte(gstage, addr, ptep,
-                                       ptep_level, GSTAGE_OP_WP);
+               flush |= kvm_riscv_gstage_op_pte(gstage, addr, ptep,
+                                                ptep_level, GSTAGE_OP_WP);
  next:
                 addr += page_size;
         }
+
+       return flush;
  }
  
  void __init kvm_riscv_gstage_mode_detect(void)
diff --git a/arch/riscv/kvm/mmu.c b/arch/riscv/kvm/mmu.c

index 2d3def024270c0cf65621c984fd413cf1c7c8c3d..8469ed9324211e507a83e274f88d8938c58b6c2c 100644 (file)
--- a/arch/riscv/kvm/mmu.c
+++ b/arch/riscv/kvm/mmu.c
@@ -23,13 +23,15 @@ static void mmu_wp_memory_region(struct kvm *kvm, int slot)
         phys_addr_t start = memslot->base_gfn << PAGE_SHIFT;
         phys_addr_t end = (memslot->base_gfn + memslot->npages) << PAGE_SHIFT;
         struct kvm_gstage gstage;
+       bool flush;
  
         kvm_riscv_gstage_init(&gstage, kvm);
  
         spin_lock(&kvm->mmu_lock);
-       kvm_riscv_gstage_wp_range(&gstage, start, end);
+       flush = kvm_riscv_gstage_wp_range(&gstage, start, end);
         spin_unlock(&kvm->mmu_lock);
-       kvm_flush_remote_tlbs_memslot(kvm, memslot);
+       if (flush)
+               kvm_flush_remote_tlbs_memslot(kvm, memslot);
  }
  
  int kvm_riscv_mmu_ioremap(struct kvm *kvm, gpa_t gpa, phys_addr_t hpa,
@@ -82,12 +84,17 @@ out:
  void kvm_riscv_mmu_iounmap(struct kvm *kvm, gpa_t gpa, unsigned long size)
  {
         struct kvm_gstage gstage;
+       bool flush;
  
         kvm_riscv_gstage_init(&gstage, kvm);
  
         spin_lock(&kvm->mmu_lock);
-       kvm_riscv_gstage_unmap_range(&gstage, gpa, size, false);
+       flush = kvm_riscv_gstage_unmap_range(&gstage, gpa, size, false);
         spin_unlock(&kvm->mmu_lock);
+
+       if (flush)
+               kvm_flush_remote_tlbs_range(kvm, gpa >> PAGE_SHIFT,
+                                           size >> PAGE_SHIFT);
  }
  
  void kvm_arch_mmu_enable_log_dirty_pt_masked(struct kvm *kvm,
@@ -99,10 +106,14 @@ void kvm_arch_mmu_enable_log_dirty_pt_masked(struct kvm *kvm,
         phys_addr_t start = (base_gfn +  __ffs(mask)) << PAGE_SHIFT;
         phys_addr_t end = (base_gfn + __fls(mask) + 1) << PAGE_SHIFT;
         struct kvm_gstage gstage;
+       bool flush;
  
         kvm_riscv_gstage_init(&gstage, kvm);
  
-       kvm_riscv_gstage_wp_range(&gstage, start, end);
+       flush = kvm_riscv_gstage_wp_range(&gstage, start, end);
+       if (flush)
+               kvm_flush_remote_tlbs_range(kvm, start >> PAGE_SHIFT,
+                                           (end - start) >> PAGE_SHIFT);
  }
  
  void kvm_arch_sync_dirty_log(struct kvm *kvm, struct kvm_memory_slot *memslot)
@@ -128,12 +139,16 @@ void kvm_arch_flush_shadow_memslot(struct kvm *kvm,
         gpa_t gpa = slot->base_gfn << PAGE_SHIFT;
         phys_addr_t size = slot->npages << PAGE_SHIFT;
         struct kvm_gstage gstage;
+       bool flush;
  
         kvm_riscv_gstage_init(&gstage, kvm);
  
         spin_lock(&kvm->mmu_lock);
-       kvm_riscv_gstage_unmap_range(&gstage, gpa, size, false);
+       flush = kvm_riscv_gstage_unmap_range(&gstage, gpa, size, false);
         spin_unlock(&kvm->mmu_lock);
+       if (flush)
+               kvm_flush_remote_tlbs_range(kvm, gpa >> PAGE_SHIFT,
+                                           size >> PAGE_SHIFT);
  }
  
  void kvm_arch_commit_memory_region(struct kvm *kvm,
@@ -231,17 +246,24 @@ bool kvm_unmap_gfn_range(struct kvm *kvm, struct kvm_gfn_range *range)
  {
         struct kvm_gstage gstage;
         bool mmu_locked;
+       bool flush;
  
         if (!kvm->arch.pgd)
                 return false;
  
         kvm_riscv_gstage_init(&gstage, kvm);
         mmu_locked = spin_trylock(&kvm->mmu_lock);
-       kvm_riscv_gstage_unmap_range(&gstage, range->start << PAGE_SHIFT,
-                                    (range->end - range->start) << PAGE_SHIFT,
-                                    range->may_block);
+
+       flush = kvm_riscv_gstage_unmap_range(&gstage, range->start << PAGE_SHIFT,
+                                            (range->end - range->start) << PAGE_SHIFT,
+                                            range->may_block);
+
         if (mmu_locked)
                 spin_unlock(&kvm->mmu_lock);
+
+       if (flush)
+               kvm_flush_remote_tlbs_range(kvm, range->start,
+                                           range->end - range->start);
         return false;
  }
  
@@ -557,11 +579,12 @@ void kvm_riscv_mmu_free_pgd(struct kvm *kvm)
  {
         struct kvm_gstage gstage;
         void *pgd = NULL;
+       bool flush = false;
  
         spin_lock(&kvm->mmu_lock);
         if (kvm->arch.pgd) {
                 kvm_riscv_gstage_init(&gstage, kvm);
-               kvm_riscv_gstage_unmap_range(&gstage, 0UL,
+               flush = kvm_riscv_gstage_unmap_range(&gstage, 0UL,
                         kvm_riscv_gstage_gpa_size(kvm->arch.pgd_levels), false);
                 pgd = READ_ONCE(kvm->arch.pgd);
                 kvm->arch.pgd = NULL;
@@ -570,6 +593,9 @@ void kvm_riscv_mmu_free_pgd(struct kvm *kvm)
         }
         spin_unlock(&kvm->mmu_lock);
  
+       if (flush)
+               kvm_flush_remote_tlbs(kvm);
+
         if (pgd)
                 free_pages((unsigned long)pgd, get_order(kvm_riscv_gstage_pgd_size));
  }
author	Jinyu Tang <tjytimi@163.com>
	Sun, 12 Apr 2026 02:38:22 +0000 (10:38 +0800)
committer	Anup Patel <anup@brainfault.org>
	Sun, 31 May 2026 15:25:35 +0000 (20:55 +0530)
arch/riscv/include/asm/kvm_gstage.h		patch \| blob \| blame \| history
arch/riscv/kvm/gstage.c		patch \| blob \| blame \| history
arch/riscv/kvm/mmu.c		patch \| blob \| blame \| history