]> git.ipfire.org Git - thirdparty/kernel/stable.git/commitdiff
KVM: s390x: fix SCK locking
authorClaudio Imbrenda <imbrenda@linux.ibm.com>
Tue, 1 Mar 2022 14:33:40 +0000 (15:33 +0100)
committerGreg Kroah-Hartman <gregkh@linuxfoundation.org>
Wed, 16 Nov 2022 08:57:10 +0000 (09:57 +0100)
[ Upstream commit c0573ba5c5a2244dc02060b1f374d4593c1d20b7 ]

When handling the SCK instruction, the kvm lock is taken, even though
the vcpu lock is already being held. The normal locking order is kvm
lock first and then vcpu lock. This is can (and in some circumstances
does) lead to deadlocks.

The function kvm_s390_set_tod_clock is called both by the SCK handler
and by some IOCTLs to set the clock. The IOCTLs will not hold the vcpu
lock, so they can safely take the kvm lock. The SCK handler holds the
vcpu lock, but will also somehow need to acquire the kvm lock without
relinquishing the vcpu lock.

The solution is to factor out the code to set the clock, and provide
two wrappers. One is called like the original function and does the
locking, the other is called kvm_s390_try_set_tod_clock and uses
trylock to try to acquire the kvm lock. This new wrapper is then used
in the SCK handler. If locking fails, -EAGAIN is returned, which is
eventually propagated to userspace, thus also freeing the vcpu lock and
allowing for forward progress.

This is not the most efficient or elegant way to solve this issue, but
the SCK instruction is deprecated and its performance is not critical.

The goal of this patch is just to provide a simple but correct way to
fix the bug.

Fixes: 6a3f95a6b04c ("KVM: s390: Intercept SCK instruction")
Signed-off-by: Claudio Imbrenda <imbrenda@linux.ibm.com>
Reviewed-by: Christian Borntraeger <borntraeger@linux.ibm.com>
Reviewed-by: Janis Schoetterl-Glausch <scgl@linux.ibm.com>
Link: https://lore.kernel.org/r/20220301143340.111129-1-imbrenda@linux.ibm.com
Cc: stable@vger.kernel.org
Signed-off-by: Christian Borntraeger <borntraeger@linux.ibm.com>
Stable-dep-of: 6973091d1b50 ("KVM: s390: pv: don't allow userspace to set the clock under PV")
Signed-off-by: Sasha Levin <sashal@kernel.org>
arch/s390/kvm/kvm-s390.c
arch/s390/kvm/kvm-s390.h
arch/s390/kvm/priv.c

index d8e9239c24ffc62c91a0f280fe5bddd89029a664..d12042ab5d544e26f08426548b41ed7daa8af001 100644 (file)
@@ -3862,14 +3862,12 @@ retry:
        return 0;
 }
 
-void kvm_s390_set_tod_clock(struct kvm *kvm,
-                           const struct kvm_s390_vm_tod_clock *gtod)
+static void __kvm_s390_set_tod_clock(struct kvm *kvm, const struct kvm_s390_vm_tod_clock *gtod)
 {
        struct kvm_vcpu *vcpu;
        struct kvm_s390_tod_clock_ext htod;
        int i;
 
-       mutex_lock(&kvm->lock);
        preempt_disable();
 
        get_tod_clock_ext((char *)&htod);
@@ -3890,7 +3888,22 @@ void kvm_s390_set_tod_clock(struct kvm *kvm,
 
        kvm_s390_vcpu_unblock_all(kvm);
        preempt_enable();
+}
+
+void kvm_s390_set_tod_clock(struct kvm *kvm, const struct kvm_s390_vm_tod_clock *gtod)
+{
+       mutex_lock(&kvm->lock);
+       __kvm_s390_set_tod_clock(kvm, gtod);
+       mutex_unlock(&kvm->lock);
+}
+
+int kvm_s390_try_set_tod_clock(struct kvm *kvm, const struct kvm_s390_vm_tod_clock *gtod)
+{
+       if (!mutex_trylock(&kvm->lock))
+               return 0;
+       __kvm_s390_set_tod_clock(kvm, gtod);
        mutex_unlock(&kvm->lock);
+       return 1;
 }
 
 /**
index a3e9b71d426f9313ac3764c034c0e8aa85293480..80bfe9c3364a628a333dd97c9d72eec6dc87ca7b 100644 (file)
@@ -326,8 +326,8 @@ int kvm_s390_handle_sigp(struct kvm_vcpu *vcpu);
 int kvm_s390_handle_sigp_pei(struct kvm_vcpu *vcpu);
 
 /* implemented in kvm-s390.c */
-void kvm_s390_set_tod_clock(struct kvm *kvm,
-                           const struct kvm_s390_vm_tod_clock *gtod);
+void kvm_s390_set_tod_clock(struct kvm *kvm, const struct kvm_s390_vm_tod_clock *gtod);
+int kvm_s390_try_set_tod_clock(struct kvm *kvm, const struct kvm_s390_vm_tod_clock *gtod);
 long kvm_arch_fault_in_page(struct kvm_vcpu *vcpu, gpa_t gpa, int writable);
 int kvm_s390_store_status_unloaded(struct kvm_vcpu *vcpu, unsigned long addr);
 int kvm_s390_vcpu_store_status(struct kvm_vcpu *vcpu, unsigned long addr);
index 3b1a498e58d25d7273e515a8e09e0e1debbac3a5..e34d518dd3d395e899d35000ba840502d56cc769 100644 (file)
@@ -102,7 +102,20 @@ static int handle_set_clock(struct kvm_vcpu *vcpu)
                return kvm_s390_inject_prog_cond(vcpu, rc);
 
        VCPU_EVENT(vcpu, 3, "SCK: setting guest TOD to 0x%llx", gtod.tod);
-       kvm_s390_set_tod_clock(vcpu->kvm, &gtod);
+       /*
+        * To set the TOD clock the kvm lock must be taken, but the vcpu lock
+        * is already held in handle_set_clock. The usual lock order is the
+        * opposite.  As SCK is deprecated and should not be used in several
+        * cases, for example when the multiple epoch facility or TOD clock
+        * steering facility is installed (see Principles of Operation),  a
+        * slow path can be used.  If the lock can not be taken via try_lock,
+        * the instruction will be retried via -EAGAIN at a later point in
+        * time.
+        */
+       if (!kvm_s390_try_set_tod_clock(vcpu->kvm, &gtod)) {
+               kvm_s390_retry_instr(vcpu);
+               return -EAGAIN;
+       }
 
        kvm_s390_set_psw_cc(vcpu, 0);
        return 0;