]> git.ipfire.org Git - people/arne_f/kernel.git/commit
md/raid10: close race that lose writes lost when replacement completes.
authorNeilBrown <neilb@suse.de>
Thu, 22 Nov 2012 03:42:49 +0000 (14:42 +1100)
committerGreg Kroah-Hartman <gregkh@linuxfoundation.org>
Mon, 10 Dec 2012 18:59:40 +0000 (10:59 -0800)
commitf3921710aa40ae72bd2580282548f763b008a1d0
treef622dc7bf80f31334bb9849876fe45a03d92a879
parentdbdd7f0c98e8ee0d49da5e8b462ad2ba07d0f358
md/raid10: close race that lose writes lost when replacement completes.

commit e7c0c3fa29280d62aa5e11101a674bb3064bd791 upstream.

When a replacement operation completes there is a small window
when the original device is marked 'faulty' and the replacement
still looks like a replacement.  The faulty should be removed and
the replacement moved in place very quickly, bit it isn't instant.

So the code write out to the array must handle the possibility that
the only working device for some slot in the replacement - but it
doesn't.  If the primary device is faulty it just gives up.  This
can lead to corruption.

So make the code more robust: if either  the primary or the
replacement is present and working, write to them.  Only when
neither are present do we give up.

This bug has been present since replacement was introduced in
3.3, so it is suitable for any -stable kernel since then.

Reported-by: "George Spelvin" <linux@horizon.com>
Signed-off-by: NeilBrown <neilb@suse.de>
Signed-off-by: Greg Kroah-Hartman <gregkh@linuxfoundation.org>
drivers/md/raid10.c