md/raid1: ensure device failure recorded before write request returns.

author NeilBrown <neilb@suse.com>

Fri, 14 Aug 2015 01:11:10 +0000 (11:11 +1000)

committer Zefan Li <lizefan@huawei.com>

Wed, 27 Apr 2016 10:55:21 +0000 (18:55 +0800)
author NeilBrown <neilb@suse.com>
Fri, 14 Aug 2015 01:11:10 +0000 (11:11 +1000)
committer Zefan Li <lizefan@huawei.com>
Wed, 27 Apr 2016 10:55:21 +0000 (18:55 +0800)
diff --git a/drivers/md/md.c b/drivers/md/md.c

index a875348e819e344429a4b52726a500eb8ba8adb2..9085ba934df19235aa3eb8469018c0d20c0f2184 100644 (file)
--- a/drivers/md/md.c
+++ b/drivers/md/md.c
@@ -7954,6 +7954,7 @@ int rdev_set_badblocks(struct md_rdev *rdev, sector_t s, int sectors,
                 /* Make sure they get written out promptly */
                 sysfs_notify_dirent_safe(rdev->sysfs_state);
                 set_bit(MD_CHANGE_CLEAN, &rdev->mddev->flags);
+               set_bit(MD_CHANGE_PENDING, &rdev->mddev->flags);
                 md_wakeup_thread(rdev->mddev->thread);
         }
         return rv;
diff --git a/drivers/md/raid1.c b/drivers/md/raid1.c

index 189eedbc3027711a4eb4eadfc10c614c5f2e5523..64d2351c80f5de887ec41cdeff8f84e668218c5f 100644 (file)
--- a/drivers/md/raid1.c
+++ b/drivers/md/raid1.c
@@ -1285,6 +1285,7 @@ static void error(struct mddev *mddev, struct md_rdev *rdev)
                 set_bit(Faulty, &rdev->flags);
         spin_unlock_irqrestore(&conf->device_lock, flags);
         set_bit(MD_CHANGE_DEVS, &mddev->flags);
+       set_bit(MD_CHANGE_PENDING, &mddev->flags);
         printk(KERN_ALERT
                "md/raid1:%s: Disk failure on %s, disabling device.\n"
                "md/raid1:%s: Operation continuing on %d devices.\n",
@@ -2061,6 +2062,7 @@ static void handle_sync_write_finished(struct r1conf *conf, struct r1bio *r1_bio
  static void handle_write_finished(struct r1conf *conf, struct r1bio *r1_bio)
  {
         int m;
+       bool fail = false;
         for (m = 0; m < conf->raid_disks * 2 ; m++)
                 if (r1_bio->bios[m] == IO_MADE_GOOD) {
                         struct md_rdev *rdev = conf->mirrors[m].rdev;
@@ -2073,6 +2075,7 @@ static void handle_write_finished(struct r1conf *conf, struct r1bio *r1_bio)
                          * narrow down and record precise write
                          * errors.
                          */
+                       fail = true;
                         if (!narrow_write_error(r1_bio, m)) {
                                 md_error(conf->mddev,
                                          conf->mirrors[m].rdev);
@@ -2084,7 +2087,13 @@ static void handle_write_finished(struct r1conf *conf, struct r1bio *r1_bio)
                 }
         if (test_bit(R1BIO_WriteError, &r1_bio->state))
                 close_write(r1_bio);
-       raid_end_bio_io(r1_bio);
+       if (fail) {
+               spin_lock_irq(&conf->device_lock);
+               list_add(&r1_bio->retry_list, &conf->bio_end_io_list);
+               spin_unlock_irq(&conf->device_lock);
+               md_wakeup_thread(conf->mddev->thread);
+       } else
+               raid_end_bio_io(r1_bio);
  }
  
  static void handle_read_error(struct r1conf *conf, struct r1bio *r1_bio)
@@ -2187,6 +2196,23 @@ static void raid1d(struct mddev *mddev)
  
         md_check_recovery(mddev);
  
+       if (!list_empty_careful(&conf->bio_end_io_list) &&
+           !test_bit(MD_CHANGE_PENDING, &mddev->flags)) {
+               LIST_HEAD(tmp);
+               spin_lock_irqsave(&conf->device_lock, flags);
+               if (!test_bit(MD_CHANGE_PENDING, &mddev->flags)) {
+                       list_add(&tmp, &conf->bio_end_io_list);
+                       list_del_init(&conf->bio_end_io_list);
+               }
+               spin_unlock_irqrestore(&conf->device_lock, flags);
+               while (!list_empty(&tmp)) {
+                       r1_bio = list_first_entry(&conf->bio_end_io_list,
+                                                 struct r1bio, retry_list);
+                       list_del(&r1_bio->retry_list);
+                       raid_end_bio_io(r1_bio);
+               }
+       }
+
         blk_start_plug(&plug);
         for (;;) {
  
@@ -2596,6 +2622,7 @@ static struct r1conf *setup_conf(struct mddev *mddev)
         conf->raid_disks = mddev->raid_disks;
         conf->mddev = mddev;
         INIT_LIST_HEAD(&conf->retry_list);
+       INIT_LIST_HEAD(&conf->bio_end_io_list);
  
         spin_lock_init(&conf->resync_lock);
         init_waitqueue_head(&conf->wait_barrier);
diff --git a/drivers/md/raid1.h b/drivers/md/raid1.h

index 80ded139314cf8a649729ce8e22915ca11bbd17f..50086cf0eae1d31796e1aea892fd6ade7e8468e4 100644 (file)
--- a/drivers/md/raid1.h
+++ b/drivers/md/raid1.h
@@ -48,6 +48,11 @@ struct r1conf {
          * block, or anything else.
          */
         struct list_head        retry_list;
+       /* A separate list of r1bio which just need raid_end_bio_io called.
+        * This mustn't happen for writes which had any errors if the superblock
+        * needs to be written.
+        */
+       struct list_head        bio_end_io_list;
  
         /* queue pending writes to be submitted on unplug */
         struct bio_list         pending_bio_list;
author	NeilBrown <neilb@suse.com>
	Fri, 14 Aug 2015 01:11:10 +0000 (11:11 +1000)
committer	Zefan Li <lizefan@huawei.com>
	Wed, 27 Apr 2016 10:55:21 +0000 (18:55 +0800)
drivers/md/md.c		patch \| blob \| blame \| history
drivers/md/raid1.c		patch \| blob \| blame \| history
drivers/md/raid1.h		patch \| blob \| blame \| history