]> git.ipfire.org Git - thirdparty/mdadm.git/blobdiff - super1.c
Add tests/05r1-internalbitmap-v1a
[thirdparty/mdadm.git] / super1.c
index 31cf9a378769b9584dccbed83fb2752976ae364d..170c52ccc5926fcaccfbf25d2c72716b5cea7cdc 100644 (file)
--- a/super1.c
+++ b/super1.c
@@ -28,7 +28,7 @@
  */
 
 #include "mdadm.h"
-
+#include <endian.h>
 #include "asm/byteorder.h"
 /*
  * The version-1 superblock :
@@ -54,7 +54,11 @@ struct mdp_superblock_1 {
 
        __u32   chunksize;      /* in 512byte sectors */
        __u32   raid_disks;
-       __u8    pad1[128-96];   /* set to 0 when written */
+       __u32   bitmap_offset;  /* sectors after start of superblock that bitmap starts
+                                * NOTE: signed, so bitmap can be before superblock
+                                * only meaningful of feature_map[0] is set.
+                                */
+       __u8    pad1[128-100];  /* set to 0 when written */
 
        /* constant this-device information - 64 bytes */
        __u64   data_offset;    /* sector start of data, often 0 */
@@ -64,7 +68,9 @@ struct mdp_superblock_1 {
        __u32   dev_number;     /* permanent identifier of this  device - not role in raid */
        __u32   cnt_corrected_read; /* number of read errors that were corrected by re-writing */
        __u8    device_uuid[16]; /* user-space setable, ignored by kernel */
-       __u8    pad2[64-56];    /* set to 0 when writing */
+        __u8    devflags;        /* per-device flags.  Only one defined...*/
+#define WriteMostly1    1        /* mask for writemostly flag in above */
+       __u8    pad2[64-57];    /* set to 0 when writing */
 
        /* array state information - 64 bytes */
        __u64   utime;          /* 40 bits second, 24 btes microseconds */
@@ -129,8 +135,8 @@ static void examine_super1(void *sbv)
        printf("        Version : %02d.%02d\n", 1, __le32_to_cpu(sb->feature_map));
        printf("     Array UUID : ");
        for (i=0; i<16; i++) {
-               printf("%02x", sb->set_uuid[i]);
                if ((i&3)==0 && i != 0) printf(":");
+               printf("%02x", sb->set_uuid[i]);
        }
        printf("\n");
        printf("           Name : %.32s\n", sb->set_name);
@@ -149,10 +155,16 @@ static void examine_super1(void *sbv)
        printf("          State : %s\n", (__le64_to_cpu(sb->resync_offset)+1)? "active":"clean");
        printf("    Device UUID : ");
        for (i=0; i<16; i++) {
-               printf("%02x", sb->set_uuid[i]);
                if ((i&3)==0 && i != 0) printf(":");
+               printf("%02x", sb->device_uuid[i]);
        }
        printf("\n");
+       if (sb->devflags) {
+               printf("      Flags :");
+               if (sb->devflags & WriteMostly1)
+                       printf(" write-mostly");
+               printf("\n");
+       }
 
        atime = __le64_to_cpu(sb->utime) & 0xFFFFFFFFFFULL;
        printf("    Update Time : %.24s\n", ctime(&atime));
@@ -222,6 +234,8 @@ static void brief_examine_super1(void *sbv)
                printf("%02x", sb->set_uuid[i]);
                if ((i&3)==0 && i != 0) printf(":");
        }
+       if (sb->set_name[0])
+               printf(" name=%.32s", sb->set_name);
        printf("\n");
 }
 
@@ -230,10 +244,11 @@ static void detail_super1(void *sbv)
        struct mdp_superblock_1 *sb = sbv;
        int i;
 
+       printf("           Name : %.32s\n", sb->set_name);
        printf("           UUID : ");
        for (i=0; i<16; i++) {
-               printf("%02x", sb->set_uuid[i]);
                if ((i&3)==0 && i != 0) printf(":");
+               printf("%02x", sb->set_uuid[i]);
        }
        printf("\n         Events : %llu\n\n", (unsigned long long)__le64_to_cpu(sb->events));
 }
@@ -243,10 +258,12 @@ static void brief_detail_super1(void *sbv)
        struct mdp_superblock_1 *sb = sbv;
        int i;
 
+       if (sb->set_name[0])
+               printf(" name=%.32s", sb->set_name);
        printf(" UUID=");
        for (i=0; i<16; i++) {
-               printf("%02x", sb->set_uuid[i]);
                if ((i&3)==0 && i != 0) printf(":");
+               printf("%02x", sb->set_uuid[i]);
        }
 }
 
@@ -261,7 +278,7 @@ static void uuid_from_super1(int uuid[4], void * sbv)
                cuuid[i] = super->set_uuid[i];
 }
 
-static void getinfo_super1(struct mdinfo *info, void *sbv)
+static void getinfo_super1(struct mdinfo *info, mddev_ident_t ident, void *sbv)
 {
        struct mdp_superblock_1 *sb = sbv;
        int working = 0;
@@ -278,7 +295,7 @@ static void getinfo_super1(struct mdinfo *info, void *sbv)
 
        info->disk.major = 0;
        info->disk.minor = 0;
-
+       info->disk.number = __le32_to_cpu(sb->dev_number);
        if (__le32_to_cpu(sb->dev_number) >= __le32_to_cpu(sb->max_dev) ||
            __le32_to_cpu(sb->max_dev) > 512)
                role = 0xfffe;
@@ -301,9 +318,12 @@ static void getinfo_super1(struct mdinfo *info, void *sbv)
 
        memcpy(info->uuid, sb->set_uuid, 16);
 
+       strncpy(ident->name, sb->set_name, 32);
+       ident->name[32] = 0;
+
        for (i=0; i< __le32_to_cpu(sb->max_dev); i++) {
                role = __le16_to_cpu(sb->dev_roles[i]);
-               if (role == 0xFFFF || role < info->array.raid_disks)
+               if (/*role == 0xFFFF || */role < info->array.raid_disks)
                        working++;
        }
 
@@ -367,10 +387,11 @@ static __u64 event_super1(void *sbv)
        return __le64_to_cpu(sb->events);
 }
 
-static int init_super1(struct supertype *st, void **sbp, mdu_array_info_t *info)
+static int init_super1(struct supertype *st, void **sbp, mdu_array_info_t *info, char *name)
 {
-       struct mdp_superblock_1 *sb = malloc(1024);
+       struct mdp_superblock_1 *sb = malloc(1024 + sizeof(bitmap_super_t));
        int spares;
+       int rfd;
        memset(sb, 0, 1024);
 
        if (info->major_version == -1)
@@ -389,12 +410,18 @@ static int init_super1(struct supertype *st, void **sbp, mdu_array_info_t *info)
        sb->major_version = __cpu_to_le32(1);
        sb->feature_map = 0;
        sb->pad0 = 0;
-       *(__u32*)(sb->set_uuid) = random();
-       *(__u32*)(sb->set_uuid+4) = random();
-       *(__u32*)(sb->set_uuid+8) = random();
-       *(__u32*)(sb->set_uuid+12) = random();
 
-       /* FIXME name */
+       if ((rfd = open("/dev/urandom", O_RDONLY)) < 0 ||
+           read(rfd, sb->set_uuid, 16) != 16) {
+               *(__u32*)(sb->set_uuid) = random();
+               *(__u32*)(sb->set_uuid+4) = random();
+               *(__u32*)(sb->set_uuid+8) = random();
+               *(__u32*)(sb->set_uuid+12) = random();
+       }
+       if (rfd >= 0) close(rfd);
+
+       memset(sb->set_name, 0, 32);
+       strcpy(sb->set_name, name);
 
        sb->ctime = __cpu_to_le64((unsigned long long)time(0));
        sb->level = __cpu_to_le32(info->level);
@@ -414,7 +441,7 @@ static int init_super1(struct supertype *st, void **sbp, mdu_array_info_t *info)
                sb->resync_offset = ~0ULL;
        else
                sb->resync_offset = 0;
-       sb->max_dev = __cpu_to_le32((1024- sizeof(struct mdp_superblock_1))/ 
+       sb->max_dev = __cpu_to_le32((1024- sizeof(struct mdp_superblock_1))/
                                    sizeof(sb->dev_roles[0]));
        memset(sb->pad3, 0, sizeof(sb->pad3));
 
@@ -429,11 +456,11 @@ static void add_to_super1(void *sbv, mdu_disk_info_t *dk)
 {
        struct mdp_superblock_1 *sb = sbv;
        __u16 *rp = sb->dev_roles + dk->number;
-       if (dk->state == 6) /* active, sync */
+       if ((dk->state & 6) == 6) /* active, sync */
                *rp = __cpu_to_le16(dk->raid_disk);
        else if ((dk->state & ~2) == 0) /* active or idle -> spare */
                *rp = 0xffff;
-       else 
+       else
                *rp = 0xfffe;
 }
 
@@ -476,7 +503,7 @@ static int store_super1(struct supertype *st, int fd, void *sbv)
        }
 
 
-    
+
        if (sb_offset != __le64_to_cpu(sb->super_offset) &&
            0 != __le64_to_cpu(sb->super_offset)
                ) {
@@ -498,7 +525,8 @@ static int store_super1(struct supertype *st, int fd, void *sbv)
 
 static int load_super1(struct supertype *st, int fd, void **sbp, char *devname);
 
-static int write_init_super1(struct supertype *st, void *sbv, mdu_disk_info_t *dinfo, char *devname)
+static int write_init_super1(struct supertype *st, void *sbv,
+                            mdu_disk_info_t *dinfo, char *devname)
 {
        struct mdp_superblock_1 *sb = sbv;
        struct mdp_superblock_1 *refsb = NULL;
@@ -517,6 +545,8 @@ static int write_init_super1(struct supertype *st, void *sbv, mdu_disk_info_t *d
        }
 
        sb->dev_number = __cpu_to_le32(dinfo->number);
+       if (dinfo->state & (1<<MD_DISK_WRITEMOSTLY))
+               sb->devflags |= WriteMostly1;
 
        if ((rfd = open("/dev/urandom", O_RDONLY)) < 0 ||
            read(rfd, sb->device_uuid, 16) != 16) {
@@ -537,7 +567,7 @@ static int write_init_super1(struct supertype *st, void *sbv, mdu_disk_info_t *d
                }
                free(refsb);
        }
-    
+
        if (ioctl(fd, BLKGETSIZE, &size)) {
                close(fd);
                return 1;
@@ -564,18 +594,18 @@ static int write_init_super1(struct supertype *st, void *sbv, mdu_disk_info_t *d
                sb_offset &= ~(4*2-1);
                sb->super_offset = __cpu_to_le64(sb_offset);
                sb->data_offset = __cpu_to_le64(0);
-               sb->data_size = sb->super_offset;
+               sb->data_size = __cpu_to_le64(sb_offset);
                break;
        case 1:
                sb->super_offset = __cpu_to_le64(0);
-               sb->data_offset = __cpu_to_le64(2);
-               sb->data_size = __cpu_to_le64(size - 2);
+               sb->data_offset = __cpu_to_le64(4*2); /* leave 4k for super and bitmap */
+               sb->data_size = __cpu_to_le64(size - 4*2);
                break;
        case 2:
                sb_offset = 4*2;
                sb->super_offset = __cpu_to_le64(sb_offset);
-               sb->data_offset = __cpu_to_le64(sb_offset+2);
-               sb->data_size = __cpu_to_le64(size - 4*2 - 2);
+               sb->data_offset = __cpu_to_le64(sb_offset+4*2);
+               sb->data_size = __cpu_to_le64(size - 4*2 - 4*2);
                break;
        default:
                return -EINVAL;
@@ -586,6 +616,9 @@ static int write_init_super1(struct supertype *st, void *sbv, mdu_disk_info_t *d
        rv = store_super1(st, fd, sb);
        if (rv)
                fprintf(stderr, Name ": failed to write superblock to %s\n", devname);
+
+       if (rv == 0 && (__le32_to_cpu(sb->feature_map) & 1))
+               rv = st->ss->write_bitmap(st, fd, sbv);
        close(fd);
        return rv;
 }
@@ -667,7 +700,7 @@ static int load_super1(struct supertype *st, int fd, void **sbp, char *devname)
                return 2;
        }
        if (ioctl(fd, BLKGETSIZE, &size)) {
-               if (devname) 
+               if (devname)
                        fprintf(stderr, Name ": cannot find device size for %s: %s\n",
                                devname, strerror(errno));
                return 1;
@@ -714,7 +747,7 @@ static int load_super1(struct supertype *st, int fd, void **sbp, char *devname)
                return 1;
        }
 
-       super = malloc(1024);
+       super = malloc(1024 + sizeof(bitmap_super_t));
 
        if (read(fd, super, 1024) != 1024) {
                if (devname)
@@ -776,12 +809,126 @@ static struct supertype *match_metadata_desc1(char *arg)
        return NULL;
 }
 
-static __u64 avail_size1(__u64 devsize)
+/* find available size on device with this devsize, using
+ * superblock type st, and reserving 'reserve' sectors for
+ * a possible bitmap
+ */
+static __u64 avail_size1(struct supertype *st, __u64 devsize)
 {
        if (devsize < 24)
                return 0;
 
-       return (devsize - 8*2 ) & ~(4*2-1);
+       switch(st->minor_version) {
+       case 0:
+               /* at end */
+               return ((devsize - 8*2 ) & ~(4*2-1));
+       case 1:
+               /* at start, 4K for superblock and possible bitmap */
+               return devsize - 4*2;
+       case 2:
+               /* 4k from start, 4K for superblock and possible bitmap */
+               return devsize - (4+4)*2;
+       }
+       return 0;
+}
+
+static int
+add_internal_bitmap1(struct supertype *st, void *sbv,
+                    int chunk, int delay, int write_behind, int *sizep, int may_change)
+{
+       /*
+        * If not may_change, then this is a 'Grow', and the bitmap
+        * must fit after the superblock.
+        * If may_change, then this is create, and we can put the bitmap
+        * before the superblock if we like, or may move the start.
+        * For now, just squeeze the bitmap into 3k and don't change anything.
+        *
+        * size is in K,  chunk is in bytes !!!
+        */
+
+       unsigned long long size = *sizep;
+       unsigned long long bits;
+       unsigned long long max_bits = (3*512 - sizeof(bitmap_super_t)) * 8;
+       unsigned long long min_chunk;
+       struct mdp_superblock_1 *sb = sbv;
+       bitmap_super_t *bms = (bitmap_super_t*)(((char*)sb) + 1024);
+
+       if (st->minor_version && !may_change &&
+           __le64_to_cpu(sb->data_offset) - __le64_to_cpu(sb->super_offset) < 8)
+               return 0; /* doesn't fit */
+
+
+
+       min_chunk = 4096; /* sub-page chunks don't work yet.. */
+       bits = (size*1024)/min_chunk +1;
+       while (bits > max_bits) {
+               min_chunk *= 2;
+               bits = (bits+1)/2;
+       }
+       if (chunk == UnSet)
+               chunk = min_chunk;
+       else if (chunk < min_chunk)
+               return 0; /* chunk size too small */
+
+       sb->bitmap_offset = __cpu_to_le32(2);
+
+       sb->feature_map = __cpu_to_le32(__le32_to_cpu(sb->feature_map) | 1);
+       memset(bms, sizeof(*bms), 0);
+       bms->magic = __cpu_to_le32(BITMAP_MAGIC);
+       bms->version = __cpu_to_le32(BITMAP_MAJOR);
+       uuid_from_super1((int*)bms->uuid, sb);
+       bms->chunksize = __cpu_to_le32(chunk);
+       bms->daemon_sleep = __cpu_to_le32(delay);
+       bms->sync_size = __cpu_to_le64(size<<1);
+       bms->write_behind = __cpu_to_le32(write_behind);
+
+       return 1;
+}
+
+
+void locate_bitmap1(struct supertype *st, int fd)
+{
+       unsigned long long offset;
+       struct mdp_superblock_1 *sb;
+
+       if (st->ss->load_super(st, fd, (void**)&sb, NULL))
+               return; /* no error I hope... */
+       offset = __le64_to_cpu(sb->super_offset);
+       offset += (long) __le32_to_cpu(sb->bitmap_offset);
+
+       lseek64(fd, offset<<9, 0);
+}
+
+int write_bitmap1(struct supertype *st, int fd, void *sbv)
+{
+       struct mdp_superblock_1 *sb = sbv;
+       bitmap_super_t *bms = (bitmap_super_t*)(((char*)sb)+1024);
+       int rv = 0;
+
+       int towrite, n;
+       char buf[4096];
+
+       locate_bitmap1(st, fd);
+
+       write(fd, ((char*)sb)+1024, sizeof(bitmap_super_t));
+       towrite = __le64_to_cpu(bms->sync_size) / (__le32_to_cpu(bms->chunksize)>>9);
+       towrite = (towrite+7) >> 3; /* bits to bytes */
+       memset(buf, 0xff, sizeof(buf));
+       while (towrite > 0) {
+               n = towrite;
+               if (n > sizeof(buf))
+                       n = sizeof(buf);
+               n = write(fd, buf, n);
+               if (n > 0)
+                       towrite -= n;
+               else
+                       break;
+       }
+       fsync(fd);
+       if (towrite)
+               rv = -2;
+
+       return rv;
 }
 
 struct superswitch super1 = {
@@ -803,5 +950,13 @@ struct superswitch super1 = {
        .load_super = load_super1,
        .match_metadata_desc = match_metadata_desc1,
        .avail_size = avail_size1,
+       .add_internal_bitmap = add_internal_bitmap1,
+       .locate_bitmap = locate_bitmap1,
+       .write_bitmap = write_bitmap1,
        .major = 1,
+#if __BYTE_ORDER == BIG_ENDIAN
+       .swapuuid = 0,
+#else
+       .swapuuid = 1,
+#endif
 };