]> git.ipfire.org Git - thirdparty/mdadm.git/blobdiff - util.c
Detail: clean up handing of the 'info' we load from superblock.
[thirdparty/mdadm.git] / util.c
diff --git a/util.c b/util.c
index 67c355069b84b586a6d1df0ebfc67f7c174c1104..8935ceb94776301c5400a44bbe1023b2cf9397a1 100644 (file)
--- a/util.c
+++ b/util.c
@@ -82,25 +82,55 @@ struct MBR_part_record {
   __u32 blocks_num;
 };
 
+struct MBR {
+       __u8 pad[446];
+       struct MBR_part_record parts[4];
+       __u16 magic;
+} __attribute__((packed));
+
 struct GPT_part_entry {
   unsigned char type_guid[16];
   unsigned char partition_guid[16];
-  unsigned char starting_lba[8];
-  unsigned char ending_lba[8];
+  __u64 starting_lba;
+  __u64 ending_lba;
   unsigned char attr_bits[8];
   unsigned char name[72];
-};
+} __attribute__((packed));
+
+struct GPT {
+       __u64 magic;
+       __u32 revision;
+       __u32 header_size;
+       __u32 crc;
+       __u32 pad1;
+       __u64 current_lba;
+       __u64 backup_lba;
+       __u64 first_lba;
+       __u64 last_lba;
+       __u8 guid[16];
+       __u64 part_start;
+       __u32 part_cnt;
+       __u32 part_size;
+       __u32 part_crc;
+       __u8 pad2[420];
+} __attribute__((packed));
+
+/* Force a compilation error if condition is true */
+#define BUILD_BUG_ON(condition) ((void)BUILD_BUG_ON_ZERO(condition))
+
+/* Force a compilation error if condition is true, but also produce a
+   result (of value 0 and type size_t), so the expression can be used
+   e.g. in a structure initializer (or where-ever else comma expressions
+   aren't permitted). */
+#define BUILD_BUG_ON_ZERO(e) (sizeof(struct { int:-!!(e); }))
+
 
 /* MBR/GPT magic numbers */
 #define        MBR_SIGNATURE_MAGIC     __cpu_to_le16(0xAA55)
 #define        GPT_SIGNATURE_MAGIC     __cpu_to_le64(0x5452415020494645ULL)
 
-#define MBR_SIGNATURE_OFFSET         510
-#define MBR_PARTITION_TABLE_OFFSET   446
 #define MBR_PARTITIONS               4
 #define MBR_GPT_PARTITION_TYPE       0xEE
-#define GPT_ALL_PARTITIONS_OFFSET    80
-#define GPT_ENTRY_SIZE_OFFSET        84
 
 /*
  * Parse a 128 bit uuid in 4 integers
@@ -272,6 +302,31 @@ void remove_partitions(int fd)
 #endif
 }
 
+int test_partition(int fd)
+{
+       /* Check if fd is a whole-disk or a partition.
+        * BLKPG will return EINVAL on a partition, and BLKPG_DEL_PARTITION
+        * will return ENXIO on an invalid partition number.
+        */
+       struct blkpg_ioctl_arg a;
+       struct blkpg_partition p;
+       a.op = BLKPG_DEL_PARTITION;
+       a.data = (void*)&p;
+       a.datalen = sizeof(p);
+       a.flags = 0;
+       memset(a.data, 0, a.datalen);
+       p.pno = 1<<30;
+       if (ioctl(fd, BLKPG, &a) == 0)
+               /* Very unlikely, but not a partition */
+               return 0;
+       if (errno == ENXIO)
+               /* not a partition */
+               return 0;
+
+       return 1;
+}
+
+
 int enough(int level, int raid_disks, int layout, int clean,
           char *avail, int avail_disks)
 {
@@ -395,7 +450,12 @@ char *__fname_from_uuid(int id[4], int swap, char *buf, char sep)
 
 char *fname_from_uuid(struct supertype *st, struct mdinfo *info, char *buf, char sep)
 {
-       return __fname_from_uuid(info->uuid, st->ss->swapuuid, buf, sep);
+       // dirty hack to work around an issue with super1 superblocks...
+       // super1 superblocks need swapuuid set in order for assembly to
+       // work, but can't have it set if we want this printout to match
+       // all the other uuid printouts in super1.c, so we force swapuuid
+       // to 1 to make our printout match the rest of super1
+       return __fname_from_uuid(info->uuid, (st->ss == &super1) ? 1 : st->ss->swapuuid, buf, sep);
 }
 
 #ifndef MDASSEMBLE
@@ -1141,6 +1201,7 @@ int get_dev_size(int fd, char *dname, unsigned long long *sizep)
  */
 static int get_gpt_last_partition_end(int fd, unsigned long long *endofpart)
 {
+       struct GPT gpt;
        unsigned char buf[512];
        unsigned char empty_gpt_entry[16]= {0};
        struct GPT_part_entry *part;
@@ -1150,17 +1211,18 @@ static int get_gpt_last_partition_end(int fd, unsigned long long *endofpart)
 
        *endofpart = 0;
 
+       BUILD_BUG_ON(sizeof(gpt) != 512);
        /* read GPT header */
        lseek(fd, 512, SEEK_SET);
-       if (read(fd, buf, 512) != 512)
+       if (read(fd, &gpt, 512) != 512)
                return 0;
 
        /* get the number of partition entries and the entry size */
-       all_partitions = __le32_to_cpu(buf[GPT_ALL_PARTITIONS_OFFSET]);
-       entry_size = __le32_to_cpu(buf[GPT_ENTRY_SIZE_OFFSET]);
+       all_partitions = __le32_to_cpu(gpt.part_cnt);
+       entry_size = __le32_to_cpu(gpt.part_size);
 
        /* Check GPT signature*/
-       if (*((__u64*)buf) != GPT_SIGNATURE_MAGIC)
+       if (gpt.magic != GPT_SIGNATURE_MAGIC)
                return -1;
 
        /* sanity checks */
@@ -1178,7 +1240,7 @@ static int get_gpt_last_partition_end(int fd, unsigned long long *endofpart)
                /* is this valid partition? */
                if (memcmp(part->type_guid, empty_gpt_entry, 16) != 0) {
                        /* check the last lba for the current partition */
-                       curr_part_end = __le64_to_cpu(*(__u64*)part->ending_lba);
+                       curr_part_end = __le64_to_cpu(part->ending_lba);
                        if (curr_part_end > *endofpart)
                                *endofpart = curr_part_end;
                }
@@ -1201,7 +1263,7 @@ static int get_gpt_last_partition_end(int fd, unsigned long long *endofpart)
  */
 static int get_last_partition_end(int fd, unsigned long long *endofpart)
 {
-       unsigned char boot_sect[512];
+       struct MBR boot_sect;
        struct MBR_part_record *part;
        unsigned long long curr_part_end;
        int part_nr;
@@ -1209,18 +1271,17 @@ static int get_last_partition_end(int fd, unsigned long long *endofpart)
 
        *endofpart = 0;
 
+       BUILD_BUG_ON(sizeof(boot_sect) != 512);
        /* read MBR */
        lseek(fd, 0, 0);
-       if (read(fd, boot_sect, 512) != 512)
+       if (read(fd, &boot_sect, 512) != 512)
                goto abort;
 
        /* check MBP signature */
-       if (*((__u16*)(boot_sect + MBR_SIGNATURE_OFFSET))
-           == MBR_SIGNATURE_MAGIC) {
+       if (boot_sect.magic == MBR_SIGNATURE_MAGIC) {
                retval = 1;
                /* found the correct signature */
-               part = (struct MBR_part_record*)
-                       (boot_sect + MBR_PARTITION_TABLE_OFFSET);
+               part = boot_sect.parts;
 
                for (part_nr=0; part_nr < MBR_PARTITIONS; part_nr++) {
                        /* check for GPT type */
@@ -1331,6 +1392,148 @@ int open_container(int fd)
        return -1;
 }
 
+struct superswitch *version_to_superswitch(char *vers)
+{
+       int i;
+
+       for (i = 0; superlist[i]; i++) {
+               struct superswitch *ss = superlist[i];
+
+               if (strcmp(vers, ss->name) == 0)
+                       return ss;
+       }
+
+       return NULL;
+}
+
+int is_container_member(struct mdstat_ent *mdstat, char *container)
+{
+       if (mdstat->metadata_version == NULL ||
+           strncmp(mdstat->metadata_version, "external:", 9) != 0 ||
+           !is_subarray(mdstat->metadata_version+9) ||
+           strncmp(mdstat->metadata_version+10, container, strlen(container)) != 0 ||
+           mdstat->metadata_version[10+strlen(container)] != '/')
+               return 0;
+
+       return 1;
+}
+
+int is_subarray_active(char *subarray, char *container)
+{
+       struct mdstat_ent *mdstat = mdstat_read(0, 0);
+       struct mdstat_ent *ent;
+
+       for (ent = mdstat; ent; ent = ent->next) {
+               if (is_container_member(ent, container)) {
+                       char *inst = &ent->metadata_version[10+strlen(container)+1];
+
+                       if (!subarray || strcmp(inst, subarray) == 0)
+                               break;
+               }
+       }
+
+       free_mdstat(mdstat);
+
+       return ent != NULL;
+}
+
+int is_container_active(char *container)
+{
+       return is_subarray_active(NULL, container);
+}
+
+/* open_subarray - opens a subarray in a container
+ * @dev: container device name
+ * @st: supertype with only ->subarray set
+ * @quiet: block reporting errors flag
+ *
+ * On success returns an fd to a container and fills in *st
+ */
+int open_subarray(char *dev, struct supertype *st, int quiet)
+{
+       struct mdinfo *mdi;
+       int fd, err = 1;
+
+       fd = open(dev, O_RDWR|O_EXCL);
+       if (fd < 0) {
+               if (!quiet)
+                       fprintf(stderr, Name ": Couldn't open %s, aborting\n",
+                               dev);
+               return 2;
+       }
+
+       st->devnum = fd2devnum(fd);
+       if (st->devnum == NoMdDev) {
+               if (!quiet)
+                       fprintf(stderr,
+                               Name ": Failed to determine device number for %s\n",
+                               dev);
+               goto close_fd;
+       }
+
+       mdi = sysfs_read(fd, st->devnum, GET_VERSION|GET_LEVEL);
+       if (!mdi) {
+               if (!quiet)
+                       fprintf(stderr, Name ": Failed to read sysfs for %s\n",
+                               dev);
+               goto close_fd;
+       }
+
+       if (mdi->array.level != UnSet) {
+               if (!quiet)
+                       fprintf(stderr, Name ": %s is not a container\n", dev);
+               goto free_sysfs;
+       }
+
+       st->ss = version_to_superswitch(mdi->text_version);
+       if (!st->ss) {
+               if (!quiet)
+                       fprintf(stderr,
+                               Name ": Operation not supported for %s metadata\n",
+                               mdi->text_version);
+               goto free_sysfs;
+       }
+
+       st->devname = devnum2devname(st->devnum);
+       if (!st->devname) {
+               if (!quiet)
+                       fprintf(stderr, Name ": Failed to allocate device name\n");
+               goto free_sysfs;
+       }
+
+       if (st->ss->load_super(st, fd, NULL)) {
+               if (!quiet)
+                       fprintf(stderr, Name ": Failed to find subarray-%s in %s\n",
+                               st->subarray, dev);
+               goto free_name;
+       }
+
+       if (!st->loaded_container) {
+               if (!quiet)
+                       fprintf(stderr, Name ": %s is not a container\n", dev);
+               goto free_super;
+       }
+
+       err = 0;
+
+ free_super:
+       if (err)
+               st->ss->free_super(st);
+ free_name:
+       if (err)
+               free(st->devname);
+ free_sysfs:
+       sysfs_free(mdi);
+ close_fd:
+       if (err)
+               close(fd);
+
+       if (err)
+               return -1;
+       else
+               return fd;
+}
+
 int add_disk(int mdfd, struct supertype *st,
             struct mdinfo *sra, struct mdinfo *info)
 {
@@ -1338,8 +1541,11 @@ int add_disk(int mdfd, struct supertype *st,
        int rv;
 #ifndef MDASSEMBLE
        if (st->ss->external) {
-               rv = sysfs_add_disk(sra, info,
-                                   info->disk.state & (1<<MD_DISK_SYNC));
+               if (info->disk.state & (1<<MD_DISK_SYNC))
+                       info->recovery_start = MaxSector;
+               else
+                       info->recovery_start = 0;
+               rv = sysfs_add_disk(sra, info, 0);
                if (! rv) {
                        struct mdinfo *sd2;
                        for (sd2 = sra->devs; sd2; sd2=sd2->next)
@@ -1383,10 +1589,25 @@ int set_array_info(int mdfd, struct supertype *st, struct mdinfo *info)
        return rv;
 }
 
+unsigned long long min_recovery_start(struct mdinfo *array)
+{
+       /* find the minimum recovery_start in an array for metadata
+        * formats that only record per-array recovery progress instead
+        * of per-device
+        */
+       unsigned long long recovery_start = MaxSector;
+       struct mdinfo *d;
+
+       for (d = array->devs; d; d = d->next)
+               recovery_start = min(recovery_start, d->recovery_start);
+
+       return recovery_start;
+}
+
 char *devnum2devname(int num)
 {
        char name[100];
-       if (num > 0)
+       if (num >= 0)
                sprintf(name, "md%d", num);
        else
                sprintf(name, "md_d%d", -1-num);
@@ -1445,42 +1666,34 @@ int fd2devnum(int fd)
        return NoMdDev;
 }
 
-int mdmon_running(int devnum)
+int mdmon_pid(int devnum)
 {
        char path[100];
        char pid[10];
        int fd;
        int n;
-       sprintf(path, "/var/run/mdadm/%s.pid", devnum2devname(devnum));
-       fd = open(path, O_RDONLY, 0);
+       char *devname = devnum2devname(devnum);
+
+       sprintf(path, "%s/%s.pid", MDMON_DIR, devname);
+       free(devname);
+
+       fd = open(path, O_RDONLY | O_NOATIME, 0);
 
        if (fd < 0)
-               return 0;
+               return -1;
        n = read(fd, pid, 9);
        close(fd);
        if (n <= 0)
-               return 0;
-       if (kill(atoi(pid), 0) == 0)
-               return 1;
-       return 0;
+               return -1;
+       return atoi(pid);
 }
 
-int signal_mdmon(int devnum)
+int mdmon_running(int devnum)
 {
-       char path[100];
-       char pid[10];
-       int fd;
-       int n;
-       sprintf(path, "/var/run/mdadm/%s.pid", devnum2devname(devnum));
-       fd = open(path, O_RDONLY, 0);
-
-       if (fd < 0)
-               return 0;
-       n = read(fd, pid, 9);
-       close(fd);
-       if (n <= 0)
+       int pid = mdmon_pid(devnum);
+       if (pid <= 0)
                return 0;
-       if (kill(atoi(pid), SIGUSR1) == 0)
+       if (kill(pid, 0) == 0)
                return 1;
        return 0;
 }