]> git.ipfire.org Git - thirdparty/xfsprogs-dev.git/commitdiff
xfs: define the format of rt groups
authorDarrick J. Wong <djwong@kernel.org>
Mon, 25 Nov 2024 21:14:21 +0000 (13:14 -0800)
committerDarrick J. Wong <djwong@kernel.org>
Tue, 24 Dec 2024 02:01:29 +0000 (18:01 -0800)
Source kernel commit: 96768e91511bfced6e9e537f4891157d909b13ee

Define the ondisk format of realtime group metadata, and a superblock
for realtime volumes.  rt supers are conditionally enabled by a
predicate function so that they can be disabled if we ever implement
zoned storage support for the realtime volume.

For rt group enabled file systems there is a separate bitmap and summary
file for each group and thus the number of bitmap and summary blocks
needs to be calculated differently.

Signed-off-by: Darrick J. Wong <djwong@kernel.org>
Reviewed-by: Christoph Hellwig <hch@lst.de>
include/libxfs.h
include/xfs_mount.h
libxfs/libxfs_priv.h
libxfs/xfs_format.h
libxfs/xfs_ondisk.h
libxfs/xfs_rtbitmap.c
libxfs/xfs_rtgroup.c
libxfs/xfs_sb.c
libxfs/xfs_shared.h

index df38d875143ed99871c14aefe348fe2e3baf14f0..5689f58c640168c92eb1954c783d167ddd3ed310 100644 (file)
@@ -98,6 +98,7 @@ struct iomap;
 #include "xfs_metafile.h"
 #include "xfs_metadir.h"
 #include "xfs_rtgroup.h"
+#include "xfs_rtbitmap.h"
 
 #ifndef ARRAY_SIZE
 #define ARRAY_SIZE(x) (sizeof(x) / sizeof((x)[0]))
index 7406825cf7f57ae431102e516e95890b33dc4756..31ac60d93c61cca006d0c2273efa5fa8584f39f1 100644 (file)
@@ -248,12 +248,14 @@ __XFS_HAS_FEAT(metadir, METADIR)
 
 static inline bool xfs_has_rtgroups(struct xfs_mount *mp)
 {
-       return false;
+       /* all metadir file systems also allow rtgroups */
+       return xfs_has_metadir(mp);
 }
 
 static inline bool xfs_has_rtsb(struct xfs_mount *mp)
 {
-       return false;
+       /* all rtgroups filesystems with an rt section have an rtsb */
+       return xfs_has_rtgroups(mp) && xfs_has_realtime(mp);
 }
 
 /* Kernel mount features that we don't support */
index 620cd13b8ef79645536546f9f686e4f10464fe39..1fc9c784b0505446f4c884bdf65379a65030a9c8 100644 (file)
@@ -53,6 +53,7 @@
 #include "libfrog/radix-tree.h"
 #include "libfrog/bitmask.h"
 #include "libfrog/div64.h"
+#include "libfrog/util.h"
 #include "atomic.h"
 #include "spinlock.h"
 #include "linux-err.h"
index 867060d60e85830ecfa43ea16fd98cbd38d6b14f..3cf044a2d5f2a95913e79c8f54c2be0f2ef5dc01 100644 (file)
@@ -265,8 +265,15 @@ struct xfs_dsb {
        uuid_t          sb_meta_uuid;   /* metadata file system unique id */
 
        __be64          sb_metadirino;  /* metadata directory tree root */
+       __be32          sb_rgcount;     /* # of realtime groups */
+       __be32          sb_rgextents;   /* size of rtgroup in rtx */
 
-       /* must be padded to 64 bit alignment */
+       /*
+        * The size of this structure must be padded to 64 bit alignment.
+        *
+        * NOTE: Don't forget to update secondary_sb_whack in xfs_repair when
+        * adding new fields here.
+        */
 };
 
 #define XFS_SB_CRC_OFF         offsetof(struct xfs_dsb, sb_crc)
@@ -716,6 +723,39 @@ union xfs_suminfo_raw {
        __u32           old;
 };
 
+/*
+ * Realtime allocation groups break the rt section into multiple pieces that
+ * could be locked independently.  Realtime block group numbers are 32-bit
+ * quantities.  Block numbers within a group are also 32-bit quantities, but
+ * the upper bit must never be set.  rtgroup 0 might have a superblock in it,
+ * so the minimum size of an rtgroup is 2 rtx.
+ */
+#define XFS_MAX_RGBLOCKS       ((xfs_rgblock_t)(1U << 31) - 1)
+#define XFS_MIN_RGEXTENTS      ((xfs_rtxlen_t)2)
+#define XFS_MAX_RGNUMBER       ((xfs_rgnumber_t)(-1U))
+
+#define XFS_RTSB_MAGIC 0x46726F67      /* 'Frog' */
+
+/*
+ * Realtime superblock - on disk version.  Must be padded to 64 bit alignment.
+ * The first block of the realtime volume contains this superblock.
+ */
+struct xfs_rtsb {
+       __be32          rsb_magicnum;   /* magic number == XFS_RTSB_MAGIC */
+       __le32          rsb_crc;        /* superblock crc */
+
+       __be32          rsb_pad;        /* zero */
+       unsigned char   rsb_fname[XFSLABEL_MAX]; /* file system name */
+
+       uuid_t          rsb_uuid;       /* user-visible file system unique id */
+       uuid_t          rsb_meta_uuid;  /* metadata file system unique id */
+
+       /* must be padded to 64 bit alignment */
+};
+
+#define XFS_RTSB_CRC_OFF       offsetof(struct xfs_rtsb, rsb_crc)
+#define XFS_RTSB_DADDR         ((xfs_daddr_t)0) /* daddr in rt section */
+
 /*
  * XFS Timestamps
  * ==============
index 8bca86e350fdc11980a00cf52a492fc9b7504496..38b314113d8f247b68643f999fac8ab891adf94a 100644 (file)
@@ -37,7 +37,7 @@ xfs_check_ondisk_structs(void)
        XFS_CHECK_STRUCT_SIZE(struct xfs_dinode,                176);
        XFS_CHECK_STRUCT_SIZE(struct xfs_disk_dquot,            104);
        XFS_CHECK_STRUCT_SIZE(struct xfs_dqblk,                 136);
-       XFS_CHECK_STRUCT_SIZE(struct xfs_dsb,                   272);
+       XFS_CHECK_STRUCT_SIZE(struct xfs_dsb,                   280);
        XFS_CHECK_STRUCT_SIZE(struct xfs_dsymlink_hdr,          56);
        XFS_CHECK_STRUCT_SIZE(struct xfs_inobt_key,             4);
        XFS_CHECK_STRUCT_SIZE(struct xfs_inobt_rec,             16);
@@ -53,6 +53,7 @@ xfs_check_ondisk_structs(void)
        XFS_CHECK_STRUCT_SIZE(xfs_inobt_ptr_t,                  4);
        XFS_CHECK_STRUCT_SIZE(xfs_refcount_ptr_t,               4);
        XFS_CHECK_STRUCT_SIZE(xfs_rmap_ptr_t,                   4);
+       XFS_CHECK_STRUCT_SIZE(struct xfs_rtsb,                  56);
 
        /* dir/attr trees */
        XFS_CHECK_STRUCT_SIZE(struct xfs_attr3_leaf_hdr,        80);
index edcfb09e29fa18874ac62a1f38e51a376325bbc2..84ca5447ca770f30ab1710c5f50119fee258fcb5 100644 (file)
@@ -1155,6 +1155,21 @@ xfs_rtbitmap_blockcount_len(
        return howmany_64(rtextents, NBBY * mp->m_sb.sb_blocksize);
 }
 
+/* How many rt extents does each rtbitmap file track? */
+static inline xfs_rtbxlen_t
+xfs_rtbitmap_bitcount(
+       struct xfs_mount        *mp)
+{
+       if (!mp->m_sb.sb_rextents)
+               return 0;
+
+       /* rtgroup size can be nonzero even if rextents is zero */
+       if (xfs_has_rtgroups(mp))
+               return mp->m_sb.sb_rgextents;
+
+       return mp->m_sb.sb_rextents;
+}
+
 /*
  * Compute the number of rtbitmap blocks used for a given file system.
  */
@@ -1162,7 +1177,7 @@ xfs_filblks_t
 xfs_rtbitmap_blockcount(
        struct xfs_mount        *mp)
 {
-       return xfs_rtbitmap_blockcount_len(mp, mp->m_sb.sb_rextents);
+       return xfs_rtbitmap_blockcount_len(mp, xfs_rtbitmap_bitcount(mp));
 }
 
 /*
@@ -1176,8 +1191,7 @@ xfs_rtsummary_blockcount(
 {
        unsigned long long      rsumwords;
 
-       *rsumlevels = xfs_compute_rextslog(mp->m_sb.sb_rextents) + 1;
-
+       *rsumlevels = xfs_compute_rextslog(xfs_rtbitmap_bitcount(mp)) + 1;
        rsumwords = xfs_rtbitmap_blockcount(mp) * (*rsumlevels);
        return XFS_B_TO_FSB(mp, rsumwords << XFS_WORDLOG);
 }
index 4f2e6be2ae48cc120d88b49cac3afb7cde12d11e..e294a295b3d0d82d2ee46060cf53547de694d0fb 100644 (file)
@@ -480,3 +480,84 @@ xfs_rtginode_load_parent(
        return xfs_metadir_load(tp, mp->m_metadirip, "rtgroups",
                        XFS_METAFILE_DIR, &mp->m_rtdirip);
 }
+
+/* Check superblock fields for a read or a write. */
+static xfs_failaddr_t
+xfs_rtsb_verify_common(
+       struct xfs_buf          *bp)
+{
+       struct xfs_rtsb         *rsb = bp->b_addr;
+
+       if (!xfs_verify_magic(bp, rsb->rsb_magicnum))
+               return __this_address;
+       if (rsb->rsb_pad)
+               return __this_address;
+
+       /* Everything to the end of the fs block must be zero */
+       if (memchr_inv(rsb + 1, 0, BBTOB(bp->b_length) - sizeof(*rsb)))
+               return __this_address;
+
+       return NULL;
+}
+
+/* Check superblock fields for a read or revalidation. */
+static inline xfs_failaddr_t
+xfs_rtsb_verify_all(
+       struct xfs_buf          *bp)
+{
+       struct xfs_rtsb         *rsb = bp->b_addr;
+       struct xfs_mount        *mp = bp->b_mount;
+       xfs_failaddr_t          fa;
+
+       fa = xfs_rtsb_verify_common(bp);
+       if (fa)
+               return fa;
+
+       if (memcmp(&rsb->rsb_fname, &mp->m_sb.sb_fname, XFSLABEL_MAX))
+               return __this_address;
+       if (!uuid_equal(&rsb->rsb_uuid, &mp->m_sb.sb_uuid))
+               return __this_address;
+       if (!uuid_equal(&rsb->rsb_meta_uuid, &mp->m_sb.sb_meta_uuid))
+               return  __this_address;
+
+       return NULL;
+}
+
+static void
+xfs_rtsb_read_verify(
+       struct xfs_buf          *bp)
+{
+       xfs_failaddr_t          fa;
+
+       if (!xfs_buf_verify_cksum(bp, XFS_RTSB_CRC_OFF)) {
+               xfs_verifier_error(bp, -EFSBADCRC, __this_address);
+               return;
+       }
+
+       fa = xfs_rtsb_verify_all(bp);
+       if (fa)
+               xfs_verifier_error(bp, -EFSCORRUPTED, fa);
+}
+
+static void
+xfs_rtsb_write_verify(
+       struct xfs_buf          *bp)
+{
+       xfs_failaddr_t          fa;
+
+       fa = xfs_rtsb_verify_common(bp);
+       if (fa) {
+               xfs_verifier_error(bp, -EFSCORRUPTED, fa);
+               return;
+       }
+
+       xfs_buf_update_cksum(bp, XFS_RTSB_CRC_OFF);
+}
+
+const struct xfs_buf_ops xfs_rtsb_buf_ops = {
+       .name           = "xfs_rtsb",
+       .magic          = { 0, cpu_to_be32(XFS_RTSB_MAGIC) },
+       .verify_read    = xfs_rtsb_read_verify,
+       .verify_write   = xfs_rtsb_write_verify,
+       .verify_struct  = xfs_rtsb_verify_all,
+};
index 2a5368c266ee91fe0b71018a31f64ccf842b5ebd..3c80413b67f6ec85f6a442ae6730ccc9d65081e6 100644 (file)
@@ -231,11 +231,22 @@ xfs_validate_sb_read(
        return 0;
 }
 
+/* Return the number of extents covered by a single rt bitmap file */
+static xfs_rtbxlen_t
+xfs_extents_per_rbm(
+       struct xfs_sb           *sbp)
+{
+       if (xfs_sb_is_v5(sbp) &&
+           (sbp->sb_features_incompat & XFS_SB_FEAT_INCOMPAT_METADIR))
+               return sbp->sb_rgextents;
+       return sbp->sb_rextents;
+}
+
 static uint64_t
-xfs_sb_calc_rbmblocks(
+xfs_expected_rbmblocks(
        struct xfs_sb           *sbp)
 {
-       return howmany_64(sbp->sb_rextents, NBBY * sbp->sb_blocksize);
+       return howmany_64(xfs_extents_per_rbm(sbp), NBBY * sbp->sb_blocksize);
 }
 
 /* Validate the realtime geometry */
@@ -257,7 +268,7 @@ xfs_validate_rt_geometry(
        if (sbp->sb_rextents == 0 ||
            sbp->sb_rextents != div_u64(sbp->sb_rblocks, sbp->sb_rextsize) ||
            sbp->sb_rextslog != xfs_compute_rextslog(sbp->sb_rextents) ||
-           sbp->sb_rbmblocks != xfs_sb_calc_rbmblocks(sbp))
+           sbp->sb_rbmblocks != xfs_expected_rbmblocks(sbp))
                return false;
 
        return true;
@@ -338,6 +349,59 @@ xfs_validate_sb_write(
        return 0;
 }
 
+static int
+xfs_validate_sb_rtgroups(
+       struct xfs_mount        *mp,
+       struct xfs_sb           *sbp)
+{
+       uint64_t                groups;
+
+       if (sbp->sb_rextsize == 0) {
+               xfs_warn(mp,
+"Realtime extent size must not be zero.");
+               return -EINVAL;
+       }
+
+       if (sbp->sb_rgextents > XFS_MAX_RGBLOCKS / sbp->sb_rextsize) {
+               xfs_warn(mp,
+"Realtime group size (%u) must be less than %u rt extents.",
+                               sbp->sb_rgextents,
+                               XFS_MAX_RGBLOCKS / sbp->sb_rextsize);
+               return -EINVAL;
+       }
+
+       if (sbp->sb_rgextents < XFS_MIN_RGEXTENTS) {
+               xfs_warn(mp,
+"Realtime group size (%u) must be at least %u rt extents.",
+                               sbp->sb_rgextents, XFS_MIN_RGEXTENTS);
+               return -EINVAL;
+       }
+
+       if (sbp->sb_rgcount > XFS_MAX_RGNUMBER) {
+               xfs_warn(mp,
+"Realtime groups (%u) must be less than %u.",
+                               sbp->sb_rgcount, XFS_MAX_RGNUMBER);
+               return -EINVAL;
+       }
+
+       groups = howmany_64(sbp->sb_rextents, sbp->sb_rgextents);
+       if (groups != sbp->sb_rgcount) {
+               xfs_warn(mp,
+"Realtime groups (%u) do not cover the entire rt section; need (%llu) groups.",
+                               sbp->sb_rgcount, groups);
+               return -EINVAL;
+       }
+
+       /* Exchange-range is required for fsr to work on realtime files */
+       if (!(sbp->sb_features_incompat & XFS_SB_FEAT_INCOMPAT_EXCHRANGE)) {
+               xfs_warn(mp,
+"Realtime groups feature requires exchange-range support.");
+               return -EINVAL;
+       }
+
+       return 0;
+}
+
 /* Check the validity of the SB. */
 STATIC int
 xfs_validate_sb_common(
@@ -349,6 +413,7 @@ xfs_validate_sb_common(
        uint32_t                agcount = 0;
        uint32_t                rem;
        bool                    has_dalign;
+       int                     error;
 
        if (!xfs_verify_magic(bp, dsb->sb_magicnum)) {
                xfs_warn(mp,
@@ -412,6 +477,12 @@ xfs_validate_sb_common(
                                sbp->sb_spino_align);
                        return -EINVAL;
                }
+
+               if (sbp->sb_features_incompat & XFS_SB_FEAT_INCOMPAT_METADIR) {
+                       error = xfs_validate_sb_rtgroups(mp, sbp);
+                       if (error)
+                               return error;
+               }
        } else if (sbp->sb_qflags & (XFS_PQUOTA_ENFD | XFS_GQUOTA_ENFD |
                                XFS_PQUOTA_CHKD | XFS_GQUOTA_CHKD)) {
                        xfs_notice(mp,
@@ -703,13 +774,15 @@ __xfs_sb_from_disk(
        if (convert_xquota)
                xfs_sb_quota_from_disk(to);
 
-       if (to->sb_features_incompat & XFS_SB_FEAT_INCOMPAT_METADIR)
+       if (to->sb_features_incompat & XFS_SB_FEAT_INCOMPAT_METADIR) {
                to->sb_metadirino = be64_to_cpu(from->sb_metadirino);
-       else
+               to->sb_rgcount = be32_to_cpu(from->sb_rgcount);
+               to->sb_rgextents = be32_to_cpu(from->sb_rgextents);
+       } else {
                to->sb_metadirino = NULLFSINO;
-
-       to->sb_rgcount = 1;
-       to->sb_rgextents = 0;
+               to->sb_rgcount = 1;
+               to->sb_rgextents = 0;
+       }
 }
 
 void
@@ -858,8 +931,11 @@ xfs_sb_to_disk(
        if (from->sb_features_incompat & XFS_SB_FEAT_INCOMPAT_META_UUID)
                uuid_copy(&to->sb_meta_uuid, &from->sb_meta_uuid);
 
-       if (from->sb_features_incompat & XFS_SB_FEAT_INCOMPAT_METADIR)
+       if (from->sb_features_incompat & XFS_SB_FEAT_INCOMPAT_METADIR) {
                to->sb_metadirino = cpu_to_be64(from->sb_metadirino);
+               to->sb_rgcount = cpu_to_be32(from->sb_rgcount);
+               to->sb_rgextents = cpu_to_be32(from->sb_rgextents);
+       }
 }
 
 /*
@@ -999,9 +1075,9 @@ xfs_mount_sb_set_rextsize(
        mp->m_rtxblklog = log2_if_power2(sbp->sb_rextsize);
        mp->m_rtxblkmask = mask64_if_power2(sbp->sb_rextsize);
 
-       mp->m_rgblocks = 0;
-       mp->m_rgblklog = 0;
-       mp->m_rgblkmask = (uint64_t)-1;
+       mp->m_rgblocks = sbp->sb_rgextents * sbp->sb_rextsize;
+       mp->m_rgblklog = log2_if_power2(mp->m_rgblocks);
+       mp->m_rgblkmask = mask64_if_power2(mp->m_rgblocks);
 
        rgs->blocks = 0;
        rgs->blklog = 0;
index 33b84a3a83ff6340cfd146050a057ff27209d6f3..552365d212ea261bf62354d5e32e5df17048e6ce 100644 (file)
@@ -39,6 +39,7 @@ extern const struct xfs_buf_ops xfs_inode_buf_ra_ops;
 extern const struct xfs_buf_ops xfs_refcountbt_buf_ops;
 extern const struct xfs_buf_ops xfs_rmapbt_buf_ops;
 extern const struct xfs_buf_ops xfs_rtbuf_ops;
+extern const struct xfs_buf_ops xfs_rtsb_buf_ops;
 extern const struct xfs_buf_ops xfs_sb_buf_ops;
 extern const struct xfs_buf_ops xfs_sb_quiet_buf_ops;
 extern const struct xfs_buf_ops xfs_symlink_buf_ops;