]> git.ipfire.org Git - thirdparty/xfsprogs-dev.git/commitdiff
xfs: implement zoned garbage collection
authorChristoph Hellwig <hch@lst.de>
Mon, 14 Apr 2025 05:36:04 +0000 (07:36 +0200)
committerAndrey Albershteyn <aalbersh@kernel.org>
Tue, 29 Apr 2025 16:09:57 +0000 (18:09 +0200)
Source kernel commit: 080d01c41d44f0993f2c235a6bfdb681f0a66be6

RT groups on a zoned file system need to be completely empty before their
space can be reused.  This means that partially empty groups need to be
emptied entirely to free up space if no entirely free groups are
available.

Add a garbage collection thread that moves all data out of the least used
zone when not enough free zones are available, and which resets all zones
that have been emptied.  To find empty zone a simple set of 10 buckets
based on the amount of space used in the zone is used.  To empty zones,
the rmap is walked to find the owners and the data is read and then
written to the new place.

To automatically defragment files the rmap records are sorted by inode
and logical offset.  This means defragmentation of parallel writes into
a single zone happens automatically when performing garbage collection.
Because holding the iolock over the entire GC cycle would inject very
noticeable latency for other accesses to the inodes, the iolock is not
taken while performing I/O.  Instead the I/O completion handler checks
that the mapping hasn't changed over the one recorded at the start of
the GC cycle and doesn't update the mapping if it change.

Co-developed-by: Hans Holmberg <hans.holmberg@wdc.com>
Signed-off-by: Hans Holmberg <hans.holmberg@wdc.com>
Signed-off-by: Christoph Hellwig <hch@lst.de>
Reviewed-by: Darrick J. Wong <djwong@kernel.org>
Signed-off-by: Christoph Hellwig <hch@lst.de>
libxfs/xfs_group.h
libxfs/xfs_rtgroup.h

index a70096113384e019ae0b095d2458d3aba379c496..cff3f815947bfca1a49cb1116621f1770393018f 100644 (file)
@@ -19,10 +19,23 @@ struct xfs_group {
 #ifdef __KERNEL__
        /* -- kernel only structures below this line -- */
 
-       /*
-        * Track freed but not yet committed extents.
-        */
-       struct xfs_extent_busy_tree *xg_busy_extents;
+       union {
+               /*
+                * For perags and non-zoned RT groups:
+                * Track freed but not yet committed extents.
+                */
+               struct xfs_extent_busy_tree     *xg_busy_extents;
+
+               /*
+                * For zoned RT groups:
+                * List of groups that need a zone reset.
+                *
+                * The zonegc code forces a log flush of the rtrmap inode before
+                * resetting the write pointer, so there is no need for
+                * individual busy extent tracking.
+                */
+               struct xfs_group                *xg_next_reset;
+       };
 
        /*
         * Bitsets of per-ag metadata that have been checked and/or are sick.
index 5d8777f819f4359d9f0ddfeac161351a00f1fa0b..b325aff28264d5066517a322ec9e20f33656e3df 100644 (file)
@@ -58,6 +58,12 @@ struct xfs_rtgroup {
  */
 #define XFS_RTG_FREE                   XA_MARK_0
 
+/*
+ * For zoned RT devices this is set on groups that are fully written and that
+ * have unused blocks.  Used by the garbage collection to pick targets.
+ */
+#define XFS_RTG_RECLAIMABLE            XA_MARK_1
+
 static inline struct xfs_rtgroup *to_rtg(struct xfs_group *xg)
 {
        return container_of(xg, struct xfs_rtgroup, rtg_group);