]> git.ipfire.org Git - thirdparty/linux.git/commitdiff
fs: add ioctl to query metadata and protection info capabilities
authorAnuj Gupta <anuj20.g@samsung.com>
Mon, 30 Jun 2025 09:05:48 +0000 (14:35 +0530)
committerChristian Brauner <brauner@kernel.org>
Tue, 1 Jul 2025 12:00:15 +0000 (14:00 +0200)
Add a new ioctl, FS_IOC_GETLBMD_CAP, to query metadata and protection
info (PI) capabilities. This ioctl returns information about the files
integrity profile. This is useful for userspace applications to
understand a files end-to-end data protection support and configure the
I/O accordingly.

For now this interface is only supported by block devices. However the
design and placement of this ioctl in generic FS ioctl space allows us
to extend it to work over files as well. This maybe useful when
filesystems start supporting  PI-aware layouts.

A new structure struct logical_block_metadata_cap is introduced, which
contains the following fields:

1. lbmd_flags: bitmask of logical block metadata capability flags
2. lbmd_interval: the amount of data described by each unit of logical
block metadata
3. lbmd_size: size in bytes of the logical block metadata associated
with each interval
4. lbmd_opaque_size: size in bytes of the opaque block tag associated
with each interval
5. lbmd_opaque_offset: offset in bytes of the opaque block tag within
the logical block metadata
6. lbmd_pi_size: size in bytes of the T10 PI tuple associated with each
interval
7. lbmd_pi_offset: offset in bytes of T10 PI tuple within the logical
block metadata
8. lbmd_pi_guard_tag_type: T10 PI guard tag type
9. lbmd_pi_app_tag_size: size in bytes of the T10 PI application tag
10. lbmd_pi_ref_tag_size: size in bytes of the T10 PI reference tag
11. lbmd_pi_storage_tag_size: size in bytes of the T10 PI storage tag

The internal logic to fetch the capability is encapsulated in a helper
function blk_get_meta_cap(), which uses the blk_integrity profile
associated with the device. The ioctl returns -EOPNOTSUPP, if
CONFIG_BLK_DEV_INTEGRITY is not enabled.

Suggested-by: Martin K. Petersen <martin.petersen@oracle.com>
Signed-off-by: Anuj Gupta <anuj20.g@samsung.com>
Signed-off-by: Kanchan Joshi <joshi.k@samsung.com>
Link: https://lore.kernel.org/20250630090548.3317-5-anuj20.g@samsung.com
Reviewed-by: Martin K. Petersen <martin.petersen@oracle.com>
Reviewed-by: Christoph Hellwig <hch@lst.de>
Signed-off-by: Christian Brauner <brauner@kernel.org>
block/blk-integrity.c
block/ioctl.c
include/linux/blk-integrity.h
include/uapi/linux/fs.h

index c1102bf4cd8d11c67477201acdf788095ba8b8ed..9d9dc9c32083f2eb9684a299d261a46aac991383 100644 (file)
@@ -13,6 +13,7 @@
 #include <linux/scatterlist.h>
 #include <linux/export.h>
 #include <linux/slab.h>
+#include <linux/t10-pi.h>
 
 #include "blk.h"
 
@@ -54,6 +55,57 @@ new_segment:
        return segments;
 }
 
+int blk_get_meta_cap(struct block_device *bdev, unsigned int cmd,
+                    struct logical_block_metadata_cap __user *argp)
+{
+       struct blk_integrity *bi = blk_get_integrity(bdev->bd_disk);
+       struct logical_block_metadata_cap meta_cap = {};
+       size_t usize = _IOC_SIZE(cmd);
+
+       if (!argp)
+               return -EINVAL;
+       if (usize < LBMD_SIZE_VER0)
+               return -EINVAL;
+       if (!bi)
+               goto out;
+
+       if (bi->flags & BLK_INTEGRITY_DEVICE_CAPABLE)
+               meta_cap.lbmd_flags |= LBMD_PI_CAP_INTEGRITY;
+       if (bi->flags & BLK_INTEGRITY_REF_TAG)
+               meta_cap.lbmd_flags |= LBMD_PI_CAP_REFTAG;
+       meta_cap.lbmd_interval = 1 << bi->interval_exp;
+       meta_cap.lbmd_size = bi->metadata_size;
+       meta_cap.lbmd_pi_size = bi->pi_tuple_size;
+       meta_cap.lbmd_pi_offset = bi->pi_offset;
+       meta_cap.lbmd_opaque_size = bi->metadata_size - bi->pi_tuple_size;
+       if (meta_cap.lbmd_opaque_size && !bi->pi_offset)
+               meta_cap.lbmd_opaque_offset = bi->pi_tuple_size;
+
+       meta_cap.lbmd_guard_tag_type = bi->csum_type;
+       if (bi->csum_type != BLK_INTEGRITY_CSUM_NONE)
+               meta_cap.lbmd_app_tag_size = 2;
+
+       if (bi->flags & BLK_INTEGRITY_REF_TAG) {
+               switch (bi->csum_type) {
+               case BLK_INTEGRITY_CSUM_CRC64:
+                       meta_cap.lbmd_ref_tag_size =
+                               sizeof_field(struct crc64_pi_tuple, ref_tag);
+                       break;
+               case BLK_INTEGRITY_CSUM_CRC:
+               case BLK_INTEGRITY_CSUM_IP:
+                       meta_cap.lbmd_ref_tag_size =
+                               sizeof_field(struct t10_pi_tuple, ref_tag);
+                       break;
+               default:
+                       break;
+               }
+       }
+
+out:
+       return copy_struct_to_user(argp, usize, &meta_cap, sizeof(meta_cap),
+                                  NULL);
+}
+
 /**
  * blk_rq_map_integrity_sg - Map integrity metadata into a scatterlist
  * @rq:                request to map
index e472cc1030c60ce20ffc6fa1c2953bd5cf47602d..9ad403733e19befad6323885730f48fd204d276e 100644 (file)
@@ -13,6 +13,7 @@
 #include <linux/uaccess.h>
 #include <linux/pagemap.h>
 #include <linux/io_uring/cmd.h>
+#include <linux/blk-integrity.h>
 #include <uapi/linux/blkdev.h>
 #include "blk.h"
 #include "blk-crypto-internal.h"
@@ -566,6 +567,9 @@ static int blkdev_common_ioctl(struct block_device *bdev, blk_mode_t mode,
 {
        unsigned int max_sectors;
 
+       if (_IOC_NR(cmd) == _IOC_NR(FS_IOC_GETLBMD_CAP))
+               return blk_get_meta_cap(bdev, cmd, argp);
+
        switch (cmd) {
        case BLKFLSBUF:
                return blkdev_flushbuf(bdev, cmd, arg);
index d27730da47f36a265c85e107a1d3b4c01a7c54b3..e04c6e5bf1c68b0befebfaa75d3327ec987cf17f 100644 (file)
@@ -29,6 +29,8 @@ int blk_rq_map_integrity_sg(struct request *, struct scatterlist *);
 int blk_rq_count_integrity_sg(struct request_queue *, struct bio *);
 int blk_rq_integrity_map_user(struct request *rq, void __user *ubuf,
                              ssize_t bytes);
+int blk_get_meta_cap(struct block_device *bdev, unsigned int cmd,
+                    struct logical_block_metadata_cap __user *argp);
 
 static inline bool
 blk_integrity_queue_supports_integrity(struct request_queue *q)
@@ -92,6 +94,11 @@ static inline struct bio_vec rq_integrity_vec(struct request *rq)
                                 rq->bio->bi_integrity->bip_iter);
 }
 #else /* CONFIG_BLK_DEV_INTEGRITY */
+static inline int blk_get_meta_cap(struct block_device *bdev, unsigned int cmd,
+                                  struct logical_block_metadata_cap __user *argp)
+{
+       return -EOPNOTSUPP;
+}
 static inline int blk_rq_count_integrity_sg(struct request_queue *q,
                                            struct bio *b)
 {
index 0098b0ce8ccb1f194f67972b31265c8e82f7bf58..83720a2fd20de874e46454f5cca5906eb88d2b4e 100644 (file)
@@ -91,6 +91,63 @@ struct fs_sysfs_path {
        __u8                    name[128];
 };
 
+/* Protection info capability flags */
+#define        LBMD_PI_CAP_INTEGRITY           (1 << 0)
+#define        LBMD_PI_CAP_REFTAG              (1 << 1)
+
+/* Checksum types for Protection Information */
+#define LBMD_PI_CSUM_NONE              0
+#define LBMD_PI_CSUM_IP                        1
+#define LBMD_PI_CSUM_CRC16_T10DIF      2
+#define LBMD_PI_CSUM_CRC64_NVME                4
+
+/* sizeof first published struct */
+#define LBMD_SIZE_VER0                 16
+
+/*
+ * Logical block metadata capability descriptor
+ * If the device does not support metadata, all the fields will be zero.
+ * Applications must check lbmd_flags to determine whether metadata is
+ * supported or not.
+ */
+struct logical_block_metadata_cap {
+       /* Bitmask of logical block metadata capability flags */
+       __u32   lbmd_flags;
+       /*
+        * The amount of data described by each unit of logical block
+        * metadata
+        */
+       __u16   lbmd_interval;
+       /*
+        * Size in bytes of the logical block metadata associated with each
+        * interval
+        */
+       __u8    lbmd_size;
+       /*
+        * Size in bytes of the opaque block tag associated with each
+        * interval
+        */
+       __u8    lbmd_opaque_size;
+       /*
+        * Offset in bytes of the opaque block tag within the logical block
+        * metadata
+        */
+       __u8    lbmd_opaque_offset;
+       /* Size in bytes of the T10 PI tuple associated with each interval */
+       __u8    lbmd_pi_size;
+       /* Offset in bytes of T10 PI tuple within the logical block metadata */
+       __u8    lbmd_pi_offset;
+       /* T10 PI guard tag type */
+       __u8    lbmd_guard_tag_type;
+       /* Size in bytes of the T10 PI application tag */
+       __u8    lbmd_app_tag_size;
+       /* Size in bytes of the T10 PI reference tag */
+       __u8    lbmd_ref_tag_size;
+       /* Size in bytes of the T10 PI storage tag */
+       __u8    lbmd_storage_tag_size;
+       __u8    pad;
+};
+
 /* extent-same (dedupe) ioctls; these MUST match the btrfs ioctl definitions */
 #define FILE_DEDUPE_RANGE_SAME         0
 #define FILE_DEDUPE_RANGE_DIFFERS      1
@@ -247,6 +304,8 @@ struct fsxattr {
  * also /sys/kernel/debug/ for filesystems with debugfs exports
  */
 #define FS_IOC_GETFSSYSFSPATH          _IOR(0x15, 1, struct fs_sysfs_path)
+/* Get logical block metadata capability details */
+#define FS_IOC_GETLBMD_CAP             _IOWR(0x15, 2, struct logical_block_metadata_cap)
 
 /*
  * Inode flags (FS_IOC_GETFLAGS / FS_IOC_SETFLAGS)