]> git.ipfire.org Git - thirdparty/linux.git/commitdiff
Merge tag 'vfs-7.2-rc1.misc' of git://git.kernel.org/pub/scm/linux/kernel/git/vfs/vfs
authorLinus Torvalds <torvalds@linux-foundation.org>
Sun, 14 Jun 2026 22:29:45 +0000 (03:59 +0530)
committerLinus Torvalds <torvalds@linux-foundation.org>
Sun, 14 Jun 2026 22:29:45 +0000 (03:59 +0530)
Pull misc vfs updates from Christian Brauner:
 "Features:

   - Reduce pipe->mutex contention by pre-allocating pages outside the
     lock in anon_pipe_write().

     anon_pipe_write() called alloc_page() once per page while holding
     pipe->mutex. The allocation can sleep doing direct reclaim and runs
     memcg charging, which extends the critical section and stalls any
     concurrent reader on the same mutex. Now up to 8 pages are
     pre-allocated before the mutex is taken, leftovers are recycled
     into the per-pipe tmp_page[] cache before unlock, and any remainder
     is released after unlock, keeping the allocator out of the critical
     section on both sides. On a writers x readers sweep with 64KB
     writes against a 1 MB pipe throughput improves 6-28% and average
     write latency drops 5-22%; under memory pressure - when the cost of
     holding the mutex across reclaim is highest - throughput improves
     21-48% and latency drops 17-33%. The microbenchmark is added to
     selftests.

   - uaccess/sockptr: fix the ignored_trailing logic in
     copy_struct_to_user() to behave as documented and the usize check
     in copy_struct_from_sockptr() for user pointers, and add
     copy_struct_{from,to}_bounce_buffer() and copy_struct_to_sockptr()
     helpers for upcoming users (IPPROTO_SMBDIRECT, IPPROTO_QUIC).

   - bpf: add a sleepable bpf_real_inode() kfunc that resolves the real
     inode backing a dentry via d_real_inode(). On overlayfs the inode
     attached to the dentry doesn't carry the underlying device
     information; this is used by the filesystem restriction BPF program
     that was merged into systemd.

   - docs: add guidelines for submitting new filesystems, motivated by
     the maintenance burden abandoned and untestable filesystems impose
     on VFS developers, blocking infrastructure work like folio
     conversions and iomap migration.

  Fixes:

   - libfs: set SB_I_NOEXEC and SB_I_NODEV by default in init_pseudo()
     and drop the now-redundant assignments in callers. This began as a
     one-line dma-buf fix for a path_noexec() warning; a pseudo
     filesystem has no reason not to set SB_I_NOEXEC. All init_pseudo()
     callers were audited: the only visible effect is on dma-buf where
     SB_I_NOEXEC silences the warning.

   - Handle set_blocksize() failures in legacy filesystems (bfs, hpfs,
     qnx4, jfs, befs, affs, isofs, minix, ntfs3, omfs). Mounting a
     device with a sector size > PAGE_SIZE crashed roughly half of them;
     the rest had the same missing error handling pattern. Plus a
     follow-up releasing the superblock buffer_head when setting the
     minix v3 block size fails.

   - mount: honour SB_NOUSER in the new mount API.

   - fs/fcntl: fix a SOFTIRQ-unsafe lock order in fasync signaling by
     switching the process-group paths of send_sigio() and send_sigurg()
     from read_lock(&tasklist_lock) to RCU, matching the single-PID
     path.

   - vfs: add an FS_USERNS_DELEGATABLE flag and set it for NFS, fixing
     delegated NFS mounts (fsopen() in a container with the mount
     performed by a privileged daemon) that broke when non-init
     s_user_ns was tied to FS_USERNS_MOUNT.

   - selftests/namespaces: fix a hang in nsid_test where an unreaped
     grandchild kept the TAP pipe write-end open, a waitpid(-1) race in
     listns_efault_test, and a false FAIL on kernels without listns()
     where the tests should SKIP.

   - filelock: fix the break_lease() stub signature for
     CONFIG_FILE_LOCKING=n.

   - init/initramfs_test: wait for the async initramfs unpacking before
     running; the test and do_populate_rootfs() share the parser state.

   - fs/coredump: reduce redundant log noise in
     validate_coredump_safety().

   - iomap: pass the correct length to fserror_report_io() in
     __iomap_write_begin().

   - backing-file: fix the backing_file_open() kerneldoc.

  Cleanups:

   - initramfs: refactor the cpio hex header parsing to use hex2bin()
     instead of the hand-rolled simple_strntoul() which is reverted, and
     extend the initramfs KUnit tests to cover header fields with 0x
     prefixes.

   - Replace __get_free_pages() and friends with kmalloc()/kzalloc()
     across quota, proc, ocfs2/dlm, nilfs2, nfs, nfsd, libfs, jfs, jbd2,
     isofs, fuse, select, namespace, configfs, binfmt_misc, bfs, and the
     do_mounts init code - part of the larger work of replacing page
     allocator calls with kmalloc().

   - Use clear_and_wake_up_bit() in unlock_buffer() and
     journal_end_buffer_io_sync() instead of open-coding the sequence.

   - Drop unused VFS exports: unexport drop_super_exclusive(), remove
     start_removing_user_path_at(), and fold __start_removing_path()
     into start_removing_path().

   - fs/read_write: narrow the __kernel_write() export with
     EXPORT_SYMBOL_FOR_MODULES().

   - vfs: uapi: retire octal and hex constants in favor of (1 << n) for
     the O_ flags. Finding a free bit for a new flag across the
     architectures was needlessly hard with the mixed bases.

   - dcache: add extra sanity checks of dead dentries in dentry_free()
     via a new DENTRY_WARN_ONCE() that also prints d_flags.

   - iov_iter: use kmemdup_array() in dup_iter() to harden the
     allocation against multiplication overflow.

   - fs/pipe: write to ->poll_usage only once.

   - vfs: remove an always-taken if-branch in find_next_fd().

   - dcache: use kmalloc_flex() for struct external_name in __d_alloc().

   - namei: use QSTR() instead of QSTR_INIT() in path_pts().

   - sync_file_range: delete dead S_ISLNK code.

   - Comment fixes: retire a stale comment in fget_task_next() and fix
     assorted spelling mistakes"

* tag 'vfs-7.2-rc1.misc' of git://git.kernel.org/pub/scm/linux/kernel/git/vfs/vfs: (73 commits)
  backing-file: fix backing_file_open() kerneldoc parameter
  iomap: pass the correct len to fserror_report_io in __iomap_write_begin
  vfs: add FS_USERNS_DELEGATABLE flag and set it for NFS
  filelock: fix break_lease() stub signature for CONFIG_FILE_LOCKING=n
  vfs: uapi: retire octal and hex numbers in favor of (1 << n) for O_ flags
  bpf: add bpf_real_inode() kfunc
  fs/read_write: Do not export __kernel_write() to the entire world
  libfs: drop redundant SB_I_NOEXEC/SB_I_NODEV in init_pseudo() callers
  libfs: set SB_I_NOEXEC and SB_I_NODEV by default in init_pseudo()
  mount: honour SB_NOUSER in the new mount API
  fs/fcntl: fix SOFTIRQ-unsafe lock order in fasync signaling
  selftests/pipe: add pipe_bench microbenchmark
  fs/pipe: pre-allocate pages outside pipe->mutex in anon_pipe_write
  fs: retire stale comment in fget_task_next()
  fs: fix spelling mistakes in comment
  bfs: replace get_zeroed_page() with kzalloc()
  binfmt_misc: replace __get_free_page() with kmalloc()
  configfs: replace __get_free_pages() with kzalloc()
  fs/namespace: use __getname() to allocate mntpath buffer
  fs/select: replace __get_free_page() with kmalloc()
  ...

23 files changed:
1  2 
fs/bpf_fs_kfuncs.c
fs/buffer.c
fs/coredump.c
fs/dcache.c
fs/exec.c
fs/fcntl.c
fs/iomap/buffered-io.c
fs/isofs/dir.c
fs/jbd2/commit.c
fs/jbd2/journal.c
fs/namei.c
fs/namespace.c
fs/nfsd/vfs.c
fs/nsfs.c
fs/pidfs.c
fs/proc/base.c
fs/select.c
fs/super.c
include/linux/filelock.h
include/linux/fs.h
include/linux/namei.h
include/uapi/asm-generic/fcntl.h
tools/testing/selftests/Makefile

Simple merge
diff --cc fs/buffer.c
Simple merge
diff --cc fs/coredump.c
Simple merge
diff --cc fs/dcache.c
Simple merge
diff --cc fs/exec.c
Simple merge
diff --cc fs/fcntl.c
Simple merge
index 5a107d59ae27f8ab95861a7f3036d3704145a7a0,bcf4559e9aa7d4bcc4bca00aa908a561452e2838..8d4806dc46d468b4a930441998e6edf8ec716f16
@@@ -905,12 -850,9 +905,12 @@@ static int __iomap_write_begin(const st
                        if (status < 0)
                                fserror_report_io(iter->inode,
                                                  FSERR_BUFFERED_READ, pos,
-                                                 len, status, GFP_NOFS);
+                                                 plen, status, GFP_NOFS);
                        if (status)
                                return status;
 +
 +                      if (iomap->flags & IOMAP_F_ZERO_TAIL)
 +                              folio_zero_segment(folio, to, poff + plen);
                }
                iomap_set_range_uptodate(folio, poff, plen);
        } while ((block_start += plen) < block_end);
diff --cc fs/isofs/dir.c
index 55385a72a4ce0de4cadb3f361317cf5d5609367b,6d220eab531e5935f49aaacc807c5c6c55f9d22d..cc587cd251623ca4b84d01b6018d47df7d1a3655
@@@ -13,8 -13,8 +13,9 @@@
   */
  #include <linux/gfp.h>
  #include <linux/filelock.h>
+ #include <linux/slab.h>
  #include "isofs.h"
 +#include <linux/fileattr.h>
  
  int isofs_name_translate(struct iso_directory_record *de, char *new, struct inode *inode)
  {
Simple merge
Simple merge
diff --cc fs/namei.c
index 6b87b40c208f5eb79f3a9326fd222a79f99789ee,96d553caf9158044077ef434efdc8f3c756fccc6..8340dc4108bef3627305250bbe02bc1001c5f306
@@@ -2966,10 -2961,10 +2966,11 @@@ struct dentry *start_removing_path(cons
        struct path parent_path __free(path_put) = {};
        struct dentry *d;
        struct qstr last;
 -      int type, error;
 +      enum last_type type;
 +      int error;
  
-       error = filename_parentat(dfd, name, 0, &parent_path, &last, &type);
+       error = filename_parentat(AT_FDCWD, filename, 0, &parent_path, &last,
+                       &type);
        if (error)
                return ERR_PTR(error);
        if (unlikely(type != LAST_NORM))
diff --cc fs/namespace.c
Simple merge
diff --cc fs/nfsd/vfs.c
Simple merge
diff --cc fs/nsfs.c
Simple merge
diff --cc fs/pidfs.c
Simple merge
diff --cc fs/proc/base.c
Simple merge
diff --cc fs/select.c
Simple merge
diff --cc fs/super.c
Simple merge
Simple merge
Simple merge
Simple merge
index bfc68156b45a33dd866160e5a75ba3b60308eaba,359622b083d5eba1d216ef5aff01d8caaa54c17f..883cfd7de2effaf9c8d1c0e7bf190c8bad1b5639
  #endif
  
  #ifndef __O_TMPFILE
- #define __O_TMPFILE   020000000
+ #define __O_TMPFILE   (1 << 22)
  #endif
  
 +#ifndef O_EMPTYPATH
 +#define O_EMPTYPATH   (1 << 26)       /* allow empty path */
 +#endif
 +
  /* a horrid kludge trying to make sure that this will fail on old kernels */
  #define O_TMPFILE (__O_TMPFILE | O_DIRECTORY)
  
Simple merge