]> git.ipfire.org Git - thirdparty/systemd.git/commit
tree-wide: open block device locks in writable mode 39390/head
authorLennart Poettering <lennart@poettering.net>
Wed, 22 Oct 2025 20:47:53 +0000 (22:47 +0200)
committerLennart Poettering <lennart@poettering.net>
Wed, 22 Oct 2025 20:56:02 +0000 (22:56 +0200)
commite582484789a6d889d11b97d9c2afa74c3c985130
treef98a40fe4d3a6988d7fed5fb13a782378c0bd21b
parent46da450f139487e62efc2f566fe7c1536648ee75
tree-wide: open block device locks in writable mode

udev's block device locking protocol has one pitfall not even the
example in the documentation got right so far (even though this is
explained in all detail above): udev's rescanning is only triggered when
an fd that is opened for writing is closed. This means that if a
separate locking fd is opened on a block device – one that is maintained
independently of the fd actually used for writing – it must be opened for
writing too, so that closing the lock definitely triggers a rescan. This
matters in cases where the lock fd is kept for longer than the fd used
for writing to disk. (Because otherwise udev might get the
IN_CLOSE_WRITE event, but when it tries to rescan will find the device
locked, and never retry because no IN_CLOSE_WRITE is triggred anymore.)

Let's fix that across the codebase, at 4 places:

1. in makefs (a lock fd is kept, and mkfs then invoked as child, which
   uses a different fd, and the lock fd is closed only once the child
   died)

2. in udevadm lock (embarassing!): which is intended to be used to wrap tools
   that modify disk contents, very similar to the makefs case. The lock
   is also kept until after the tool exited.

3. In storagetm: the kernel nvme-tcp layer writes to the device
   directly, we just keep a lock fd.

4. the example in BLOCK_DEVICE_LOCKING.md
docs/BLOCK_DEVICE_LOCKING.md
src/growfs/makefs.c
src/shared/blockdev-util.c
src/shared/blockdev-util.h
src/storagetm/storagetm.c
src/udev/udevadm-lock.c