]> git.ipfire.org Git - thirdparty/postgresql.git/commit
Fix a recently-introduced race condition in LISTEN/NOTIFY handling.
authorTom Lane <tgl@sss.pgh.pa.us>
Sat, 28 Nov 2020 19:03:40 +0000 (14:03 -0500)
committerTom Lane <tgl@sss.pgh.pa.us>
Sat, 28 Nov 2020 19:03:40 +0000 (14:03 -0500)
commitf5de090cc175072b9ececcf48f55ffc502c06add
tree23ef0789bb68677d897f3df04e2f4c25616f1cde
parentdcc20946a8fc192a71cedcaae25c996973747ff5
Fix a recently-introduced race condition in LISTEN/NOTIFY handling.

Commit 566372b3d fixed some race conditions involving concurrent
SimpleLruTruncate calls, but it introduced new ones in async.c.
A newly-listening backend could attempt to read Notify SLRU pages that
were in process of being truncated, possibly causing an error.  Also,
the QUEUE_TAIL pointer could become set to a value that's not equal to
the queue position of any backend.  While that's fairly harmless in
v13 and up (thanks to commit 51004c717), in older branches it resulted
in near-permanent disabling of the queue truncation logic, so that
continued use of NOTIFY led to queue-fill warnings and eventual
inability to send any more notifies.  (A server restart is enough to
make that go away, but it's still pretty unpleasant.)

The core of the problem is confusion about whether QUEUE_TAIL
represents the "logical" tail of the queue (i.e., the oldest
still-interesting data) or the "physical" tail (the oldest data we've
not yet truncated away).  To fix, split that into two variables.
QUEUE_TAIL regains its definition as the logical tail, and we
introduce a new variable to track the oldest un-truncated page.

Per report from Mikael Gustavsson.  Like the previous patch,
back-patch to all supported branches.

Discussion: https://postgr.es/m/1b8561412e8a4f038d7a491c8b922788@smhi.se
src/backend/commands/async.c