]> git.ipfire.org Git - thirdparty/postgresql.git/commitdiff
Fix race condition in committing a serializable transaction
authorHeikki Linnakangas <heikki.linnakangas@iki.fi>
Mon, 21 Oct 2024 06:49:21 +0000 (09:49 +0300)
committerHeikki Linnakangas <heikki.linnakangas@iki.fi>
Mon, 21 Oct 2024 06:49:29 +0000 (09:49 +0300)
The finished transaction list can contain XIDs that are older than the
serializable global xmin. It's a short-lived state;
ClearOldPredicateLocks() removes any such transactions from the list,
and it's called whenever the global xmin advances. But if another
backend calls SummarizeOldestCommittedSxact() in that window, it will
call SerialAdd() on an XID that's older than the global xmin, or if
there are no more transactions running, when global xmin is
invalid. That trips the assertion in SerialAdd().

Fixes bug #18658 reported by Andrew Bille. Thanks to Alexander Lakhin
for analysis. Backpatch to all versions.

Discussion: https://www.postgresql.org/message-id/18658-7dab125ec688c70b%40postgresql.org

src/backend/storage/lmgr/predicate.c

index b455b78f9f70607b53b33f4ced58528c46a97f3c..2c87273e17e0d34a30b32f0d017ea29e9a9a7da6 100644 (file)
@@ -877,12 +877,17 @@ SerialAdd(TransactionId xid, SerCommitSeqNo minConflictCommitSeqNo)
        LWLockAcquire(SerialControlLock, LW_EXCLUSIVE);
 
        /*
-        * If no serializable transactions are active, there shouldn't be anything
-        * to push out to the SLRU.  Hitting this assert would mean there's
-        * something wrong with the earlier cleanup logic.
+        * If 'xid' is older than the global xmin (== tailXid), there's no need to
+        * store it, after all. This can happen if the oldest transaction holding
+        * back the global xmin just finished, making 'xid' uninteresting, but
+        * ClearOldPredicateLocks() has not yet run.
         */
        tailXid = serialControl->tailXid;
-       Assert(TransactionIdIsValid(tailXid));
+       if (!TransactionIdIsValid(tailXid) || TransactionIdPrecedes(xid, tailXid))
+       {
+               LWLockRelease(SerialControlLock);
+               return;
+       }
 
        /*
         * If the SLRU is currently unused, zero out the whole active region from