]> git.ipfire.org Git - thirdparty/postgresql.git/commitdiff
Avoid misbehavior when persisting a non-stable cursor.
authorTom Lane <tgl@sss.pgh.pa.us>
Tue, 8 Jun 2021 21:50:15 +0000 (17:50 -0400)
committerTom Lane <tgl@sss.pgh.pa.us>
Tue, 8 Jun 2021 21:50:15 +0000 (17:50 -0400)
PersistHoldablePortal has long assumed that it should store the
entire output of the query-to-be-persisted, which requires rewinding
and re-reading the output.  This is problematic if the query is not
stable: we might get different row contents, or even a different
number of rows, which'd confuse the cursor state mightily.

In the case where the cursor is NO SCROLL, this is very easy to
solve: just store the remaining query output, without any rewinding,
and tweak the portal's cursor state to match.  Aside from removing
the semantic problem, this could be significantly more efficient
than storing the whole output.

If the cursor is scrollable, there's not much we can do, but it
was already the case that scrolling a volatile query's result was
pretty unsafe.  We can just document more clearly that getting
correct results from that is not guaranteed.

There are already prohibitions in place on using SCROLL with
FOR UPDATE/SHARE, which is one way for a SELECT query to have
non-stable results.  We could imagine prohibiting SCROLL when
the query contains volatile functions, but that would be
expensive to enforce.  Moreover, it could break applications
that work just fine, if they have functions that are in fact
stable but the user neglected to mark them so.  So settle for
documenting the hazard.

While this problem has existed in some guise for a long time,
it got a lot worse in v11, which introduced the possibility
of persisting plpgsql cursors (perhaps implicit ones) even
when they violate the rules for what can be marked WITH HOLD.
Hence, I've chosen to back-patch to v11 but not further.

Per bug #17050 from Алексей Булгаков.

Discussion: https://postgr.es/m/17050-f77aa827dc85247c@postgresql.org

doc/src/sgml/plpgsql.sgml
doc/src/sgml/ref/declare.sgml
src/backend/commands/portalcmds.c
src/pl/plpgsql/src/expected/plpgsql_transaction.out
src/pl/plpgsql/src/sql/plpgsql_transaction.sql

index 0ceb89c5e982119fec99a78d8d599baada522cf5..f8d66c1e5790736aac18dbb36f73659b843df0b4 100644 (file)
@@ -3013,6 +3013,15 @@ DECLARE
      is said to be <firstterm>unbound</firstterm> since it is not bound to
      any particular query.
     </para>
+
+    <para>
+     The <literal>SCROLL</literal> option cannot be used when the cursor's
+     query uses <literal>FOR UPDATE/SHARE</literal>.  Also, it is
+     best to use <literal>NO SCROLL</literal> with a query that involves
+     volatile functions.  The implementation of <literal>SCROLL</literal>
+     assumes that re-reading the query's output will give consistent
+     results, which a volatile function might not do.
+    </para>
    </sect2>
 
    <sect2 id="plpgsql-cursor-opening">
index 34ca9df2437d17a0b91369fdd18570a06524a049..2bcd1019297d84f53c3ca73ad78e3af87fb1a753 100644 (file)
@@ -228,12 +228,14 @@ DECLARE <replaceable class="parameter">name</replaceable> [ BINARY ] [ INSENSITI
 
    <caution>
     <para>
-     Scrollable and <literal>WITH HOLD</literal> cursors may give unexpected
+     Scrollable cursors may give unexpected
      results if they invoke any volatile functions (see <xref
      linkend="xfunc-volatility"/>).  When a previously fetched row is
      re-fetched, the functions might be re-executed, perhaps leading to
-     results different from the first time.  One workaround for such cases
-     is to declare the cursor <literal>WITH HOLD</literal> and commit the
+     results different from the first time.  It's best to
+     specify <literal>NO SCROLL</literal> for a query involving volatile
+     functions.  If that is not practical, one workaround
+     is to declare the cursor <literal>SCROLL WITH HOLD</literal> and commit the
      transaction before reading any rows from it.  This will force the
      entire output of the cursor to be materialized in temporary storage,
      so that volatile functions are executed exactly once for each row.
index e00ca83f0d85f57aaba7517554a5deafd18f1675..5608045a18ad058bd1b611471a5c4a8b0161b048 100644 (file)
@@ -375,10 +375,23 @@ PersistHoldablePortal(Portal portal)
                PushActiveSnapshot(queryDesc->snapshot);
 
                /*
-                * Rewind the executor: we need to store the entire result set in the
-                * tuplestore, so that subsequent backward FETCHs can be processed.
+                * If the portal is marked scrollable, we need to store the entire
+                * result set in the tuplestore, so that subsequent backward FETCHs
+                * can be processed.  Otherwise, store only the not-yet-fetched rows.
+                * (The latter is not only more efficient, but avoids semantic
+                * problems if the query's output isn't stable.)
                 */
-               ExecutorRewind(queryDesc);
+               if (portal->cursorOptions & CURSOR_OPT_SCROLL)
+               {
+                       ExecutorRewind(queryDesc);
+               }
+               else
+               {
+                       /* We must reset the cursor state as though at start of query */
+                       portal->atStart = true;
+                       portal->atEnd = false;
+                       portal->portalPos = 0;
+               }
 
                /*
                 * Change the destination to output to the tuplestore.  Note we tell
index ab81c13c286cc0f7633b1b801a837bf582db5577..595af79d56596e8323329baf2a6282156ffe993a 100644 (file)
@@ -335,6 +335,57 @@ SELECT * FROM pg_cursors;
 ------+-----------+-------------+-----------+---------------+---------------
 (0 rows)
 
+-- interaction of FOR UPDATE cursor with subsequent updates (bug #17050)
+TRUNCATE test1;
+INSERT INTO test1 VALUES (1,'one'), (2,'two'), (3,'three');
+DO LANGUAGE plpgsql $$
+DECLARE
+    l_cur CURSOR FOR SELECT a FROM test1 ORDER BY 1 FOR UPDATE;
+BEGIN
+    FOR r IN l_cur LOOP
+      UPDATE test1 SET b = b || ' ' || b WHERE a = r.a;
+      COMMIT;
+    END LOOP;
+END;
+$$;
+SELECT * FROM test1;
+ a |      b      
+---+-------------
+ 1 | one one
+ 2 | two two
+ 3 | three three
+(3 rows)
+
+SELECT * FROM pg_cursors;
+ name | statement | is_holdable | is_binary | is_scrollable | creation_time 
+------+-----------+-------------+-----------+---------------+---------------
+(0 rows)
+
+-- like bug #17050, but with implicit cursor
+TRUNCATE test1;
+INSERT INTO test1 VALUES (1,'one'), (2,'two'), (3,'three');
+DO LANGUAGE plpgsql $$
+DECLARE r RECORD;
+BEGIN
+    FOR r IN SELECT a FROM test1 FOR UPDATE LOOP
+      UPDATE test1 SET b = b || ' ' || b WHERE a = r.a;
+      COMMIT;
+    END LOOP;
+END;
+$$;
+SELECT * FROM test1;
+ a |      b      
+---+-------------
+ 1 | one one
+ 2 | two two
+ 3 | three three
+(3 rows)
+
+SELECT * FROM pg_cursors;
+ name | statement | is_holdable | is_binary | is_scrollable | creation_time 
+------+-----------+-------------+-----------+---------------+---------------
+(0 rows)
+
 -- commit inside block with exception handler
 TRUNCATE test1;
 DO LANGUAGE plpgsql $$
index b13cf369db3cf6440a27ccf322fbb78589d62a60..52b047ea6a2f25b031aa2a48ef84d6474ba7073d 100644 (file)
@@ -273,6 +273,47 @@ SELECT * FROM test2;
 SELECT * FROM pg_cursors;
 
 
+-- interaction of FOR UPDATE cursor with subsequent updates (bug #17050)
+TRUNCATE test1;
+
+INSERT INTO test1 VALUES (1,'one'), (2,'two'), (3,'three');
+
+DO LANGUAGE plpgsql $$
+DECLARE
+    l_cur CURSOR FOR SELECT a FROM test1 ORDER BY 1 FOR UPDATE;
+BEGIN
+    FOR r IN l_cur LOOP
+      UPDATE test1 SET b = b || ' ' || b WHERE a = r.a;
+      COMMIT;
+    END LOOP;
+END;
+$$;
+
+SELECT * FROM test1;
+
+SELECT * FROM pg_cursors;
+
+
+-- like bug #17050, but with implicit cursor
+TRUNCATE test1;
+
+INSERT INTO test1 VALUES (1,'one'), (2,'two'), (3,'three');
+
+DO LANGUAGE plpgsql $$
+DECLARE r RECORD;
+BEGIN
+    FOR r IN SELECT a FROM test1 FOR UPDATE LOOP
+      UPDATE test1 SET b = b || ' ' || b WHERE a = r.a;
+      COMMIT;
+    END LOOP;
+END;
+$$;
+
+SELECT * FROM test1;
+
+SELECT * FROM pg_cursors;
+
+
 -- commit inside block with exception handler
 TRUNCATE test1;