]> git.ipfire.org Git - thirdparty/postgresql.git/commitdiff
Don't use partial unique indexes for unique proofs in the planner
authorDavid Rowley <drowley@postgresql.org>
Mon, 19 Jun 2023 01:03:17 +0000 (13:03 +1200)
committerDavid Rowley <drowley@postgresql.org>
Mon, 19 Jun 2023 01:03:17 +0000 (13:03 +1200)
Here we adjust relation_has_unique_index_for() so that it no longer makes
use of partial unique indexes as uniqueness proofs.  It is incorrect to
use these as the predicates used by check_index_predicates() to set
predOK makes use of not only baserestrictinfo quals as proofs, but also
qual from join conditions.  For relation_has_unique_index_for()'s case, we
need to know the relation is unique for a given set of columns before any
joins are evaluated, so if predOK was only set to true due to some join
qual, then it's unsafe to use such indexes in
relation_has_unique_index_for().  The final plan may not even make use
of that index, which could result in reading tuples that are not as
unique as the planner previously expected them to be.

Bug: #17975
Reported-by: Tor Erik Linnerud
Backpatch-through: 11, all supported versions
Discussion: https://postgr.es/m/17975-98a90c156f25c952%40postgresql.org

src/backend/optimizer/path/indxpath.c
src/backend/optimizer/plan/analyzejoins.c
src/test/regress/expected/join.out
src/test/regress/sql/join.sql

index 9bf2ee4adc66bac70a9faa773507c0816d5f651e..4a9271ca049a0984278ff2869516a90cdb949971 100644 (file)
@@ -2988,10 +2988,13 @@ relation_has_unique_index_for(PlannerInfo *root, RelOptInfo *rel,
 
                /*
                 * If the index is not unique, or not immediately enforced, or if it's
-                * a partial index that doesn't match the query, it's useless here.
+                * a partial index, it's useless here.  We're unable to make use of
+                * predOK partial unique indexes due to the fact that
+                * check_index_predicates() also makes use of join predicates to
+                * determine if the partial index is usable. Here we need proofs that
+                * hold true before any joins are evaluated.
                 */
-               if (!ind->unique || !ind->immediate ||
-                       (ind->indpred != NIL && !ind->predOK))
+               if (!ind->unique || !ind->immediate || ind->indpred != NIL)
                        continue;
 
                /*
index 0e73f9cf4c7267f9f9e84be66810afa97c358b42..b16bb9b59a7936dcb4c551e9cdaa4957c7d3cccd 100644 (file)
@@ -599,9 +599,9 @@ rel_supports_distinctness(PlannerInfo *root, RelOptInfo *rel)
                /*
                 * For a plain relation, we only know how to prove uniqueness by
                 * reference to unique indexes.  Make sure there's at least one
-                * suitable unique index.  It must be immediately enforced, and if
-                * it's a partial index, it must match the query.  (Keep these
-                * conditions in sync with relation_has_unique_index_for!)
+                * suitable unique index.  It must be immediately enforced, and not a
+                * partial index. (Keep these conditions in sync with
+                * relation_has_unique_index_for!)
                 */
                ListCell   *lc;
 
@@ -609,8 +609,7 @@ rel_supports_distinctness(PlannerInfo *root, RelOptInfo *rel)
                {
                        IndexOptInfo *ind = (IndexOptInfo *) lfirst(lc);
 
-                       if (ind->unique && ind->immediate &&
-                               (ind->indpred == NIL || ind->predOK))
+                       if (ind->unique && ind->immediate && ind->indpred == NIL)
                                return true;
                }
        }
index c50c3826fc7395fb69e1c7bec058882928f15057..edc66ea590e880eda377a9ea5e55114e2a74cdc6 100644 (file)
@@ -5975,6 +5975,23 @@ left join j2 on j1.id1 = j2.id1 where j1.id2 = 1;
          Output: j2.id1, j2.id2
 (8 rows)
 
+create unique index j1_id2_idx on j1(id2) where id2 is not null;
+-- ensure we don't use a partial unique index as unique proofs
+explain (verbose, costs off)
+select * from j1
+inner join j2 on j1.id2 = j2.id2;
+                QUERY PLAN                
+------------------------------------------
+ Nested Loop
+   Output: j1.id1, j1.id2, j2.id1, j2.id2
+   Join Filter: (j1.id2 = j2.id2)
+   ->  Seq Scan on public.j2
+         Output: j2.id1, j2.id2
+   ->  Seq Scan on public.j1
+         Output: j1.id1, j1.id2
+(7 rows)
+
+drop index j1_id2_idx;
 -- validate logic in merge joins which skips mark and restore.
 -- it should only do this if all quals which were used to detect the unique
 -- are present as join quals, and not plain quals.
index 737b85925c03a9937928eba54045b05ae9747d5d..669b2e0bf5a4626ecc62a5365e4e1389f0327e89 100644 (file)
@@ -2012,6 +2012,15 @@ explain (verbose, costs off)
 select * from j1
 left join j2 on j1.id1 = j2.id1 where j1.id2 = 1;
 
+create unique index j1_id2_idx on j1(id2) where id2 is not null;
+
+-- ensure we don't use a partial unique index as unique proofs
+explain (verbose, costs off)
+select * from j1
+inner join j2 on j1.id2 = j2.id2;
+
+drop index j1_id2_idx;
+
 -- validate logic in merge joins which skips mark and restore.
 -- it should only do this if all quals which were used to detect the unique
 -- are present as join quals, and not plain quals.