]> git.ipfire.org Git - thirdparty/postgresql.git/commit
Ignore PlaceHolderVars when looking up statistics
authorRichard Guo <rguo@postgresql.org>
Mon, 29 Dec 2025 02:40:45 +0000 (11:40 +0900)
committerRichard Guo <rguo@postgresql.org>
Mon, 29 Dec 2025 02:44:14 +0000 (11:44 +0900)
commit7e9f852a79fe19d4d0f18aabc32a620797fb676e
treec916fc7274ff6cfd00c01b25c77ebbb257204eec
parentb4cf7442058f0b0f525b5df36f4bbfc73a97ed0c
Ignore PlaceHolderVars when looking up statistics

When looking up statistical data about an expression, we failed to
look through PlaceHolderVar nodes, treating them as opaque.  This
could prevent us from matching an expression to base columns, index
expressions, or extended statistics, as examine_variable() relies on
strict structural matching.

As a result, queries involving PlaceHolderVar nodes often fell back to
default selectivity estimates, potentially leading to poor plan
choices.

This patch updates examine_variable() to strip PlaceHolderVars before
analysis.  This is safe during estimation because PlaceHolderVars are
transparent for the purpose of statistics lookup: they do not alter
the value distribution of the underlying expression.

To minimize performance overhead on this hot path, a lightweight
walker first checks for the presence of PlaceHolderVars.  The more
expensive mutator is invoked only when necessary.

There is one ensuing plan change in the regression tests, which is
expected and demonstrates the fix: the rowcount estimate becomes much
more accurate with this patch.

Back-patch to v18.  Although this issue exists before that, changes in
this version made it common enough to notice.  Given the lack of field
reports for older versions, I am not back-patching further.

Reported-by: Haowu Ge <gehaowu@bitmoe.com>
Author: Richard Guo <guofenglinux@gmail.com>
Discussion: https://postgr.es/m/62af586c-c270-44f3-9c5e-02c81d537e3d.gehaowu@bitmoe.com
Backpatch-through: 18
src/backend/utils/adt/selfuncs.c
src/test/regress/expected/join.out
src/test/regress/sql/join.sql