]> git.ipfire.org Git - thirdparty/postgresql.git/commit
Cache the results of format_type() queries in pg_dump.
authorTom Lane <tgl@sss.pgh.pa.us>
Tue, 31 Aug 2021 17:53:33 +0000 (13:53 -0400)
committerTom Lane <tgl@sss.pgh.pa.us>
Tue, 31 Aug 2021 17:53:49 +0000 (13:53 -0400)
commit9407dbbcb5b587cbefc4af14d1612b49abcb143b
treeda86f12f8e83c7a83ad4bc85641042154d2a681c
parent4090ff2a99b76b7bd51534fb0f7013aa646d1e24
Cache the results of format_type() queries in pg_dump.

There's long been a "TODO: there might be some value in caching
the results" annotation on pg_dump's getFormattedTypeName function;
but we hadn't gotten around to checking what it was costing us to
repetitively look up type names.  It turns out that when dumping the
current regression database, about 10% of the total number of queries
issued are duplicative format_type() queries.  However, Hubert Depesz
Lubaczewski reported a not-unusual case where these account for over
half of the queries issued by pg_dump.  Individually these queries
aren't expensive, but when network lag is a factor, they add up to a
problem.  We can very easily add some caching to getFormattedTypeName
to solve it.

Since this is such a simple fix and can have a visible performance
benefit, back-patch to all supported branches.

Discussion: https://postgr.es/m/20210826084430.GA26282@depesz.com
src/bin/pg_dump/pg_dump.c
src/bin/pg_dump/pg_dump.h