]> git.ipfire.org Git - thirdparty/bind9.git/log
thirdparty/bind9.git
14 months agofix: dev: Fix a logic error in cache_name()
Evan Hunt [Mon, 24 Feb 2025 23:39:23 +0000 (23:39 +0000)] 
fix: dev: Fix a logic error in cache_name()

A change in 6aba56ae8 (checking whether a rejected RRset was identical
to the data it would have replaced, so that we could still cache a
signature) inadvertently introduced cases where processing of a
response would continue when previously it would have been skipped.

Closes #5197

Merge branch '5197-cache_name-logic-error' into 'main'

See merge request isc-projects/bind9!10157

14 months agoFix a logic error in cache_name()
Evan Hunt [Mon, 24 Feb 2025 22:30:39 +0000 (14:30 -0800)] 
Fix a logic error in cache_name()

A change in 6aba56ae8 (checking whether a rejected RRset was identical
to the data it would have replaced, so that we could still cache a
signature) inadvertently introduced cases where processing of a
response would continue when previously it would have been skipped.

14 months agofix: dev: Acquire the database reference before possibly last node release
Ondřej Surý [Mon, 24 Feb 2025 22:24:51 +0000 (22:24 +0000)] 
fix: dev: Acquire the database reference before possibly last node release

Acquire the database reference in the detachnode() to prevent the last
reference to be release while the NODE_LOCK being locked.  The NODE_LOCK
is locked/unlocked inside the RCU critical section, thus it is most
probably this should not pose a problem as the database uses call_rcu
memory reclamation, but this it is still safer to acquire the reference
before releasing the node.

Closes #5194

Merge branch '5194-fix-assertion-failure-while-reference-counting-qpdb' into 'main'

See merge request isc-projects/bind9!10155

14 months agoAcquire the database reference before possibly last node release
Ondřej Surý [Mon, 24 Feb 2025 14:55:18 +0000 (15:55 +0100)] 
Acquire the database reference before possibly last node release

Acquire the database refernce in the detachnode() to prevent the last
reference to be release while the NODE_LOCK being locked.  The NODE_LOCK
is locked/unlocked inside the RCU critical section, thus it is most
probably this should not pose a problem as the database uses call_rcu
memory reclamation, but this it is still safer to acquire the reference
before releasing the node.

14 months agochg: dev: Move the library initialization and shutdown to executables
Ondřej Surý [Sat, 22 Feb 2025 18:06:21 +0000 (18:06 +0000)] 
chg: dev: Move the library initialization and shutdown to executables

Instead of relying on unreliable order of execution of the library
constructors and destructors, move them to individual binaries.  The
advantage is that the execution time and order will remain constant and
will not depend on the dynamic load dependency solver.

Merge branch 'ondrej/move-the-constructors-destructors-to-binaries' into 'main'

See merge request isc-projects/bind9!10069

14 months agoSuppressing memory leaks produced by clang LeakSanitizer
Ondřej Surý [Sat, 22 Feb 2025 17:17:18 +0000 (18:17 +0100)] 
Suppressing memory leaks produced by clang LeakSanitizer

Previously, we were suppressing only the memory leaks in the GCC
LeakSanitizer job, but those suppression are also needed by the Clang.

14 months agoExplicitly create and shutdown the call_rcu_thread
Ondřej Surý [Tue, 4 Feb 2025 18:17:28 +0000 (19:17 +0100)] 
Explicitly create and shutdown the call_rcu_thread

As the default_call_rcu_thread can't be forced to flush all the work
during the executable shutdown, create one call_rcu_thread explicitly
and assign it to the all created threads.

This allows this explicit call_rcu_thread to be unassociated from the
main thread and freed before the executable destructor exits.

14 months agoMove the library init and shutdown to executables
Ondřej Surý [Tue, 4 Feb 2025 12:17:31 +0000 (13:17 +0100)] 
Move the library init and shutdown to executables

Instead of relying on unreliable order of execution of the library
constructors and destructors, move them to individual binaries.  The
advantage is that the execution time and order will remain constant and
will not depend on the dynamic load dependency solver.

This requires more work, but that was mitigated by a simple requirement,
any executable using libisc and libdns, must include <isc/lib.h> and
<dns/lib.h> respectively (in this particular order).  In turn, these two
headers must not be included from within any library as they contain
inlined functions marked with constructor/destructor attributes.

14 months agofix:usr: Dump the active resolver fetches from dns_resolver_dumpfetches()
Ondřej Surý [Fri, 21 Feb 2025 21:26:18 +0000 (21:26 +0000)] 
fix:usr: Dump the active resolver fetches from dns_resolver_dumpfetches()

Previously, active resolver fetches were only dumped when the `fetches-per-zone` configuration option was enabled. Now, active resolver fetches are dumped along with the number of `clients-per-server` counters per resolver fetch.

Merge branch 'ondrej/make-dns_resolver_dumpfetches-dump-fetches' into 'main'

See merge request isc-projects/bind9!10107

14 months agoDump the fetches from dns_resolver_dumpfetches()
Ondřej Surý [Mon, 17 Feb 2025 13:58:28 +0000 (14:58 +0100)] 
Dump the fetches from dns_resolver_dumpfetches()

Previously, the dns_resolver_dumpfetches() would go over the fetch
counters.  Alas, because of the earlier optimization, the fetch counters
would be increased only when fetches-per-zone was not 0, otherwise the
whole counting was skipped for performance reasons.

Instead of using the auxiliary fetch counters hash table, use the real
hash table that stores the fetch contexts to dump the ongoing fetches to
the recursing file.

Additionally print more information about the fetch context like start
and expiry times, number of fetch responses, number of queries and count
of allowed and dropped fetches.

14 months agofix:usr: Fix the data race causing a permanent active client increase
Ondřej Surý [Fri, 21 Feb 2025 21:24:56 +0000 (21:24 +0000)] 
fix:usr: Fix the data race causing a permanent active client increase

Previously, a data race could cause a newly created fetch context for a new client to be used
before it had been fully initialized, which would cause the query to become stuck; queries for the same
data would be either paused indefinitely or dropped because of
the `clients-per-query` limit. This has been fixed.

Closes #5053

Merge branch '5053-fetch-context-create-data-race' into 'main'

See merge request isc-projects/bind9!10146

14 months agoFix the fetch context hash table lock ordering
Ondřej Surý [Wed, 19 Feb 2025 05:28:46 +0000 (06:28 +0100)] 
Fix the fetch context hash table lock ordering

The order of the fetch context hash table rwlock and the individual
fetch context was reversed when calling the release_fctx() function.
This was causing a problem when iterating the hash table, and thus the
ordering has been corrected in a way that the hash table rwlock is now
always locked on the outside and the fctx lock is the interior lock.

14 months agoAdd isc_timer_running() function to check status of timer
Ondřej Surý [Mon, 17 Feb 2025 13:58:28 +0000 (14:58 +0100)] 
Add isc_timer_running() function to check status of timer

In the next commit, we need to know whether the timer has been started
or stopped.  Add isc_timer_running() function that returns true if the
timer has been started.

14 months agochg: doc: Update Sphinx and sphinx_rtd_theme
Michał Kępień [Fri, 21 Feb 2025 13:47:08 +0000 (13:47 +0000)] 
chg: doc: Update Sphinx and sphinx_rtd_theme

Update Sphinx-related Python packages to their current versions pulled
in by "pip install sphinx-rtd-theme" run in a fresh virtual environment.

Merge branch 'michal/update-sphinx-and-sphinx_rtd_theme' into 'main'

See merge request isc-projects/bind9!10138

14 months agoUpdate Sphinx and sphinx_rtd_theme
Michał Kępień [Fri, 21 Feb 2025 13:41:25 +0000 (14:41 +0100)] 
Update Sphinx and sphinx_rtd_theme

Update Sphinx-related Python packages to their current versions pulled
in by "pip install sphinx-rtd-theme" run in a fresh virtual environment.

14 months agofix: usr: Fix RPZ race condition during a reconfiguration
Arаm Sаrgsyаn [Fri, 21 Feb 2025 11:45:00 +0000 (11:45 +0000)] 
fix: usr: Fix RPZ race condition during a reconfiguration

With RPZ in use, `named` could terminate unexpectedly because of a race condition when a reconfiguration command was received using `rndc`. This has been fixed.

Closes #5146

Merge branch '5146-rpz-reconfig-bug-fix' into 'main'

See merge request isc-projects/bind9!10079

14 months agoFix RPZ bug when resuming a query during a reconfiguration
Aram Sargsyan [Wed, 5 Feb 2025 09:36:09 +0000 (09:36 +0000)] 
Fix RPZ bug when resuming a query during a reconfiguration

After a reconfiguration the old view can be left without a valid
'rpzs' member, because when the RPZ is not changed during the named
reconfiguration 'rpzs' "migrate" from the old view into the new
view, so when a query resumes it can find that 'qctx->view->rpzs'
is NULL which query_resume() currently doesn't expect to happen if
it's recursing and 'qctx->rpz_st' is not NULL.

Fix the issue by adding a NULL-check. In order to not split the log
message to two different log messages depending on whether
'qctx->view->rpzs' is NULL or not, change the message to not log
the RPZ policy's "version" which is just a runtime counter and is
most likely not very useful for the users.

14 months agochg:nil: Cleanup the isc_counter unit
Ondřej Surý [Fri, 21 Feb 2025 09:51:49 +0000 (09:51 +0000)] 
chg:nil: Cleanup the isc_counter unit

The isc_counter_create() doesn't need the return value (it was always
ISC_R_SUCCESS), use the macros to implement the reference counting,
little style cleanup, and expand the unit test.

Merge branch 'ondrej/cleanup-isc_counter-unit' into 'main'

See merge request isc-projects/bind9!10126

14 months agoCleanup the isc_counter unit
Ondřej Surý [Wed, 19 Feb 2025 05:49:38 +0000 (06:49 +0100)] 
Cleanup the isc_counter unit

The isc_counter_create() doesn't need the return value (it was always
ISC_R_SUCCESS), use the macros to implement the reference counting,
little style cleanup, and expand the unit test.

14 months agofix: usr: Remove NSEC/DS/NSEC3 RRSIG check from dns_message_parse
Mark Andrews [Fri, 21 Feb 2025 02:57:46 +0000 (02:57 +0000)] 
fix: usr: Remove NSEC/DS/NSEC3 RRSIG check from dns_message_parse

Previously, when parsing responses, named incorrectly rejected responses without matching RRSIG records for NSEC/DS/NSEC3 records in the authority section. This rejection, if appropriate, should have been left for the validator to determine and has been fixed.

Closes #5185

Merge branch '5185-remove-rrsig-check-from-dns_message_parse' into 'main'

See merge request isc-projects/bind9!10125

14 months agoCheck insecure response with missing RRSIG in authority
Mark Andrews [Wed, 19 Feb 2025 01:31:16 +0000 (12:31 +1100)] 
Check insecure response with missing RRSIG in authority

This scenario should succeed but wasn't due rejection of the
message at the message parsing stage.

14 months agoRemove check for missing RRSIG records from getsection
Mark Andrews [Tue, 18 Feb 2025 23:34:47 +0000 (10:34 +1100)] 
Remove check for missing RRSIG records from getsection

Checking whether the authority section is properly signed should
be left to the validator.  Checking in getsection (dns_message_parse)
was way too early and resulted in resolution failures of lookups
that should have otherwise succeeded.

14 months agofix: usr: Implement sig0key-checks-limit and sig0message-checks-limit
Arаm Sаrgsyаn [Thu, 20 Feb 2025 14:24:17 +0000 (14:24 +0000)] 
fix: usr: Implement sig0key-checks-limit and sig0message-checks-limit

Previously a hard-coded limitation of maximum two key or message
verification checks were introduced when checking the message's
SIG(0) signature. It was done in order to protect against possible
DoS attacks. The logic behind choosing the number 2 was that more
than a single key should only be required during key rotations, and
in that case two keys are enough. But later it became apparent that
there are other use cases too where even more keys are required, see
issue number #5050 in GitLab.

This change introduces two new configuration options for the views,
`sig0key-checks-limit` and `sig0message-checks-limit`, which define how
many keys are allowed to be checked to find a matching key, and how
many message verifications are allowed to take place once a matching
key has been found. The latter protects against expensive cryptographic
operations when there are keys with colliding tags and algorithm
numbers, with default being 2, and the former protects against a bit
less expensive key parsing operations and defaults to 16.

Closes #5050

Merge branch '5050-sig0-let-considering-more-than-two-keys' into 'main'

See merge request isc-projects/bind9!9967

14 months agoDocument sig0key-checks-limit and sig0message-checks-limit
Aram Sargsyan [Tue, 21 Jan 2025 13:44:09 +0000 (13:44 +0000)] 
Document sig0key-checks-limit and sig0message-checks-limit

14 months agoImplement sig0key-checks-limit and sig0message-checks-limit
Aram Sargsyan [Tue, 21 Jan 2025 13:20:12 +0000 (13:20 +0000)] 
Implement sig0key-checks-limit and sig0message-checks-limit

Previously a hard-coded limitation of maximum two key or message
verification checks were introduced when checking the message's
SIG(0) signature. It was done in order to protect against possible
DoS attacks. The logic behind choosing the number two was that more
than one key should only be required only during key rotations, and
in that case two keys are enough. But later it became apparent that
there are other use cases too where even more keys are required, see
issue number #5050 in GitLab.

This change introduces two new configuration options for the views,
sig0key-checks-limit and sig0message-checks-limit, which define how
many keys are allowed to be checked to find a matching key, and how
many message verifications are allowed to take place once a matching
key has been found. The latter protects against expensive cryptographic
operations when there are keys with colliding tags and algorithm
numbers, with default being 2, and the former protects against a bit
less expensive key parsing operations and defaults to 16.

14 months agofix: dev: Fix isc_quota bug
Arаm Sаrgsyаn [Thu, 20 Feb 2025 12:19:46 +0000 (12:19 +0000)] 
fix: dev: Fix isc_quota bug

Running jobs which were entered into the isc_quota queue is the
responsibility of the isc_quota_release() function, which, when
releasing a previously acquired quota, checks whether the queue
is empty, and if it's not, it runs a job from the queue without touching
the 'quota->used' counter. This mechanism is susceptible to a possible
hangup of a newly queued job in case when between the time a decision
has been made to queue it (because used >= max) and the time it was
actually queued, the last quota was released. Since there is no more
quotas to be released (unless arriving in the future), the newly
entered job will be stuck in the queue.

Fix the issue by adding checks in both isc_quota_release() and
isc_quota_acquire_cb() to make sure that the described hangup does
not happen. Also see code comments.

Closes #4965

Merge branch '4965-isc_quota-bug-fix' into 'main'

See merge request isc-projects/bind9!10082

14 months agoFix isc_quota bug
Aram Sargsyan [Thu, 6 Feb 2025 15:44:00 +0000 (15:44 +0000)] 
Fix isc_quota bug

Running jobs which were entered into the isc_quota queue is the
responsibility of the isc_quota_release() function, which, when
releasing a previously acquired quota, checks whether the queue
is empty, and if it's not, it runs a job from the queue without touching
the 'quota->used' counter. This mechanism is susceptible to a possible
hangup of a newly queued job in case when between the time a decision
has been made to queue it (because used >= max) and the time it was
actually queued, the last quota was released. Since there is no more
quotas to be released (unless arriving in the future), the newly
entered job will be stuck in the queue.

Fix the wrong memory ordering for 'quota->used', as the relaxed
ordering doesn't ensure that data modifications made by one thread
are visible in other threads.

Add checks in both isc_quota_release() and isc_quota_acquire_cb()
to make sure that the described hangup does not happen. Also see
code comments.

14 months agonew: usr: Implement the min-transfer-rate-in configuration option
Arаm Sаrgsyаn [Thu, 20 Feb 2025 10:31:47 +0000 (10:31 +0000)] 
new: usr: Implement the min-transfer-rate-in configuration option

A new option 'min-transfer-rate-in <bytes> <minutes>' has been added
to the view and zone configurations. It can abort incoming zone
transfers which run very slowly due to network related issues, for
example. The default value is set to 10240 bytes in 5 minutes.

Closes #3914

Merge branch '3914-detect-and-restart-stalled-zone-transfers' into 'main'

See merge request isc-projects/bind9!9098

14 months agoExpose the incoming transfers' rates in the statistics channel
Aram Sargsyan [Wed, 27 Nov 2024 10:34:40 +0000 (10:34 +0000)] 
Expose the incoming transfers' rates in the statistics channel

Expose the average transfer rate (in bytes-per-second) during the
last full 'min-transfer-rate-in <bytes> <minutes>' minutes interval.
If no such interval has passed yet, then the overall average rate is
reported instead.

14 months agoTest the new min-transfer-rate-in configuration option
Aram Sargsyan [Mon, 10 Jun 2024 16:50:37 +0000 (16:50 +0000)] 
Test the new min-transfer-rate-in configuration option

Add a new big zone, run a zone transfer in slow mode, and check
whether the zone transfer gets canceled because 100000 bytes are
not transferred in 5 seconds (as it's running in slow mode).

14 months agoDocument the min-transfer-rate-in configuration option
Aram Sargsyan [Mon, 10 Jun 2024 16:49:56 +0000 (16:49 +0000)] 
Document the min-transfer-rate-in configuration option

Add a new section in ARM describing min-transfer-rate-in.

14 months agoImplement the min-transfer-rate-in configuration option
Aram Sargsyan [Mon, 10 Jun 2024 16:48:26 +0000 (16:48 +0000)] 
Implement the min-transfer-rate-in configuration option

This new option sets a minimum amount of transfer rate for
an incoming zone transfer that will abort a transfer, which
for some network related reasons run very slowly.

14 months agofix: dev: Do not cache signatures for rejected data
Evan Hunt [Thu, 20 Feb 2025 02:12:12 +0000 (02:12 +0000)] 
fix: dev: Do not cache signatures for rejected data

The cache has been updated so that if new data is rejected - for example, because there was already existing data at a higher trust level - then its covering RRSIG will also be rejected.

Closes #5132

Merge branch '5132-improve-cd-behavior' into 'main'

See merge request isc-projects/bind9!9999

14 months agoadd a test with an inconsistent NS RRset
Evan Hunt [Tue, 28 Jan 2025 05:44:51 +0000 (21:44 -0800)] 
add a test with an inconsistent NS RRset

add a zone with different NS RRsets in the parent and child,
and test resolver and forwarder behavior with and without +CD.

14 months agoCheck whether a rejected rrset is different
Evan Hunt [Fri, 24 Jan 2025 01:16:30 +0000 (17:16 -0800)] 
Check whether a rejected rrset is different

Add a new dns_rdataset_equals() function to check whether two
rdatasets are equal in DNSSEC terms.

When an rdataset being cached is rejected because its trust
level is lower than the existing rdataset, we now check to see
whether the rejected data was identical to the existing data.
This allows us to cache a potentially useful RRSIG when handling
CD=1 queries, while still rejecting RRSIGs that would definitely
have resulted in a validation failure.

14 months agofix: dev: Clean up dns_rdataslab module
Evan Hunt [Wed, 19 Feb 2025 23:43:41 +0000 (23:43 +0000)] 
fix: dev: Clean up dns_rdataslab module

Rdata slabs used in the QP databases are usually prepended with a slab header, but are sometimes "raw", containing only the rdata and no header. Previously, to allow for them to be used both ways, functions that operated on them took a `reservelen` argument, which would be set to either the header length or to zero, and skipped over that many bytes at the beginning of the buffer. Most such functions were never used on the raw form. To make the code clearer, each of these functions now operates on full slabs with headers, and an alternate "raw" version of the function has been added in cases where that was needed.

In addition, the `dns_rdataslab_merge()` and `_subtract()` functions have been rewritten for clarity and efficiency, and a minor bug has been fixed in `dns_rdataslab_equal()` and `_equalx()`, which could cause an incorrect result if both slabs being compared had zero length.

Merge branch 'each-refactor-rdataslab' into 'main'

See merge request isc-projects/bind9!10084

14 months agoRemove the "raw" version of the dns_slabheader API
Ondřej Surý [Wed, 19 Feb 2025 12:59:23 +0000 (13:59 +0100)] 
Remove the "raw" version of the dns_slabheader API

The "raw" version of the header was used for the noqname and the closest
proofs to save around 152 bytes of the dns_slabheader_t while bringing
an additional complexity.  Remove the raw version of the dns_slabheader
API at the slight expense of having unused dns_slabheader_t data sitting
in front of the proofs.

14 months agorefactor dns_rdataslab_subtract() for efficiency
Evan Hunt [Mon, 10 Feb 2025 04:43:39 +0000 (20:43 -0800)] 
refactor dns_rdataslab_subtract() for efficiency

reduce the number of rdata comparisons needed by walking
through the original slab once to determine whether the rdata
in it is duplicated in the slab to be subtracted, and then
write out the rdatas that aren't. previously, this was
done twice: once when determining the size of the target buffer
and then again when copying data into it.

14 months agorefactor dns_rdataslab_merge() for efficiency
Evan Hunt [Mon, 10 Feb 2025 04:03:01 +0000 (20:03 -0800)] 
refactor dns_rdataslab_merge() for efficiency

when merging two rdata slabs, we now check once to see
whether an item in the new slab has a duplicate in the
old. previously this was done twice; once to determine the
size of the target buffer required, and then again when
copying the data into it.

we also minimize the number of rdata comparisons necessary,
by remembering which items in the old slab have already been
found to be duplicates.

14 months agodns_slabheader_fromrdataset() -> dns_rdataset_getheader()
Evan Hunt [Sat, 8 Feb 2025 23:41:31 +0000 (15:41 -0800)] 
dns_slabheader_fromrdataset() -> dns_rdataset_getheader()

The function name dns_slabheader_fromrdataset() was too similar
to dns_rdataslab_fromrdataset(). Instead, we now have an rdataset
method 'getheader' which is implemented for slab-type rdatasets.

A new NOHEADER rdataset attribute is set for rdatasets using
raw slabs (i.e., noqname and closest encloser proofs); when
called on rdatasets with that flag set, dns_rdataset_getheader()
returns NULL.

14 months agoinitialize header in dns_rdataslab_fromrdataset()
Evan Hunt [Sat, 8 Feb 2025 05:06:34 +0000 (21:06 -0800)] 
initialize header in dns_rdataslab_fromrdataset()

when dns_rdataslab_fromrdataset() is run, in addition to
allocating space for a slab header, it also partially
initializes it, setting the type match rdataset->type and
rdataset->covers, the trust to rdataset->trust, and the TTL to
rdataset->ttl.

14 months agoclarify dns_rdataslab_fromrdataset()
Evan Hunt [Sat, 8 Feb 2025 04:07:53 +0000 (20:07 -0800)] 
clarify dns_rdataslab_fromrdataset()

there are now two functions for creating an rdataslab from an
rdataset: dns_rdataslab_fromrdataset() creates a full slab (including
space for a slab header), and dns_rdataslab_raw_fromrdataset() creates
a raw slab.

14 months agorefactor dns_rdataslab_merge() and _subtract()
Evan Hunt [Fri, 7 Feb 2025 22:31:33 +0000 (14:31 -0800)] 
refactor dns_rdataslab_merge() and _subtract()

these two functions have been refactored for clarity
and readability, with a more logical flow, added comments,
and less code duplication.

14 months agomore rdataslab refactoring
Evan Hunt [Sat, 8 Feb 2025 05:21:52 +0000 (21:21 -0800)] 
more rdataslab refactoring

- there are now two functions for getting rdataslab size:
  dns_rdataslab_size() is for full slabs and dns_rdataslab_sizeraw()
  for raw slabs. there is no longer a need for a reservelen parameter.
- dns_rdataslab_count() also no longer takes a reservelen parameter.
  (currently it's never used for raw slabs, so there is no _countraw()
  function.)
- dns_rdataslab_rdatasize() has been removed, because
  dns_rdataslab_sizeraw() can do the same thing.
- dns_rdataslab_merge() and dns_rdataslab_subtract() both take
  slabheader parameters instead of character buffers, and the
  reservelen parameter has been removed.

14 months agofix and simplify dns_rdataset_equal() and _equalx()
Evan Hunt [Thu, 6 Feb 2025 23:50:52 +0000 (15:50 -0800)] 
fix and simplify dns_rdataset_equal() and _equalx()

if both rdataslabs being compared have zero length, return true.

also, since these functions are only ever called on slabheaders
with sizeof(dns_slabheader_t) as the reserve length, we can
simplify the API: remove the reservelen argument, and pass the
slabs as type dns_slabheader_t * instead of unsigned char *.

14 months agoAdd .up pointer to slabheader
Ondřej Surý [Fri, 31 Jan 2025 14:47:33 +0000 (15:47 +0100)] 
Add .up pointer to slabheader

The dns_slabheader object uses the 'next' pointer for two purposes.
In the first header for any given type, 'next' points to the first
header for the next type. But 'down' points to the next header of
the same type, and in that record, 'next' points back up.

This design made the code confusing to read.  We now use a union
so that the 'next' pointer can also be called 'up'.

14 months agoMerge tag 'v9.21.5'
Andoni Duarte Pintado [Wed, 19 Feb 2025 16:46:17 +0000 (17:46 +0100)] 
Merge tag 'v9.21.5'

14 months agofix: dev: Post [CVE-2024-12705] Performance Drop Fixes
Artem Boldariev [Wed, 19 Feb 2025 16:39:36 +0000 (16:39 +0000)] 
fix: dev: Post [CVE-2024-12705] Performance Drop Fixes

This merge request fixes a [performance drop](https://gitlab.isc.org/isc-projects/bind9/-/pipelines/216728) after merging the fixes for #4795, in particular in 9.18.

The MR [fixes the problem](https://gitlab.isc.org/isc-projects/bind9/-/pipelines/219825) without affecting performance for the newer versions, in particular for [the development version](https://gitlab.isc.org/isc-projects/bind9/-/pipelines/220619).

Merge branch 'artem-doh-performance-drop' into 'main'

See merge request isc-projects/bind9!10109

14 months agoDoH: http_send_outgoing() return value is not used
Artem Boldariev [Wed, 19 Feb 2025 10:28:37 +0000 (12:28 +0200)] 
DoH: http_send_outgoing() return value is not used

The value returned by http_send_outgoing() is not used anywhere, so we
make it not return anything (void). Probably it is an omission from
older times.

14 months agoDoH: Fix missing send callback calls
Artem Boldariev [Wed, 12 Feb 2025 20:58:42 +0000 (22:58 +0200)] 
DoH: Fix missing send callback calls

When handling outgoing data, there were a couple of rarely executed
code paths that would not take into account that the callback MUST be
called.

It could lead to potential memory leaks and consequent shutdown hangs.

14 months agoDoH: change how the active streams number is calculated
Artem Boldariev [Thu, 13 Feb 2025 13:05:10 +0000 (15:05 +0200)] 
DoH: change how the active streams number is calculated

This commit changes the way how the number of active HTTP streams is
calculated and allows it to scale with the values of the maximum
amount of streams per connection, instead of effectively capping at
STREAM_CLIENTS_PER_CONN.

The original limit, which is intended to define the pipelining limit
for TCP/DoT. However, it appeared to be too restrictive for DoH, as it
works quite differently and implements pipelining at protocol level by
the means of multiplexing multiple streams. That renders each stream
to be effectively a separate connection from the point of view of the
rest of the codebase.

14 months agoDoH: Track the amount of in flight outgoing data
Artem Boldariev [Thu, 13 Feb 2025 12:53:18 +0000 (14:53 +0200)] 
DoH: Track the amount of in flight outgoing data

Previously we would limit the amount of incoming data to process based
solely on the presence of not completed send requests. That worked,
however, it was found to severely degrade performance in certain
cases, as was revealed during extended testing.

Now we switch to keeping track of how much data is in flight (or ready
to be in flight) and limit the amount of processed incoming data when
the amount of in flight data surpasses the given threshold, similarly
to like we do in other transports.

14 months agofix: dev: Delete dead nodes when committing a new version
Evan Hunt [Tue, 18 Feb 2025 22:54:42 +0000 (22:54 +0000)] 
fix: dev: Delete dead nodes when committing a new version

In the qpzone implementation of `dns_db_closeversion()`, if there are changed nodes that have no remaining data, delete them.

Closes #5169

Merge branch '5169-qpzone-delete-dead-nodes' into 'main'

See merge request isc-projects/bind9!10089

14 months agowhen committing a new qpzone version, delete dead nodes
Evan Hunt [Wed, 12 Feb 2025 05:43:09 +0000 (21:43 -0800)] 
when committing a new qpzone version, delete dead nodes

if all data has been deleted from a node in the qpzone
database, delete the node too.

14 months agorem: dev: Clean up unnecessary code in qpcache
Evan Hunt [Tue, 18 Feb 2025 20:15:14 +0000 (20:15 +0000)] 
rem: dev: Clean up unnecessary code in qpcache

Removed some code from the cache database implementation that was left over from before it and the zone database implementation were separated.

Merge branch 'each-qpcache-refactor' into 'main'

See merge request isc-projects/bind9!9991

14 months agoUnify how we handle database version in the cache
Ondřej Surý [Sun, 2 Feb 2025 23:06:48 +0000 (00:06 +0100)] 
Unify how we handle database version in the cache

Database versions are not used in cache databases. Some places in
qpcache.c required the version argument to be NULL; others marked it
as UNUSED. Unify all cases to require version to be NULL.

14 months agoClean up 'now' usage in the cache
Ondřej Surý [Sun, 2 Feb 2025 23:00:39 +0000 (00:00 +0100)] 
Clean up 'now' usage in the cache

Unify the way we handle the 'now' argument in the cache: when it's
set to zero by the caller, it is replaced with isc_stdtime_now().

14 months agoClean up the search part in qpcache_find()
Ondřej Surý [Sun, 2 Feb 2025 19:36:13 +0000 (20:36 +0100)] 
Clean up the search part in qpcache_find()

Slightly refactor the header search in qpcache_find(), so the scope
level is reduced and the cname parts are logically grouped together.

14 months agoRefactor the search in qpcache_findrdataset()
Ondřej Surý [Sun, 2 Feb 2025 19:22:29 +0000 (20:22 +0100)] 
Refactor the search in qpcache_findrdataset()

Add new related_headers() function that simplifies the code
flow in qpcache_findrdataset().  Also use check_stale_header() function
to remove code duplication.

14 months agoRefactor simple slabheader matching
Ondřej Surý [Sun, 2 Feb 2025 19:07:42 +0000 (20:07 +0100)] 
Refactor simple slabheader matching

Add a helper function both_headers() that unifies the slabheader
matching for simple type: it returns true when both the type and
the matching RRSIG have been found.

14 months agoAdd new helper maybe_update_headers() function
Ondřej Surý [Sun, 2 Feb 2025 18:37:21 +0000 (19:37 +0100)] 
Add new helper maybe_update_headers() function

The new maybe_update_headers() function unifies the LRU updates to the
slabheaders that was scattered all over the place.  More calls to update
headers after bindrdatasets() were also added for completeness.

14 months agoAdd bindrdatasets() function that binds both rdatasets
Ondřej Surý [Sun, 2 Feb 2025 18:29:53 +0000 (19:29 +0100)] 
Add bindrdatasets() function that binds both rdatasets

This removes code duplication between the dual bindrdataset() calls.  It
also unifies the handling as there were small differences between the
calls: one variant was checking for !NEGATIVE(found) condition and one
wasn't, and it is technically ok to do the check for all variants.

14 months agoRefactor check_stale_header() function
Ondřej Surý [Sun, 2 Feb 2025 18:21:44 +0000 (19:21 +0100)] 
Refactor check_stale_header() function

The check_stale_header() function now updates header_prev directly
so it doesn't have to be handled in the outer loop; it's always
set to the correct value of the previous header in the chain.

14 months agoadd missing "failed" message in digdelv test
Evan Hunt [Mon, 3 Feb 2025 19:48:08 +0000 (11:48 -0800)] 
add missing "failed" message in digdelv test

there was a test case that could fail (and did) without logging
the fact.

14 months agoclean up unnecessary code in qpcache
Evan Hunt [Thu, 23 Jan 2025 07:08:04 +0000 (23:08 -0800)] 
clean up unnecessary code in qpcache

some code was left in the cache database implementation after
it was separated from the zone database, and can be cleaned up
and refactored now:

- the DNS_SLABHEADERATTR_IGNORE flag is never set in the cache
- support for loading the cache from was removed, but the add()
  function still had a 'loading' flag that's always false
- two different macros were used for checking the
  DNS_SLABHEADERATTR_NONEXISTENT flag - EXISTS() and NONEXISTENT().
  it's clearer to just use EXISTS().
- the cache doesn't support versions, so it isn't necessary to
  walk down the 'down' pointer chain when iterating through the
  cache or looking for a header to update.  'down' now only points
  to records that are deleted from the cache but have not yet been
  purged from memory. this allows us to simplify both the iterator
  and the add() function.

14 months agonew: usr: Add HTTPS record query to host command line tool
Petr Špaček [Tue, 18 Feb 2025 14:56:39 +0000 (14:56 +0000)] 
new: usr: Add HTTPS record query to host command line tool

The host command was extended to also query for the HTTPS RR type by default.

Merge branch 'feature/main/host-rr-https' into 'main'

See merge request isc-projects/bind9!8642

14 months agoDo HTTPS record query from host in addition
Petr Menšík [Wed, 10 Jan 2024 20:25:52 +0000 (21:25 +0100)] 
Do HTTPS record query from host in addition

Unless explicitly specified type from host command, do fourth query for
type HTTPS RR. It is expected it will become more common and some
systems already query that record for every name.

14 months agofix: dev: Fix wrong logging severity in do_nsfetch()
Artem Boldariev [Tue, 18 Feb 2025 09:01:39 +0000 (09:01 +0000)] 
fix: dev: Fix wrong logging severity in do_nsfetch()

ISC_LOG_WARNING was used while ISC_LOG_DEBUG(3) was implied.

Closes #5145

Merge branch '5145-artem-fix-wrong-logging-severity-in-do_nsfetch' into 'main'

See merge request isc-projects/bind9!10017

14 months agoFix wrong logging severity in do_nsfetch()
Artem Boldariev [Wed, 29 Jan 2025 11:28:27 +0000 (13:28 +0200)] 
Fix wrong logging severity in do_nsfetch()

ISC_LOG_WARNING was used while ISC_LOG_DEBUG(3) was implied.

14 months agofix: doc: Fix typo in ARM related to max-stale-ttl
Matthijs Mekking [Tue, 18 Feb 2025 07:33:55 +0000 (07:33 +0000)] 
fix: doc: Fix typo in ARM related to max-stale-ttl

The text that stale-cache-enable is set to no has no effect on
max-cache-ttl, but on max-stale-ttl.

Closes #5181

Merge branch '5181-max-stale-ttl-typo-arm' into 'main'

See merge request isc-projects/bind9!10108

14 months agoFix typo in ARM related to max-stale-ttl
Matthijs Mekking [Mon, 17 Feb 2025 15:24:00 +0000 (16:24 +0100)] 
Fix typo in ARM related to max-stale-ttl

The text that stale-cache-enable is set to no has no effect on
max-cache-ttl, but on max-stale-ttl.

14 months agofix: dev: Fix dns_qp_insert() checks in qpzone
Evan Hunt [Tue, 18 Feb 2025 05:54:33 +0000 (05:54 +0000)] 
fix: dev: Fix dns_qp_insert() checks in qpzone

Remove code in the QP zone database to handle failures of `dns_qp_insert()` which can't actually happen.

Closes #5171

Merge branch '5171-qpzone-insert-checks' into 'main'

See merge request isc-projects/bind9!10088

15 months agofix dns_qp_insert() checks in qpzone
Evan Hunt [Wed, 12 Feb 2025 00:08:29 +0000 (16:08 -0800)] 
fix dns_qp_insert() checks in qpzone

in some places there were checks for failures of dns_qp_insert()
after dns_qp_getname(). such failures could only happen if another
thread inserted a node between the two calls, and that can't happen
because the calls are serialized with dns_qpmulti_write(). we can
simplify the code and just add an INSIST.

15 months agochg: test: Rewrite keyfromlabel system test to pytest
Michal Nowak [Mon, 17 Feb 2025 19:19:32 +0000 (19:19 +0000)] 
chg: test: Rewrite keyfromlabel system test to pytest

Merge branch 'mnowak/pytest_rewrite_keyfromlabel' into 'main'

See merge request isc-projects/bind9!9188

15 months agoRewrite keyfromlabel system test to pytest
Michal Nowak [Tue, 23 Jul 2024 14:17:40 +0000 (16:17 +0200)] 
Rewrite keyfromlabel system test to pytest

15 months agochg: test: Rewrite keepalive system test to pytest
Michal Nowak [Mon, 17 Feb 2025 19:16:18 +0000 (19:16 +0000)] 
chg: test: Rewrite keepalive system test to pytest

Merge branch 'mnowak/pytest_rewrite_keepalive' into 'main'

See merge request isc-projects/bind9!9202

15 months agoRewrite keepalive system test to pytest
Michal Nowak [Thu, 7 Mar 2024 11:37:10 +0000 (12:37 +0100)] 
Rewrite keepalive system test to pytest

15 months agoAdd Dig interface
Michal Nowak [Fri, 7 Feb 2025 10:26:04 +0000 (11:26 +0100)] 
Add Dig interface

15 months agofix: usr: Use named Service Parameter Keys (SvcParamKeys) by default
Arаm Sаrgsyаn [Mon, 17 Feb 2025 18:24:02 +0000 (18:24 +0000)] 
fix: usr: Use named Service Parameter Keys (SvcParamKeys) by default

When converting SVCB records to text representation `named` now uses named
`SvcParamKeys` values unless backward-compatible mode is activated,
in which case the values which were not defined initially in
RFC9460 and were added later (see [1]) are converted to opaque
"keyNNNN" syntax, like, for example, "key7" instead of "dohpath".

Also a new `+[no]svcparamkeycompat` option is implemented for `dig`,
which enables the backward-compatible mode and uses the opaque
syntax, if required for interoperability with other software or
scripts. By default, the compatibility mode is disabled.

[1] https://www.iana.org/assignments/dns-svcb/dns-svcb.xhtml

Closes #5156

Merge branch '5156-svcparamkey-use-named-keys-by-default' into 'main'

See merge request isc-projects/bind9!10085

15 months agoUpdate the rdata unit test
Aram Sargsyan [Mon, 10 Feb 2025 13:27:44 +0000 (13:27 +0000)] 
Update the rdata unit test

Update the rdata unit test to accommodate the change in the default
represenation of the Service Parameter Keys (SvcParamKeys) for the
SVCB records.

15 months agoTest dig +svcparamkeycompat
Aram Sargsyan [Mon, 10 Feb 2025 13:25:57 +0000 (13:25 +0000)] 
Test dig +svcparamkeycompat

This check in the nsupdate system test expects the opaque
representation of the "dohpath" Service Parameter Key. Use
the +svcparamkeycompat dig option to enable it.

15 months agoImplement dig +[no]svcparamkeycompat
Aram Sargsyan [Mon, 10 Feb 2025 13:22:58 +0000 (13:22 +0000)] 
Implement dig +[no]svcparamkeycompat

The new +[no]svcparamkeycompat option for dig enables the
backward-compatible mode for the Service Parameter Keys'
(SvcParamKeys) representation format. See the previous commit
for more information.

15 months agoFix a bug in generic_totext_in_svcb()
Aram Sargsyan [Mon, 10 Feb 2025 13:15:12 +0000 (13:15 +0000)] 
Fix a bug in generic_totext_in_svcb()

The 'sbpr_dohpath' case was missing from the switch-case. Add the
'sbpr_dohpath' case, which should work similarly as the 'sbpr_text'
case.

15 months agoUse named Service Parameter Keys (SvcParamKeys) by default
Aram Sargsyan [Mon, 10 Feb 2025 13:11:18 +0000 (13:11 +0000)] 
Use named Service Parameter Keys (SvcParamKeys) by default

When converting SVCB records to text representation use named
SvcParamKeys values unless backward-compatible mode is activated,
in which case the values which were not defined initially in
RFC9460 and were added later (see [1]) are converted to opaque
"keyN" syntax, like, for example, "key7" instead of "dohpath".

[1] https://www.iana.org/assignments/dns-svcb/dns-svcb.xhtml

Co-authored-by: sdomi <ja@sdomi.pl>
15 months agochg: dev: Refactor and simplify isc_symtab
Alessio Podda [Mon, 17 Feb 2025 12:30:24 +0000 (12:30 +0000)] 
chg: dev: Refactor and simplify isc_symtab

This commit does several changes to isc_symtab:

1. Rewrite the isc_symtab to internally use isc_hashmap instead of
   hand-stiched hashtable.

2. Create a new isc_symtab_define_and_return() api, which returns
   the already defined symvalue on ISC_R_EXISTS; this allows users
   of the API to skip the isc_symtab_lookup()+isc_symtab_define()
   calls and directly call isc_symtab_define_and_return().

3. Merge isccc_symtab into isc_symtab - the only missing function
   was isccc_symtab_foreach() that was merged into isc_symtab API.

4. Add full set of unit tests for the isc_symtab API.

Closes #5103

Merge branch '5103-use-isc_hashmap-for-isc_symtab' into 'main'

See merge request isc-projects/bind9!9921

15 months agoRefactor and simplify isc_symtab
alessio [Fri, 29 Nov 2024 09:02:13 +0000 (10:02 +0100)] 
Refactor and simplify isc_symtab

This commit does several changes to isc_symtab:

1. Rewrite the isc_symtab to internally use isc_hashmap instead of
   hand-stiched hashtable.

2. Create a new isc_symtab_define_and_return() api, which returns
   the already defined symvalue on ISC_R_EXISTS; this allows users
   of the API to skip the isc_symtab_lookup()+isc_symtab_define()
   calls and directly call isc_symtab_define_and_return().

3. Merge isccc_symtab into isc_symtab - the only missing function
   was isccc_symtab_foreach() that was merged into isc_symtab API.

4. Add full set of unit tests for the isc_symtab API.

15 months agofix: usr: Fix deferred validation of unsigned DS and DNSKEY records
Mark Andrews [Sun, 16 Feb 2025 23:36:25 +0000 (23:36 +0000)] 
fix: usr: Fix deferred validation of unsigned DS and DNSKEY records

When processing a query with the "checking disabled" bit set (CD=1), `named` stores the unvalidated result in the cache, marked "pending". When the same query is sent with CD=0, the cached data is validated, and either accepted as an answer, or ejected from the cache as invalid. This deferred validation was not attempted for DS and DNSKEY records if they had no cached signatures, causing spurious validation failures. We now complete the deferred validation in this scenario.

Also, if deferred validation fails, we now re-query the data to find out whether the zone has been corrected since the invalid data was cached.

Closes #5066

Merge branch '5066-fix-strip-dnssec-rrsigs' into 'main'

See merge request isc-projects/bind9!10104

15 months agoRe-fetch pending records that failed validation
Mark Andrews [Fri, 20 Dec 2024 09:24:05 +0000 (20:24 +1100)] 
Re-fetch pending records that failed validation

If a deferred validation on data that was originally queried with
CD=1 fails, we now repeat the query, since the zone data may have
changed in the meantime.

15 months agoComplete the deferred validation if there are no RRSIGs
Mark Andrews [Fri, 20 Dec 2024 09:24:05 +0000 (20:24 +1100)] 
Complete the deferred validation if there are no RRSIGs

When a query is made with CD=1, we store the result in the
cache marked pending so that it can be validated later, at
which time it will either be accepted as an answer or removed
from the cache as invalid.  Deferred validation was not
attempted when there were no cached RRSIGs for DNSKEY and
DS.  We now complete the deferred validation in this scenario.

15 months agoAdd stripped DS RRSIG senario
Mark Andrews [Mon, 23 Dec 2024 00:12:56 +0000 (11:12 +1100)] 
Add stripped DS RRSIG senario

15 months agoAdd stripped DNSKEY RRSIG senario
Mark Andrews [Fri, 20 Dec 2024 09:24:05 +0000 (20:24 +1100)] 
Add stripped DNSKEY RRSIG senario

15 months agofix: usr: "CNAME and other data check" not applied to all types
Mark Andrews [Fri, 14 Feb 2025 02:23:52 +0000 (02:23 +0000)] 
fix: usr:  "CNAME and other data check" not applied to all types

An incorrect optimization caused "CNAME and other data" errors not to be detected if certain types were at the same node as a CNAME.  This has been fixed.

Closes #5150

Merge branch '5150-cname-and-other-data-check-not-applied-to-all-types' into 'main'

See merge request isc-projects/bind9!10033

15 months agoMove SVCB and HTTPS to be in type code order
Mark Andrews [Wed, 5 Feb 2025 00:35:11 +0000 (11:35 +1100)] 
Move SVCB and HTTPS to be in type code order

15 months agoTest cname-and-other-data against various types
Mark Andrews [Tue, 4 Feb 2025 23:45:48 +0000 (10:45 +1100)] 
Test cname-and-other-data against various types

15 months agoFix "CNAME and other data" detection
Mark Andrews [Thu, 30 Jan 2025 22:09:33 +0000 (09:09 +1100)] 
Fix "CNAME and other data" detection

prio_type was being used in the wrong place to optimize cname_and_other.
We have to first exclude and accepted types and we also have to
determine that the record exists before we can check if we are at
a point where a later CNAME cannot appear.

15 months agochg: test: Rewrite nzd2nzf system test to pytest
Michal Nowak [Thu, 13 Feb 2025 18:29:07 +0000 (18:29 +0000)] 
chg: test: Rewrite nzd2nzf system test to pytest

Merge branch 'mnowak/pytest_rewrite_nzd2nzf' into 'main'

See merge request isc-projects/bind9!9160

15 months agoRename assert_custom_named_is_alive to named_alive
Michal Nowak [Thu, 23 Jan 2025 14:58:48 +0000 (15:58 +0100)] 
Rename assert_custom_named_is_alive to named_alive

15 months agoRewrite nzd2nzf system test to pytest
Michal Nowak [Mon, 22 Jul 2024 14:01:51 +0000 (16:01 +0200)] 
Rewrite nzd2nzf system test to pytest

15 months agochg: test: Rewrite names system test to pytest
Michal Nowak [Thu, 13 Feb 2025 16:56:31 +0000 (16:56 +0000)] 
chg: test: Rewrite names system test to pytest

Merge branch 'mnowak/pytest_rewrite_names' into 'main'

See merge request isc-projects/bind9!8759

15 months agoRewrite names system test to pytest
Michal Nowak [Wed, 21 Feb 2024 10:36:10 +0000 (11:36 +0100)] 
Rewrite names system test to pytest

dnspython 2.7.0 or newer is needed because of wire().