]> git.ipfire.org Git - thirdparty/bind9.git/log
thirdparty/bind9.git
10 months agoReplace per-zone lock buckets with global buckets
Alessio Podda [Wed, 7 May 2025 12:52:11 +0000 (14:52 +0200)] 
Replace per-zone lock buckets with global buckets

Qpzone employs a locking strategy where rwlocks are grouped into
buckets, and each zone gets 17 buckets.
This strategy is suboptimal in two ways:
 - If named is serving a single zone or a zone is the majority of the
   traffic, this strategy pretty much guarantees contention when using
   more than a dozen threads.
 - If named is serving many small zones, it causes substantial memory
   usage.

This commit switches the locking to a global table initialized at start
time. This should have three effects:
 - Performance should improve in the single zone case, since now we are
   selecting from a bigger pool of locks.
 - Memory consumption should go down significantly in the many zone
   cases.
 - Performance should not degrade substantially in the many zone cases.
   The reason for this is that, while we could have substantially more
   zones than locks, we can query/edit only O(num threads) at the same
   time. So by making the global table much bigger than the expected
   number of threads, we can limit contention.

10 months agochg: dev: Extract the resigning heap into a separate struct
Alessio Podda [Wed, 9 Jul 2025 11:05:52 +0000 (11:05 +0000)] 
chg: dev: Extract the resigning heap into a separate struct

In the current implementation, the resigning heap is part of the zone
database. This leads to a cycle, as the database has a reference to its
nodes, but each node needs a reference to the database.

This MR splits the resigning heap into its own separate struct, in order
to help breaking the cycle.

Merge branch 'alessio/split-qpzone-heap-from-qpdb' into 'main'

See merge request isc-projects/bind9!10706

10 months agoExtract the resigning heap into a separate struct
Alessio Podda [Tue, 8 Jul 2025 14:29:56 +0000 (16:29 +0200)] 
Extract the resigning heap into a separate struct

In the current implementation, the resigning heap is part of the zone
database. This leads to a cycle, as the database has a reference to its
nodes, but each node needs a reference to the database.

This MR splits the resigning heap into its own separate struct, in order
to help breaking the cycle.

10 months agoAbstract bucket lock selection logic
Alessio Podda [Tue, 8 Jul 2025 13:52:35 +0000 (15:52 +0200)] 
Abstract bucket lock selection logic

Recovering the node lock from a pointer to the header and a pointer to
the db is a common operation. This commit abstracts it away into a
function, so that the node lock selection logic may be modified more
easily.

10 months agofix: dev: Fix a possible crash when adding a zone while recursing
Mark Andrews [Wed, 9 Jul 2025 00:55:28 +0000 (10:55 +1000)] 
fix: dev: Fix a possible crash when adding a zone while recursing

A query for a zone that was not yet loaded may yield an unexpected result such as a CNAME or DNAME, triggering an assertion failure. This has been fixed.

Closes #5357

Merge branch '5357-resume-qmin-cname' into 'main'

See merge request isc-projects/bind9!10562

10 months agoAdd few extra WANT_QUERYTRACE logs into resume_qmin
Petr Menšík [Tue, 10 Jun 2025 12:35:03 +0000 (14:35 +0200)] 
Add few extra WANT_QUERYTRACE logs into resume_qmin

Print optionally a bit more details not passed to event in case
dns_view_findzonecut returns unexpected result. Result would be
visible later in foundevent, but found fname would be lost. Print it
into the log.

10 months agoHandle CNAME and DNAME in resume_min in a special way
Petr Mensik [Tue, 3 Jun 2025 19:00:58 +0000 (21:00 +0200)] 
Handle CNAME and DNAME in resume_min in a special way

When authoritative zone is loaded when query minimization query for the
same zone is already pending, it might receive unexpected result codes.

Normally DNS_R_CNAME would follow to query_cname after processing sent
events, but dns_view_findzonecut does not fill CNAME target into
event->foundevent. Usual lookup via query_lookup would always have that
filled.

Ideally we would restart the query with unmodified search name, if
unexpected change from recursing to local zone cut were detected. Until
dns_view_findzonecut is modified to export zone/cache source of the cut,
at least fail queries which went into unexpected state.

10 months agonew: ci: Add AlmaLinux 10
Michal Nowak [Tue, 8 Jul 2025 13:59:27 +0000 (15:59 +0200)] 
new: ci: Add AlmaLinux 10

Merge branch 'mnowak/add-almalinux-10' into 'main'

See merge request isc-projects/bind9!10682

10 months agoDo not add AlmaLinux 9 unit and system test in MR pipelines
Michal Nowak [Tue, 1 Jul 2025 16:04:02 +0000 (18:04 +0200)] 
Do not add AlmaLinux 9 unit and system test in MR pipelines

10 months agoAdd AlmaLinux 10
Michal Nowak [Tue, 1 Jul 2025 15:49:17 +0000 (17:49 +0200)] 
Add AlmaLinux 10

10 months agofix: pkg: Fix named-makejournal man page installation
Michał Kępień [Tue, 8 Jul 2025 12:13:33 +0000 (14:13 +0200)] 
fix: pkg: Fix named-makejournal man page installation

The man page for :iscman:`named-makejournal` was erroneously not
installed when building from a source tarball. This has been fixed.

See #5379

Merge branch '5379-fix-named-makejournal-man-page-installation' into 'main'

See merge request isc-projects/bind9!10709

10 months agoAdd missing files for meson built manpages
Aydın Mercan [Tue, 8 Jul 2025 09:26:03 +0000 (12:26 +0300)] 
Add missing files for meson built manpages

These manual entries still get built and installed but get excluded from
meson's rebuild detection.

10 months agoFix named-makejournal man page installation
Michał Kępień [Tue, 8 Jul 2025 08:27:22 +0000 (10:27 +0200)] 
Fix named-makejournal man page installation

The man page for named-makejournal is erroneously not installed when
building from a source tarball.  Add that man page to the appropriate
lists in the build system so that it is installed both when building
from a Git repository and from a source tarball.

10 months agofix: ci: Ensure PYTHON is set for every parse_tsan.py invocation
Michal Nowak [Tue, 8 Jul 2025 10:21:47 +0000 (12:21 +0200)] 
fix: ci: Ensure PYTHON is set for every parse_tsan.py invocation

System tests' after_script missed the PYTHON environmental variable
setup.

    $ find -name 'tsan.*' -exec "$PYTHON" util/parse_tsan.py {} \;
    find: '': No such file or directory

Merge branch 'mnowak/fix-parse_tsan-invocation' into 'main'

See merge request isc-projects/bind9!10683

10 months agoEnsure PYTHON is set for every parse_tsan.py invocation
Michal Nowak [Wed, 2 Jul 2025 12:32:43 +0000 (14:32 +0200)] 
Ensure PYTHON is set for every parse_tsan.py invocation

System tests' after_script missed the PYTHON environmental variable
setup.

    $ find -name 'tsan.*' -exec "$PYTHON" util/parse_tsan.py {} \;
    find: '': No such file or directory

10 months agofix: usr: Clean enough memory when adding new ADB names/entries under memory pressure
Ondřej Surý [Tue, 8 Jul 2025 07:49:30 +0000 (09:49 +0200)] 
fix: usr: Clean enough memory when adding new ADB names/entries under memory pressure

The ADB memory cleaning is opportunistic even when we are under
memory pressure (in the overmem condition).  Split the opportunistic
LRU cleaning and overmem cleaning and make the overmem cleaning
always cleanup double of the newly allocated adbname/adbentry to
ensure we never allocate more memory than the assigned limit.

Merge branch 'ondrej/enforce-memory-cleanup-in-ADB-when-overmem' into 'main'

See merge request isc-projects/bind9!10637

10 months agoWhen overmem, clean enough memory when adding new ADB names/entries
Ondřej Surý [Wed, 25 Jun 2025 10:05:14 +0000 (12:05 +0200)] 
When overmem, clean enough memory when adding new ADB names/entries

The purge_stale_names()/purge_stale_entries() is opportunistic even when
we are under memory pressure (overmem).  Split the opportunistic LRU
cleaning and overmem cleaning.  This makes the stale purging much
simpler as we don't have to try that hard and makes the overmem cleaning
always cleanup double the amount of the newly allocated ADB name/entry.

10 months agochg: usr: use native shared library extension
Mark Andrews [Mon, 7 Jul 2025 15:24:40 +0000 (01:24 +1000)] 
chg: usr: use native shared library extension

Use the native shared library extension when build loadable
libaries.  For most platforms this is ".so" but for Darwin it
is ".dylib".

Closes #5375

Merge branch '5375-use-native-shared-library-extension' into 'main'

See merge request isc-projects/bind9!10588

10 months agoUse native shared library extension
Mark Andrews [Tue, 17 Jun 2025 06:14:51 +0000 (16:14 +1000)] 
Use native shared library extension

For most platforms this is ".so" but for Darwin it is ".dylib".

10 months agochg: test: Improve system test stability
Nicki Křížek [Mon, 7 Jul 2025 12:04:10 +0000 (14:04 +0200)] 
chg: test: Improve system test stability

Tweak various system test which have been unstable in the past weeks.

Closes #5406

Merge branch 'nicki/improve-system-test-stability' into 'main'

See merge request isc-projects/bind9!10690

10 months agoRemove unstable check from digdelv test
Nicki Křížek [Fri, 4 Jul 2025 13:41:04 +0000 (15:41 +0200)] 
Remove unstable check from digdelv test

The code which checks for both IPv4 and IPv6 mixed usage is inherently
unstable, since the address family is chosen randomly for each
connection.

Closes #5406

10 months agoUse pytest.mark.flaky as the flaky marker
Nicki Křížek [Thu, 3 Jul 2025 13:22:23 +0000 (15:22 +0200)] 
Use pytest.mark.flaky as the flaky marker

It's possible to use pytest.mark.flaky, which achieves the exact same
thing as our custom-defined isctest.mark.flaky -- attempts to rerun the
test on failure, but only is flaky package is available.

10 months agoMark secondary.kasp test case as flaky on freebsd13
Nicki Křížek [Thu, 3 Jul 2025 12:50:25 +0000 (14:50 +0200)] 
Mark secondary.kasp test case as flaky on freebsd13

The test_kasp_case[secondary.kasp] can sometimes fail on freebsd13. It
appears the test gets stuck on some operation which should be very
quick, but for some reason takes at least a few seconds, causing the
cb_ixfr_is_signed() function to time out.

In one of the cases I investigated, it wasn't a query/response that
caused a timeout, but rather some operation in between. The test
attempts to read from a keyfile/statefile, but I see no reason why that
should block.

In any case, try to increase the timeout for the verification, as that
shouldn't hurt. Also allow the test to be re-run on freebsd13, as it's
likely to be caused by some odd behaviour on that platform -- the issue
doesn't appear anywhere else.

10 months agoAllow dnstap system test rerun on freebsd13
Nicki Křížek [Thu, 3 Jul 2025 12:40:06 +0000 (14:40 +0200)] 
Allow dnstap system test rerun on freebsd13

The check "unix socket message counts" sometimes fails with "dnstap
output file smaller than expected". This only happens on freebsd13 and
can't be reproduced easily. There was an attempt to decrease the
required file size in the past, but apparently, the issue can still
occur.

10 months agoMark the serve_stale system test as flaky
Nicki Křížek [Thu, 3 Jul 2025 12:02:57 +0000 (14:02 +0200)] 
Mark the serve_stale system test as flaky

The serve_stale test has some inherent instabilities affecting many
different checks. While the failure rate isn't too high (about four
failures in past three weeks of nightlies), it gets ignored, because the
test has been unstable for a very long time.

10 months agoRemove token deletion check in keyfromlabel test
Nicki Křížek [Thu, 3 Jul 2025 11:26:14 +0000 (13:26 +0200)] 
Remove token deletion check in keyfromlabel test

This removes a leftover check which should've been removed in a prior
change (see #5244). The softhsm2 failures when attempting to delete the
token should be ignored.

10 months agoUse proper wait in rndc test
Nicki Křížek [Wed, 2 Jul 2025 16:00:16 +0000 (18:00 +0200)] 
Use proper wait in rndc test

Previously, the one-second sleep was unreliable, as it didn't properly
indicate that the rndc reconfig has been processed. The "test 'rndc
reconfig' with a broken config" check would sometimes fail under TSAN
in CI, because the previous rndc reconfig was still ongoing, and the
subsequent rndc reconfig was ignored.

10 months agoAllow reruns for test_json and test_xml tests
Nicki Křížek [Wed, 2 Jul 2025 15:57:14 +0000 (17:57 +0200)] 
Allow reruns for test_json and test_xml tests

These tests have been unstable under TSAN in the past, but it appears
that the same failure mode can happen outside of TSAN tests as well.
These tests have produced 12 failures combined in the past three weeks
in nightlies.

10 months agoIncrease test reruns for fetchlimit
Nicki Křížek [Wed, 2 Jul 2025 15:53:18 +0000 (17:53 +0200)] 
Increase test reruns for fetchlimit

The fetchlimit test has failed 8 times in the nightly CI over the past
three weeks. That makes the overall failure rate somewhere around 1 %,
which isn't a lot, but is still annoying when lots of testing is going
on.

10 months agofix: test: rndc test: second 'rndc reconfig' happens too soon
Mark Andrews [Mon, 7 Jul 2025 02:21:58 +0000 (12:21 +1000)] 
fix: test: rndc test: second 'rndc reconfig' happens too soon

Rndc test "test 'rndc reconfig' with a broken config" was failing
intermittently.

Wait for 'running' to be logged rather than just using 'sleep 1' before
calling 'rndc reconfig' a second time to get the expected error message
rather than 'reconfig request ignored: already running'.

Closes #5408

Merge branch '5408-rndc-test-second-rndc-reconfig-happens-too-soon' into 'main'

See merge request isc-projects/bind9!10687

10 months agorndc test: second 'rndc reconfig' happens too soon
Mark Andrews [Wed, 2 Jul 2025 23:13:11 +0000 (09:13 +1000)] 
rndc test: second 'rndc reconfig' happens too soon

Rndc test "test 'rndc reconfig' with a broken config" was failing
intermittently.

Wait for 'running' to be logged rather than just using 'sleep 1' before
calling 'rndc reconfig' a second time to get the expected error message
rather than 'reconfig request ignored: already running'.

10 months agochg: test: Disable DNSSEC validation instead of enabling it with empty TAs in system...
Štěpán Balážik [Sun, 6 Jul 2025 16:54:41 +0000 (16:54 +0000)] 
chg: test: Disable DNSSEC validation instead of enabling it with empty TAs in system tests

There are many system tests where we set `dnssec-validation yes;` only
to also set `trust-anchors { };` which effectively disables the
validation.

This MR replaces this convoluted setup with just `dnssec-validation no;`.

Merge branch 'stepan/empty-trust-anchors-in-system-tests' into 'main'

See merge request isc-projects/bind9!10684

10 months agoDisable DNSSEC validation instead of enabling it with empty TAs in tests
Štěpán Balážik [Wed, 2 Jul 2025 14:39:01 +0000 (16:39 +0200)] 
Disable DNSSEC validation instead of enabling it with empty TAs in tests

There are many system tests where we set `dnssec-validation yes;` only
to also set `trust-anchors { };` which effectively disables the
validation.

This commit replaces this convoluted setup with just
`dnssec-validation no;`.

10 months agonew: ci: Run an additional respdiff job for merge requests and schedules
Štěpán Balážik [Sun, 6 Jul 2025 13:18:53 +0000 (13:18 +0000)] 
new: ci: Run an additional respdiff job for merge requests and schedules

On MRs it uses the merge target as the reference.
In schedules it uses the latest released version for this branch as the reference.

This MR lays the ground work for using respdiff on non-standard configurations (like ECS) in the public repo, see https://gitlab.isc.org/isc-private/bind9/-/merge_requests/807#note_573140.

To reduce the future hassle when maintaining the -S version, most of the work (including an added job, so we know that it actually works) is done here.

Merge branch 'stepan/respdiff-against-merge-target-or-last-release' into 'main'

See merge request isc-projects/bind9!10664

10 months agoRun an additional respdiff job for merge requests and schedules
Štěpán Balážik [Fri, 27 Jun 2025 17:42:26 +0000 (19:42 +0200)] 
Run an additional respdiff job for merge requests and schedules

On MRs it uses the merge target as the reference.
In schedules it uses the latest released version for this branch as the
reference.

10 months agofix: dev: Separate out adbname type flags
Mark Andrews [Sun, 6 Jul 2025 13:09:13 +0000 (23:09 +1000)] 
fix: dev: Separate out adbname type flags

There are three adbname flags that are used to identify different
types of adbname lookups when hashing rather than using multiple
hash tables.  Separate these to their own structure element as these
need to be able to be read without locking the adbname structure.

Closes #5404

Merge branch '5404-seperate-out-adbname-type-flags' into 'main'

See merge request isc-projects/bind9!10677

10 months agoSeparate out adbname flags that are hashed
Mark Andrews [Tue, 1 Jul 2025 06:45:39 +0000 (16:45 +1000)] 
Separate out adbname flags that are hashed

There are three adbname flags that are used to identify different
types of adbname lookups when hashing rather than using multiple
hash tables.  Separate these to their own structure element as these
need to be able to be read without locking the adbname structure.

10 months agochg: doc: Set up version for BIND 9.21.11
Michał Kępień [Fri, 4 Jul 2025 20:16:23 +0000 (22:16 +0200)] 
chg: doc: Set up version for BIND 9.21.11

Merge branch 'michal/set-up-version-for-bind-9.21.11' into 'main'

See merge request isc-projects/bind9!10692

10 months agoUpdate BIND version to 9.21.11-dev
Michał Kępień [Fri, 4 Jul 2025 20:08:41 +0000 (22:08 +0200)] 
Update BIND version to 9.21.11-dev

10 months agoUpdate BIND version for release 263158 v9.21.10
Michał Kępień [Fri, 4 Jul 2025 09:34:56 +0000 (11:34 +0200)] 
Update BIND version for release

10 months agonew: doc: Prepare documentation for BIND 9.21.10
Michał Kępień [Fri, 4 Jul 2025 09:33:25 +0000 (11:33 +0200)] 
new: doc: Prepare documentation for BIND 9.21.10

Merge branch 'michal/prepare-documentation-for-bind-9.21.10' into 'v9.21.10-release'

See merge request isc-private/bind9!816

10 months agoAdd release note for GL !8989
Michał Kępień [Thu, 3 Jul 2025 20:54:36 +0000 (22:54 +0200)] 
Add release note for GL !8989

10 months agoTweak and reword release notes
Michał Kępień [Thu, 3 Jul 2025 20:54:36 +0000 (22:54 +0200)] 
Tweak and reword release notes

10 months agoPrepare release notes for BIND 9.21.10
Michał Kępień [Thu, 3 Jul 2025 20:54:36 +0000 (22:54 +0200)] 
Prepare release notes for BIND 9.21.10

10 months agoGenerate changelog for BIND 9.21.10
Michał Kępień [Thu, 3 Jul 2025 20:54:36 +0000 (22:54 +0200)] 
Generate changelog for BIND 9.21.10

10 months ago[CVE-2025-40777] sec: usr: Fix a possible assertion failure when using the 'stale...
Andoni Duarte [Thu, 3 Jul 2025 10:52:28 +0000 (10:52 +0000)] 
[CVE-2025-40777] sec: usr: Fix a possible assertion failure when using the 'stale-answer-client-timeout 0' option

In specific circumstances the :iscman:`named` resolver process could
terminate unexpectedly when stale answers were enabled and the
``stale-answer-client-timeout 0`` configuration option was used.
This has been fixed.

See isc-projects/bind9#5372

Merge branch '5372-security-serve-stale-crash-on-insist-unreachable' into 'v9.21.10-release'

See merge request isc-private/bind9!808

10 months agoReset DNS_DBFIND_STALETIMEOUT in query_lookup()
Aram Sargsyan [Wed, 18 Jun 2025 13:32:03 +0000 (13:32 +0000)] 
Reset DNS_DBFIND_STALETIMEOUT in query_lookup()

If ns__query_start() is called because of a chained query (e.g.
after encountering a CNAME), a previously set DNS_DBFIND_STALETIMEOUT
flag on the query's 'dboptions' field can cause an assertion
failure if the new query's 'stalefirst' value is not true (e.g. if the
target qname is an authoritative zone for the server). Reset the
DNS_DBFIND_STALETIMEOUT flag in the query_lookup() function before
evaluating the 'stalefirst' value, and make sure to assign a fresh
value to the `stalefirst' flag instead of conditionally assigning it
only if the value is 'true'.

10 months agochg: ci: Allow flaky unit tests to be re-run in CI
Nicki Křížek [Wed, 2 Jul 2025 11:49:00 +0000 (13:49 +0200)] 
chg: ci: Allow flaky unit tests to be re-run in CI

Mark unstable unit tests with `flaky` test suite. Execute the stable
separately in CI. Allow the flaky ones to be re-executed once in case
they fail.

Closes #5385

Merge branch '5385-rerun-flaky-unit-tests' into 'main'

See merge request isc-projects/bind9!10665

10 months agoAllow flaky unit tests to be re-run in CI
Nicki Křížek [Fri, 27 Jun 2025 14:11:43 +0000 (16:11 +0200)] 
Allow flaky unit tests to be re-run in CI

Mark instable unit tests with `flaky` test suite. Execute the stable
separately in CI. Allow the flaky ones to be re-executed once in case
they fail.

10 months agochg: nil: Remove references to configure.ac
Andoni Duarte [Wed, 2 Jul 2025 08:51:10 +0000 (08:51 +0000)] 
chg: nil: Remove references to configure.ac

The Meson build system does not use `configure.ac`.  Remove all mentions
of this file from documentation and scripts.

See #5379

Merge branch 'andoni/remove-references-to-configureac' into 'main'

See merge request isc-projects/bind9!10672

10 months agoUpdate documented build commands for fuzzers
Michał Kępień [Tue, 1 Jul 2025 04:16:46 +0000 (06:16 +0200)] 
Update documented build commands for fuzzers

Due to the changing the build system to Meson, replace ./configure
invocations with their Meson counterparts in fuzz/FUZZING.md.

10 months agoCheck meson pairwise testing switches
Andoni Duarte Pintado [Mon, 30 Jun 2025 11:14:33 +0000 (13:14 +0200)] 
Check meson pairwise testing switches

dangerfile.py checked for new configure switches in `configure.ac`,
these were annotated with "# [pairwise:..." in a leading line. Meson
reads those from `meson_options.txt` instead.

10 months agoRemove reference to configure in CONTRIBUTING.md
Andoni Duarte Pintado [Mon, 30 Jun 2025 10:19:20 +0000 (12:19 +0200)] 
Remove reference to configure in CONTRIBUTING.md

The Meson build system does not use `configure`, so the comment no
longer applies when submitting patches.

10 months agoRemove unused reference to SYSTEMTESTTOP
Andoni Duarte Pintado [Mon, 30 Jun 2025 10:16:12 +0000 (12:16 +0200)] 
Remove unused reference to SYSTEMTESTTOP

The SYSTEMTESTTOP variable is no longer used in the tests.

10 months agofix: nil: ignore hardening flags on plain builds
Aydın Mercan [Tue, 1 Jul 2025 20:49:47 +0000 (23:49 +0300)] 
fix: nil: ignore hardening flags on plain builds

The 'plain' optimization level doesn't add any flags and gives the
control to the packager. Similarly, avoid any hardening flags in this
level.

Necessary flags such as `-fno-delete-null-pointer-checks` and
`-fno-strict-aliasing` are still included.

Merge branch 'aydin/plain-build' into 'main'

See merge request isc-projects/bind9!10673

10 months agofix x86 specific flags
Aydın Mercan [Mon, 30 Jun 2025 12:08:53 +0000 (15:08 +0300)] 
fix x86 specific flags

There was a mistake in the host machine check in meson

10 months agoignore hardening flags on plain builds
Aydın Mercan [Mon, 30 Jun 2025 09:30:53 +0000 (12:30 +0300)] 
ignore hardening flags on plain builds

The 'plain' optimization level doesn't add any flags and gives the
control to the packager. Similarly, avoid any hardening flags in this
level.

Necessary flags such as `-fno-delete-null-pointer-checks` and
`-fno-strict-aliasing` are still included.

10 months agofix: usr: Fix the default interface-interval from 60s to 60m
Ondřej Surý [Tue, 1 Jul 2025 09:58:54 +0000 (11:58 +0200)] 
fix: usr: Fix the default interface-interval from 60s to 60m

When the interface-interval parser was changed from uint32 parser to
duration parser, the default value stayed at plain number `60` which
now means 60 seconds instead of 60 minutes.  The documentation also
incorrectly states that the value is in minutes.  That has been fixed.

Closes #5246

Merge branch '5246-fix-default-interface-interval' into 'main'

See merge request isc-projects/bind9!10281

10 months agoFix the default interface-interval docs and default value
Ondřej Surý [Tue, 18 Mar 2025 13:05:39 +0000 (14:05 +0100)] 
Fix the default interface-interval docs and default value

When the interface-interval parser was changed from uint32 parser to
duration parser, the default value stayed at plain 60 which now means 60
seconds instead of 60 minutes.  Fix the default value and the
documentation to match the reality.

10 months agonew: test: add startup root DNSKEY refresh system test alessio/experimental-ns-client-noinit-baseline
Colin Vidal [Mon, 30 Jun 2025 12:51:20 +0000 (14:51 +0200)] 
new: test: add startup root DNSKEY refresh system test

Root trust anchors are automatically updated as described in RFC5011.
Add a system test which ensures the root DNSKEYs are always queried by
named during startup.

Because this test uses real internet DNS root servers, it is enabled
only when `CI_ENABLE_LIVE_INTERNET_TESTS` is set.

Merge branch 'colin/updaterootdnskey' into 'main'

See merge request isc-projects/bind9!10615

10 months agoadd startup root DNSKEY refresh system test
Colin Vidal [Tue, 24 Jun 2025 09:55:42 +0000 (11:55 +0200)] 
add startup root DNSKEY refresh system test

Root trust anchors are automatically updated as described in RFC5011.
Add a system test which ensures the root DNSKEYs are always queried by
named during startup.

Because this test uses real internet DNS root servers, it is enabled
only when `CI_ENABLE_LIVE_INTERNET_TESTS` is set.

10 months agofix: dev: Prevent false sharing for the .inuse member of isc_mem_t
Ondřej Surý [Mon, 30 Jun 2025 11:23:38 +0000 (13:23 +0200)] 
fix: dev: Prevent false sharing for the .inuse member of isc_mem_t

Change the .inuse member of memory context to have a loop-local
variable, so there's no contention even when the same memory
context is shared among multiple threads.

Closes #5354

Merge branch '5354-prevent-false-sharing-in-isc_mem' into 'main'

See merge request isc-projects/bind9!10555

10 months agoChange the .inuse member of isc_mem to be per-thread/per-loop
Ondřej Surý [Wed, 4 Jun 2025 16:14:23 +0000 (18:14 +0200)] 
Change the .inuse member of isc_mem to be per-thread/per-loop

The .inuse member was causing a lot of contention between threads using
the same memory context.  Scather the .inuse and .overmem members of
isc_mem_t structure to be an per-tid array of variables to reduce the
contention as the writes are now independent of each other.

The array uses one tad bit nasty trick, as ISC_TID_UNKNOWN is now -1,
the array has been sized to fit the unknown tid with [-1] index into the
array accomplished with `ctx->stat = &ctx->stat_s[1];`.  It will not win
a beauty contest, but it works seamlessly by just passing `isc_tid()` as
an index into the array.

The caveat here is that gathering the real inuse value requires walking
the whole array for all registered tid values (isc_tid_count()).  The
gather part happens only when statistics are being gathered or when
isc_mem_isovermem() is called.  As the isc_mem_isovermem() call happens
only when new data is being added to cache or ADB, it doesn't happen on
the hottest (read-only) path and according to the measurements, it
doesn't slow down neither the cold cache nor the hot cache latency.

10 months agofix: dev: Various cleanups related to the isc_mem unit
Ondřej Surý [Mon, 30 Jun 2025 11:22:53 +0000 (13:22 +0200)] 
fix: dev: Various cleanups related to the isc_mem unit

Merge branch 'ondrej/tidy-up-isc-mem-unit' into 'main'

See merge request isc-projects/bind9!10671

10 months agoDon't use ssize_t for storing difference between sizes
Ondřej Surý [Thu, 5 Jun 2025 10:19:43 +0000 (12:19 +0200)] 
Don't use ssize_t for storing difference between sizes

As POSIX guarantees only that the type ssize_t shall be capable of
storing values at least in the range [-1, {SSIZE_MAX}], it can't be used
to calculate the difference between two memory sizes.  Change the logic
for junk filling to test whether the new size is larger than old size
and then use size_t as the result will be always positive.

10 months agoRemove .hi_called member of isc_mem_t structure
Ondřej Surý [Wed, 4 Jun 2025 15:43:34 +0000 (17:43 +0200)] 
Remove .hi_called member of isc_mem_t structure

The .hi_called member was dead structure member and it hasn't been used
since the overmem callback has been removed in commit
14bdd21e0a7ad5f115bb2427d4f88fe7a84e9324.

10 months agoAdd and use MALLOCX_ZERO_GET() macro to jemalloc_shim.h
Ondřej Surý [Wed, 4 Jun 2025 08:19:35 +0000 (10:19 +0200)] 
Add and use MALLOCX_ZERO_GET() macro to jemalloc_shim.h

Pull MALLOCX_ZERO_GET() macro to align the usage with the jemalloc
jemalloc/internal/jemalloc_internal_types.h header.

10 months agoDelete jemalloc arena support from isc_mem
Ondřej Surý [Wed, 4 Jun 2025 08:35:57 +0000 (10:35 +0200)] 
Delete jemalloc arena support from isc_mem

The jemalloc arena in isc_mem was added to solve runaway memory problem
for outgoing TCP connections.  In the end, this was a red herring and
the jemalloc arena code is now unused (via e28266bf).  Remove the
support for jemalloc memory arenas as we can restore this at any time if
we need it ever again, but right now it's just a dead code.

10 months agoFix implicit headers when using isc/overflow.h header
Ondřej Surý [Wed, 25 Jun 2025 06:25:41 +0000 (08:25 +0200)] 
Fix implicit headers when using isc/overflow.h header

In jemalloc_shim.h, we relied on including <isc/overflow.h> implicitly
instead of explicitly and same was happening inside isc/overflow.h - the
stdbool.h (for bool type) was being included implicitly instead of
explicitly.

10 months agofix: nil: do not install manpages for unbuilt binaries
Aydın Mercan [Mon, 30 Jun 2025 09:36:24 +0000 (12:36 +0300)] 
fix: nil: do not install manpages for unbuilt binaries

See #5379

Merge branch 'aydin/git-tree-man-fix' into 'main'

See merge request isc-projects/bind9!10627

10 months agodo not install manpages for unbuilt binaries
Aydın Mercan [Tue, 24 Jun 2025 13:30:15 +0000 (16:30 +0300)] 
do not install manpages for unbuilt binaries

Building and installing from a git release installed all manpages
unconditionally even if binaries like dnstap-read were disabled and not
built.

Now the manpage configuration checks for such cases and also cleans up
remaining artifacts and unnecessary pages if the build directory is
reconfigured.

10 months agodo not install sphinx-build manpages in templated ones exist
Aydın Mercan [Mon, 23 Jun 2025 18:32:34 +0000 (21:32 +0300)] 
do not install sphinx-build manpages in templated ones exist

When building from the tarball, meson would try to install both
sphinx-built and template configured manpages.

While harmless for now, it might cause issues for future meson version.

10 months agochg: dev: Change isc_tid to be isc_tid_t type (a signed integer type)
Ondřej Surý [Sat, 28 Jun 2025 12:06:05 +0000 (14:06 +0200)] 
chg: dev: Change isc_tid to be isc_tid_t type (a signed integer type)

Change the internal type used for isc_tid unit to isc_tid_t to hide the
specific integer type being used for the 'tid'.  Internally, the isc_tid
unit is now using signed integer type.  This allows us to have negatively
indexed arrays that works both for threads with assigned tid and the
threads with unassigned tid.  Additionally, limit the number of threads
(loops) to 512 (compile time default).

Merge branch 'ondrej/tidy-up-isc-tid' into 'main'

See merge request isc-projects/bind9!10656

10 months agoAdd ISC_TID_MAX with default being 512 threads
Ondřej Surý [Wed, 4 Jun 2025 16:00:01 +0000 (18:00 +0200)] 
Add ISC_TID_MAX with default being 512 threads

The ISC_TID_MAX variable allows other units to declare static arrays
with this as size for per-thread/per-loop variables.

10 months agoConvert the isc/tid.h to use own signed integer isc_tid_t type
Ondřej Surý [Wed, 4 Jun 2025 15:54:20 +0000 (17:54 +0200)] 
Convert the isc/tid.h to use own signed integer isc_tid_t type

Change the internal type used for isc_tid unit to isc_tid_t to hide the
specific integer type being used for the 'tid'.  Internally, the signed
integer type is being used.  This allows us to have negatively indexed
arrays that works both for threads with assigned tid and the threads
with unassigned tid.  This should be used only in specific situations.

10 months agofix: nil: Only run ci-orphaned-anchors on MR events
Štěpán Balážik [Sat, 28 Jun 2025 10:51:59 +0000 (10:51 +0000)] 
fix: nil: Only run ci-orphaned-anchors on MR events

Now, it is also run in schedules and most annoyingly on push which means
that it is run twice on a push to a branch where a MR exists and `.gitlab-ci.yml` is changed.

This was an oversight in https://gitlab.isc.org/isc-projects/bind9/-/merge_requests/10654

Merge branch 'stepan/remove-additional-pipeline' into 'main'

See merge request isc-projects/bind9!10668

10 months agoOnly run ci-orphaned-anchors on MR events
Štěpán Balážik [Fri, 27 Jun 2025 18:27:14 +0000 (20:27 +0200)] 
Only run ci-orphaned-anchors on MR events

Now, it is also run in schedules and most annoyingly on push which means
that it is run twice on a push to a branch where a MR exists.

10 months agonew: ci: Add a check for defined but never used anchors in .gitlab-ci.yaml
Štěpán Balážik [Fri, 27 Jun 2025 16:41:06 +0000 (16:41 +0000)] 
new: ci: Add a check for defined but never used anchors in .gitlab-ci.yaml

If an new orphan anchor is (`.anchor: &anchor` with no corresponding `*anchor` elsewhere in the file) is introduced the CI job will.

Depends on https://gitlab.isc.org/isc-projects/bind9-qa/-/merge_requests/101 (merge that first and then drop the `--branch` commit).

Merge branch 'stepan/ci-orphaned-anchors' into 'main'

See merge request isc-projects/bind9!10654

10 months agoRemove orphaned anchors in .gitlab-ci.yml
Štěpán Balážik [Thu, 26 Jun 2025 14:46:27 +0000 (16:46 +0200)] 
Remove orphaned anchors in .gitlab-ci.yml

These were left there after previous refactors.

10 months agoAdd a check for defined but never used anchors in .gitlab-ci.yaml
Štěpán Balážik [Thu, 26 Jun 2025 14:15:45 +0000 (16:15 +0200)] 
Add a check for defined but never used anchors in .gitlab-ci.yaml

If a anchor is ever orphaned, this will fail in CI.

10 months agoDon't redifine stage:precheck in ci-variables job definition
Štěpán Balážik [Thu, 26 Jun 2025 14:10:29 +0000 (16:10 +0200)] 
Don't redifine stage:precheck in ci-variables job definition

The value is defined in the *precheck_job anchor.

10 months agofix: nil: Move root zone mirror system test to a separate directory
Štěpán Balážik [Fri, 27 Jun 2025 15:20:29 +0000 (15:20 +0000)] 
fix: nil: Move root zone mirror system test to a separate directory

This test doesn't require artifact checking but when bundled in the same
directory with the shell based tests, the `system:clang:tsan` job was
failing non-deterministically.

An example of the job failing and succeeding on the same commit:
- https://gitlab.isc.org/isc-projects/bind9/-/jobs/5809299
- https://gitlab.isc.org/isc-projects/bind9/-/jobs/5809447

Merge branch 'stepan/move-root-zone-mirror-test-to-a-separate-directory' into 'main'

See merge request isc-projects/bind9!10659

10 months agoMove root zone mirror system test to a separate directory
Štěpán Balážik [Fri, 27 Jun 2025 13:51:05 +0000 (15:51 +0200)] 
Move root zone mirror system test to a separate directory

This test doesn't require artifact checking but when bundled in the same
directory with the shell based tests, the `system:clang:tsan` job was
failing non-deterministically.

10 months agochg: test: Improve pytest log output
Nicki Křížek [Fri, 27 Jun 2025 15:03:54 +0000 (17:03 +0200)] 
chg: test: Improve pytest log output

- increase clarity of multiline messages
- support `isc.query.*()` query&response logging
- replace use of `print()` statement with proper logging
- omit empty lines from test result output

Merge branch 'nicki/improve-pytest-logging' into 'main'

See merge request isc-projects/bind9!10590

10 months agoLog assertion failures right after test result
Nicki Křížek [Thu, 26 Jun 2025 16:20:06 +0000 (18:20 +0200)] 
Log assertion failures right after test result

The extra messages are typically traceback from assertion failures.
Previously, they'd be printed only after all individual test case
results have been printed. That made it difficult to pair the traceback
to the failing test in some cases, as the node information (aka test
name) might not always be present.

Instead, log any extra messages related to a particular test failure
directly after reporting its result, making the failure details more
readily available and easy to connect with a particular test case.

10 months agoLog command stdout when using isctest.run.cmd()
Nicki Křížek [Thu, 26 Jun 2025 14:18:01 +0000 (16:18 +0200)] 
Log command stdout when using isctest.run.cmd()

The command's stdout may provide useful debug info, so make sure we log
it by default. It doesn't seem to have a significant impact on the log
size.

10 months agoLog query and response when using isctest.query.*
Nicki Křížek [Thu, 26 Jun 2025 14:14:50 +0000 (16:14 +0200)] 
Log query and response when using isctest.query.*

Make sure the queries and responses are logged at the DEBUG level, which
may provide useful information in case of failing tests.

This doesn't seem to significantly increase the overall artifacts size.
Previously, pytest.log.txt files from all system tests would take around
3 MB, with this change, it's around 8 MB).

10 months agoUse proper logging in SPNEGO tests
Nicki Křížek [Tue, 17 Jun 2025 15:43:06 +0000 (17:43 +0200)] 
Use proper logging in SPNEGO tests

Avoid using print() and use proper logging facility instead.

10 months agoAdd options for query&response logging to pytest
Nicki Křížek [Tue, 17 Jun 2025 15:40:07 +0000 (17:40 +0200)] 
Add options for query&response logging to pytest

In some cases, it's useful to log the sent and received DNS messages.
Add options to enable this on demand. Query is only logged the first
time it's sent, since it doesn't change. If response logging is turned
on, then each response is logged, since it might be different every
time.

10 months agoIndent multiline output in pytest logging
Nicki Křížek [Tue, 17 Jun 2025 15:33:22 +0000 (17:33 +0200)] 
Indent multiline output in pytest logging

When multiline message is logged, indent all but the first line (which
will be preceeded by the LOG_FORMAT). This improves the clarity of logs,
as it's immediately clear which lines are regular log output, and which
ones are multiline debug output.

Adjust the isctest.run.cmd() stdout/stderr logging to this new format.

10 months agoDon't log empty test result messages
Nicki Křížek [Tue, 17 Jun 2025 15:21:33 +0000 (17:21 +0200)] 
Don't log empty test result messages

The messages obtained from test results may contain stuff like detailed
failure/error information, tracebacks etc. In many cases, the message
will be empty, in which case it doesn't need to be logged.

For an example, run test with many test cases, e.g.
verify/test_verify.py, and inspect the tail of the pytest.log.txt before
and after this commit.

10 months agoReplace print statements in checkds test
Nicki Křížek [Tue, 17 Jun 2025 13:47:48 +0000 (15:47 +0200)] 
Replace print statements in checkds test

Use isctest.log logging facility for consistent and predictable logging
output rather than using print(). Remove writes of stderr, as that
output will be logged in the debug log in case the commands called with
isctest.run.cmd() fails.

10 months agonew: test: Add a system test that ensures root zone mirroring works out of the box
Štěpán Balážik [Fri, 27 Jun 2025 12:10:11 +0000 (12:10 +0000)] 
new: test: Add a system test that ensures root zone mirroring works out of the box

This is a test for #5380.

Merge branch 'stepan/mirror-root-zone-from-the-internet' into 'main'

See merge request isc-projects/bind9!10596

10 months agoAdd a system test that ensures root zone mirroring works out of the box
Štěpán Balážik [Wed, 18 Jun 2025 19:06:19 +0000 (21:06 +0200)] 
Add a system test that ensures root zone mirroring works out of the box

This is a test for #5380.

10 months agoAdd a pytest mark for system tests that require Internet connection
Štěpán Balážik [Thu, 19 Jun 2025 07:53:20 +0000 (09:53 +0200)] 
Add a pytest mark for system tests that require Internet connection

We skip those by default as:

a) we don't want to stress the upstream servers in every CI pipeline
b) system tests need to be runnable in a isolated environment by default

10 months agoRename CI_ENABLE_ALL_TESTS to CI_ENABLE_LONG_TESTS
Štěpán Balážik [Fri, 20 Jun 2025 12:09:17 +0000 (14:09 +0200)] 
Rename CI_ENABLE_ALL_TESTS to CI_ENABLE_LONG_TESTS

New name is more descriptive and allows us to created more optional
test sets.

10 months agorem: nil: Remove scripts related to the automake test driver
Štěpán Balážik [Thu, 26 Jun 2025 13:25:31 +0000 (13:25 +0000)] 
rem: nil: Remove scripts related to the automake test driver

These were left in in the Meson migration.

Merge branch 'stepan/clean-up-test-driver-residue' into 'main'

See merge request isc-projects/bind9!10648

10 months agoRemove scripts related to the automake test driver
Štěpán Balážik [Thu, 26 Jun 2025 09:54:43 +0000 (11:54 +0200)] 
Remove scripts related to the automake test driver

These were left in in the Meson migration.

10 months agofix: ci: Simplify maintenance of NO_BUILD_TEST_PREREQ CI hack
Petr Špaček [Thu, 26 Jun 2025 12:50:31 +0000 (12:50 +0000)] 
fix: ci: Simplify maintenance of NO_BUILD_TEST_PREREQ CI hack

Merge branch 'pspacek/fix-ci-meson-170-unit-tests' into 'main'

See merge request isc-projects/bind9!10644

10 months agoSimplify maintenance of NO_BUILD_TEST_PREREQ CI hack
Petr Špaček [Wed, 25 Jun 2025 15:53:25 +0000 (17:53 +0200)] 
Simplify maintenance of NO_BUILD_TEST_PREREQ CI hack

Our split between build and test phases in CI triggers odd corner case
in Meson:
- Newer Meson versions (1.7.0+) do not build test targets as part of
  "all" target.
- We copy build artifacts from build phase into test container.
- meson test --no-rebuild does not build test artifacts even if they are
  missing.
- To build these test binaries Meson has special target
  "meson-test-prereq". This target exists only in Meson >= 0.63.
- Ubuntu 22.04 has only Meson 0.61.2 so this target does not exist.

To counter this problem, we introduced BUILD_TEST_PREREQ variable in CI
to explicitly build "meson-test-prereq" target in the "build" phase only
inside images with new-enough Meson versions. This worked, but it forced
us to keep track of Meson versions on various
distros and update the variable accordingly.

This commit inverts the logic so we build the special target by default
(in the build phase) and skip building it only if Meson version is too
old. So once we drop the old image, the variable (or rather it's usage)
will be gone and we don't need to touch it for newer images.

We have also considered installing newer Meson into the test image, but
decided to keep the old version around so we can test minimal Meson
version specified in meson.build file.