]> git.ipfire.org Git - thirdparty/bind9.git/log
thirdparty/bind9.git
3 hours agofix: dev: Fix stdc_count_zeros/stdc_count_ones polyfill mismatch main
Alessio Podda [Tue, 2 Jun 2026 09:01:21 +0000 (09:01 +0000)] 
fix: dev: Fix stdc_count_zeros/stdc_count_ones polyfill mismatch

A previous commit introduced a latent bug where the wrong popcount
definition was used when overriding the compilation mode to C23.
This MR fixes it.

Closes #6055

Merge branch '6055-qp-polyfill-fix' into 'main'

See merge request isc-projects/bind9!12165

3 hours agoFix stdc_count_zeros/stdc_count_ones polyfill mismatch 12165/head
Alessio Podda [Fri, 17 Apr 2026 09:42:53 +0000 (11:42 +0200)] 
Fix stdc_count_zeros/stdc_count_ones polyfill mismatch

A previous commit introduced a latent bug where the wrong popcount
definition was used when overriding the compilation mode to C23.
This commit fixes it.

15 hours agofix: ci: Disable dnstap in reproducible-build CI job
Michal Nowak [Mon, 1 Jun 2026 20:56:50 +0000 (22:56 +0200)] 
fix: ci: Disable dnstap in reproducible-build CI job

Commit 515ff3763c ("Simplify reproducible-build CI job") dropped the
-Ddnstap=disabled option from the "meson reprotest" invocation, which
re-introduced a known reproducibility failure:

    Build differences detected
    File contents differ: buildrepro/libdnstap.a

The job builds with CFLAGS=${CFLAGS_COMMON}, which enables LTO with
-ffat-lto-objects. Fat LTO objects embed GIMPLE bytecode keyed by a
per-compilation random LTO hash, so they are not reproducible run to
run. libdnstap.a is the only static archive in the build, and meson
treats every .a as a final, checked artifact, so the two reprotest
builds disagree on its contents. The shared libraries are unaffected
because final LTO linking re-emits and strips the bytecode.

Restore the -Ddnstap=disabled workaround, along with a comment
explaining the instability. The unrelated -Ddoc=disabled and
-Doptimization=1 options are left dropped, as they were only build-time
speedups and not related to reproducibility.

Assisted-by: Claude:claude-opus-4-8
Merge branch 'mnowak/reprotest-disable-dnstap-lto' into 'main'

See merge request isc-projects/bind9!12161

15 hours agoDisable dnstap in reproducible-build CI job 12161/head
Michal Nowak [Mon, 1 Jun 2026 20:38:50 +0000 (20:38 +0000)] 
Disable dnstap in reproducible-build CI job

Commit 515ff3763c ("Simplify reproducible-build CI job") dropped the
-Ddnstap=disabled option from the "meson reprotest" invocation, which
re-introduced a known reproducibility failure:

    Build differences detected
    File contents differ: buildrepro/libdnstap.a

The job builds with CFLAGS=${CFLAGS_COMMON}, which enables LTO with
-ffat-lto-objects. Fat LTO objects embed GIMPLE bytecode keyed by a
per-compilation random LTO hash, so they are not reproducible run to
run. libdnstap.a is the only static archive in the build, and meson
treats every .a as a final, checked artifact, so the two reprotest
builds disagree on its contents. The shared libraries are unaffected
because final LTO linking re-emits and strips the bytecode.

Restore the -Ddnstap=disabled workaround, along with a comment
explaining the instability. The unrelated -Ddoc=disabled and
-Doptimization=1 options are left dropped, as they were only build-time
speedups and not related to reproducibility.

Assisted-by: Claude:claude-opus-4-8
18 hours agochg: ci: Simplify reproducible-build CI job
Michal Nowak [Mon, 1 Jun 2026 17:44:55 +0000 (19:44 +0200)] 
chg: ci: Simplify reproducible-build CI job

Drop explicit -D options from meson reprotest invocation
and let it use project defaults.

Assisted-by: Claude:claude-opus-4-7
Merge branch 'mnowak/simplify-reproducible-build-ci' into 'main'

See merge request isc-projects/bind9!12095

18 hours agoSimplify reproducible-build CI job 12095/head
Michal Nowak [Mon, 25 May 2026 18:56:46 +0000 (18:56 +0000)] 
Simplify reproducible-build CI job

Drop explicit -D options from meson reprotest invocation
and let it use project defaults.

Assisted-by: Claude:claude-opus-4-7
18 hours agofix: test: Fix nzd2nzf system test always being skipped
Michal Nowak [Mon, 1 Jun 2026 17:38:19 +0000 (19:38 +0200)] 
fix: test: Fix nzd2nzf system test always being skipped

Merge branch 'mnowak/fix-system-test-skips' into 'main'

See merge request isc-projects/bind9!12087

18 hours agoRemove redundant Python 3.7 skip markers from system tests 12087/head
Michal Nowak [Sun, 24 May 2026 18:29:55 +0000 (18:29 +0000)] 
Remove redundant Python 3.7 skip markers from system tests

The test framework already requires Python 3.10+ (conftest.py raises
RuntimeError if version < 3.10), so skipif(sys.version_info < (3, 7))
can never trigger. Remove the dead markers and now-unused sys imports.

Assisted-by: Claude:claude-opus-4-7
18 hours agoFix nzd2nzf test always being skipped
Michal Nowak [Mon, 25 May 2026 13:00:43 +0000 (13:00 +0000)] 
Fix nzd2nzf test always being skipped

When LMDB was made a required dependency (929eccdfdc), the "LMDB" entry
was removed from features.py and the --with-lmdb flag was removed from
feature-test.c.  However, the with_lmdb skip marker in mark.py and its
usage in nzd2nzf were not cleaned up. Since FEATURE_LMDB was no longer
being set, the skip condition became permanently true, silently skipping
the test on every run.

Remove the dead skip marker and update other stale references that still
described LMDB as optional (build docs, addzone test comments).

Assisted-by: Claude:claude-opus-4-7
19 hours agofix: test: Increase ans5 NS response delay in rpzrecurse test
Michal Nowak [Mon, 1 Jun 2026 16:36:34 +0000 (18:36 +0200)] 
fix: test: Increase ans5 NS response delay in rpzrecurse test

Merge branch 'mnowak/fix-rpzrecurse-timing' into 'main'

See merge request isc-projects/bind9!12122

20 hours agoIncrease ans5 NS response delay in rpzrecurse test 12122/head
Michal Nowak [Wed, 27 May 2026 21:25:27 +0000 (21:25 +0000)] 
Increase ans5 NS response delay in rpzrecurse test

The nsip-wait-recurse and nsdname-wait-recurse timing tests
compare query times with wait-recurse yes vs no. With a
1-second NS response delay in ans5, the timing difference is
too small to reliably measure with whole-second granularity,
causing intermittent failures when both cases round to the
same integer.

Increase the delay from 1 to 3 seconds and add explicit dig
timeout options (+time=30 +tries=1) so that dig does not time
out or retry during the slow wait-recurse yes queries.

Assisted-by: Claude:claude-opus-4-7
21 hours agofix: doc: Fix spelling typos in comments and code
Michal Nowak [Mon, 1 Jun 2026 14:59:32 +0000 (16:59 +0200)] 
fix: doc: Fix spelling typos in comments and code

Merge branch 'mnowak/fix-spelling-typos' into 'main'

See merge request isc-projects/bind9!12089

21 hours agoFix spelling typos in comments and code 12089/head
Michal Nowak [Sun, 24 May 2026 07:00:21 +0000 (07:00 +0000)] 
Fix spelling typos in comments and code

Assisted-by: Mistral Vibe:mistral-medium-3.5
Assisted-by: Claude:claude-opus-4-7
21 hours agofix: dev: Fix wrong variable in named_server_sync() log message
Michal Nowak [Mon, 1 Jun 2026 14:50:50 +0000 (16:50 +0200)] 
fix: dev: Fix wrong variable in named_server_sync() log message

named_server_sync() logged isc_result_totext(result) but returns
tresult. The loop accumulates errors into tresult, so result only
holds the last iteration's value. If the last view succeeded but an
earlier one failed, the log would incorrectly say "success".

Merge branch 'mnowak/fix-server-sync-log' into 'main'

See merge request isc-projects/bind9!12090

22 hours agoFix wrong variable in named_server_sync() log message 12090/head
Michal Nowak [Mon, 25 May 2026 06:52:31 +0000 (06:52 +0000)] 
Fix wrong variable in named_server_sync() log message

named_server_sync() logged isc_result_totext(result) but returns
tresult. The loop accumulates errors into tresult, so result only
holds the last iteration's value. If the last view succeeded but an
earlier one failed, the log would incorrectly say "success".

Assisted-by: Claude:claude-opus-4-7
22 hours agofix: test: Increase timeout for reload-based kasp signing checks
Michal Nowak [Mon, 1 Jun 2026 13:59:18 +0000 (15:59 +0200)] 
fix: test: Increase timeout for reload-based kasp signing checks

```
______________________________ test_kasp_default _______________________________
[gw0] freebsd15 -- Python 3.11.15 /usr/local/bin/python3.11
/home/ec2-user/builds/isc-private/bind9/bin/tests/system/kasp/tests_kasp.py:910: in test_kasp_default
    isctest.run.retry_with_timeout(update_is_signed, timeout=5)
/home/ec2-user/builds/isc-private/bind9/bin/tests/system/isctest/run.py:164: in retry_with_timeout
    assert False, msg
E   AssertionError: tests_kasp.test_kasp_default.<locals>.update_is_signed() timed out after 5 s
E   assert False
```

Merge branch 'mnowak/kasp-default-update-is-signed-timeout' into 'main'

See merge request isc-projects/bind9!12151

22 hours agoIncrease timeout for reload-based kasp signing checks 12151/head
Michal Nowak [Mon, 1 Jun 2026 12:30:23 +0000 (12:30 +0000)] 
Increase timeout for reload-based kasp signing checks

After reloading an inline-signed zone from file, named must re-read it,
detect the deltas and generate RRSIGs before the answer is signed, which
can take longer than 5 seconds on a loaded CI host and cause spurious
update_is_signed() timeouts. Bump these reload-based checks to 10
seconds, matching cb_ixfr_is_signed.

Assisted-by: Claude:claude-opus-4-8
22 hours agofix: test: Bump edns-expire refresh timeout to 30 seconds
Michal Nowak [Mon, 1 Jun 2026 13:56:36 +0000 (15:56 +0200)] 
fix: test: Bump edns-expire refresh timeout to 30 seconds

Rarely, RNDC fails to refresh the zone on FreeBSD in the default 10
seconds, causing test_edns_expire_refresh to fail with a TimeoutExpired
on the "rndc refresh edns-expire." call.  Give it more time, the same
way the reconfigure timeout was bumped in
test_reconfiguration_when_zone_transfer_is_in_the_middle_of_soa_query.

Assisted-by: Claude:claude-opus-4-8
Merge branch 'mnowak/bump-edns-expire-refresh-rndc-timeout' into 'main'

See merge request isc-projects/bind9!12152

23 hours agoBump edns-expire refresh timeout to 30 seconds 12152/head
Michal Nowak [Mon, 1 Jun 2026 12:33:59 +0000 (12:33 +0000)] 
Bump edns-expire refresh timeout to 30 seconds

Rarely, RNDC fails to refresh the zone on FreeBSD in the default 10
seconds, causing test_edns_expire_refresh to fail with a TimeoutExpired
on the "rndc refresh edns-expire." call.  Give it more time, the same
way the reconfigure timeout was bumped in
test_reconfiguration_when_zone_transfer_is_in_the_middle_of_soa_query.

Assisted-by: Claude:claude-opus-4-8
24 hours agofix: test: Avoid rndc loadkeys race in checkds system test
Nicki Křížek [Mon, 1 Jun 2026 11:33:50 +0000 (13:33 +0200)] 
fix: test: Avoid rndc loadkeys race in checkds system test

Address a `checkds` test race condition.

Example failure:

```
________________ test_checkds[incomplete.yes.dspublish.ns2-4-5] ________________
[gw3] linux -- Python 3.13.5 /usr/bin/python3
/builds/isc-projects/bind9/bin/tests/system/checkds/tests_checkds.py:451: in test_checkds
    keystate_check(ns2, params.zone, params.expected_parent_state)
/builds/isc-projects/bind9/bin/tests/system/checkds/tests_checkds.py:183: in keystate_check
    assert val == 0
E   AssertionError: assert '20260528103555 (Thu May 28 10:35:55 2026)' == 0
```

https://gitlab.isc.org/isc-projects/bind9/-/jobs/7497509

Merge branch 'nicki/fix-checkds-loadkeys-race' into 'main'

See merge request isc-projects/bind9!12138

28 hours agoAvoid rndc loadkeys race in checkds system test 12138/head
Nicki Křížek [Thu, 28 May 2026 16:13:20 +0000 (16:13 +0000)] 
Avoid rndc loadkeys race in checkds system test

The wait loop in test_checkds() called "rndc loadkeys" once per
second while polling ns9.log for expected parental-agent response
lines. Under load (notably the rbt CI job), responses to one query
batch could land after a subsequent loadkeys had already reset the
per-key DSPUBCOUNT counter in lib/dns/zone.c without cancelling the
in-flight requests. Stragglers from the earlier round then bumped the
new round's counter to parentalscnt and BIND finalized DSPublish for
zones where one parental-agent legitimately serves no DS, spuriously
failing the !DSPublish keystate assertion.

Trigger at most one loadkeys per test case and wait passively via
watch_log_from_start() / wait_for_all().  Watching from the start
of the log preserves the original implicit semantics for zones
whose DS state was already finalized by BIND's automatic checkds
polling at zone-load time -- the expected lines are already
present and the watcher returns immediately.

Assisted-by: Claude:claude-opus-4-7
3 days agochg: dev: Consolidate the validator's DS fetches into one helper
Ondřej Surý [Sat, 30 May 2026 03:59:42 +0000 (05:59 +0200)] 
chg: dev: Consolidate the validator's DS fetches into one helper

Internal cleanup with no change in resolution behaviour. The DNSSEC
validator started DS record lookups from three separate places, each
set up slightly differently; they now go through a single helper.

Merge branch 'ondrej/validator-ds-fetch-zonecut' into 'main'

See merge request isc-projects/bind9!12144

3 days agoFunnel the validator's DS fetches through a single helper 12144/head
Ondřej Surý [Fri, 29 May 2026 10:10:29 +0000 (12:10 +0200)] 
Funnel the validator's DS fetches through a single helper

The validator starts a DS fetch from three places while building or
proving a trust chain.  Only validate_dnskey() handed the resolver the
parent zone cut as a delegation hint; the other two started the fetch
with no hint at all.

Factor the shared setup into create_ds_fetch() and route all three
through it, so every validator DS fetch is created identically and
carries the parent zone cut.  DS is an at-parent type, so the resolver
already anchors such a query at the parent on its own; supplying the
zone cut explicitly also lets the resolver's fetch loop detection match
the fetch by domain, which it cannot do for a fetch with no hint.

Assisted-by: Claude:claude-opus-4-8
3 days agochg: usr: Fix a resolver stall on a CNAME response to a DS query
Ondřej Surý [Fri, 29 May 2026 20:34:46 +0000 (22:34 +0200)] 
chg: usr: Fix a resolver stall on a CNAME response to a DS query

A validating resolver could stall for about twelve seconds and then return
SERVFAIL when an authoritative server answered a DS query with a CNAME. Such
responses are now rejected promptly, so the query fails fast instead of
hanging.

Closes #5878

Merge branch '5878-reject-cname-at-dnssec-types' into 'main'

See merge request isc-projects/bind9!11867

3 days agoAdd a system test for CNAME answers to DNSSEC meta-type queries 11867/head
Ondřej Surý [Fri, 29 May 2026 09:32:52 +0000 (11:32 +0200)] 
Add a system test for CNAME answers to DNSSEC meta-type queries

Two authoritative zones drive the cases. 'example.' answers DNSKEY,
NSEC, NSEC3 and RRSIG queries with a CNAME: a direct recursive query for
one of these must not crash the resolver, and the validator's own DNSKEY
fetch for a signed name must fail as a broken trust chain and return
SERVFAIL promptly.

'secure.' is served faithfully but answers DS queries with an unsigned
CNAME -- the input that drove the validator's insecurity proof into a
self-join.  The resolver must return SERVFAIL within a couple of seconds
instead of stalling for twelve.

Assisted-by: Claude:claude-opus-4-8
3 days agoFail promptly on an RRSIG answer with no usable record
Ondřej Surý [Fri, 29 May 2026 15:43:54 +0000 (17:43 +0200)] 
Fail promptly on an RRSIG answer with no usable record

A query for an RRSIG is handled as a subset of ANY, so rctx_answer_any()
filters out records that do not match the queried type. When every
record was filtered out (an answer carrying only unrelated types), the
function still returned success with nothing cached, and the fetch then
waited for a validator that was never started until the backstop fetch
timer fired ~12s later. Treat an all-filtered answer as a broken
response, matching how non-meta types already reject a reply with no
usable record.

3 days agoDetect non-advancing alias chains in the validator
Ondřej Surý [Fri, 29 May 2026 09:32:44 +0000 (11:32 +0200)] 
Detect non-advancing alias chains in the validator

The resolver turned a CNAME response to an RRSIG or NSEC query into
FORMERR inside rctx_answer_cname().  That is redundant -- every caller
already copes with a DNS_R_CNAME or DNS_R_DNAME result -- and it is the
wrong layer, because the resolver cannot tell a legitimate alias from a
broken one.  Drop it; a CNAME for one of these types now flows back as
an ordinary alias.

The case that must be stopped lives in the validator.  While proving an
unsigned CNAME insecure, proveunsecure() fetches the DS for the CNAME's
own name; because fetches are shared, that fetch re-enters and stalls on
the in-flight fetch the validator is waiting for, deadlocking for about
twelve seconds (GL#5878).  Unlike the resolver, the validator knows it
is validating an alias, so check_chaining() now aborts a fetch whose
name matches the chaining rdataset's owner: it cannot advance the chain
and would only self-join.

3 days agofix: dev: Refine resolver fetch loop detection
Ondřej Surý [Fri, 29 May 2026 19:25:39 +0000 (21:25 +0200)] 
fix: dev: Refine resolver fetch loop detection

The resolver's fetch loop detection now triggers only when a new
fetch would join an already in-flight fetch that is also one of
its own ancestors, which is the actual loop condition.  Previously
the check ran against the original request before the fetch was
set up.

Merge branch 'ondrej/improve-resolver-loop-detection' into 'main'

See merge request isc-projects/bind9!12145

3 days agoDetect resolver fetch loops only when joining an in-flight fetch 12145/head
Ondřej Surý [Fri, 29 May 2026 14:36:45 +0000 (16:36 +0200)] 
Detect resolver fetch loops only when joining an in-flight fetch

dns_resolver_createfetch() guarded against fetch loops by comparing the
raw request name/type/domain before any fetch context existed. Move the
check after the context is obtained and run it against the context
itself, and only when we joined an already in-flight context
(!new_fctx) that is also an ancestor in the parent chain. That is the
real loop condition: the new fetch would block waiting on a fetch that
is itself waiting on us. A newly created context waits on nothing, so it
proceeds, bounded by the fetch depth limit and the complementary ADB
loop detection.

4 days agofix: dev: Bound memory use during incoming zone transfers
Alessio Podda [Fri, 29 May 2026 08:43:51 +0000 (08:43 +0000)] 
fix: dev: Bound memory use during incoming zone transfers

During an incoming zone transfer, an optimization could let
the batch of pending records grow without bound for a large
zone, raising memory usage. It gave no measurable performance
benefit, so it has been removed.

Closes #5958

Merge branch '5958-no-name-boundary' into 'main'

See merge request isc-projects/bind9!12141

4 days agoRemove name boundary optimization 12141/head
Alessio Podda [Fri, 22 May 2026 15:58:10 +0000 (17:58 +0200)] 
Remove name boundary optimization

In MR !9740, we introduced an optimization that reduces memory usage
by processing rdatas in batches during AXFR.

The maximum batch size is 128, but the batch size was allowed to grow
beyond that limit if all rdatas in a batch were for the same name, as
that allows a more efficient optimization.

This optimization could theoretically allow the batch size arbitrarily
for a sufficient large zone transfer. Since synthetic tests don't show
any performance improvement from the optimization, this MR removes it.

4 days agofix: dev: Configure zone ACLs from templates
Matthijs Mekking [Fri, 29 May 2026 06:55:07 +0000 (06:55 +0000)] 
fix: dev: Configure zone ACLs from templates

ACLs from templates should be configured in between the zone and view tier.

Closes #6023
Closes #6040

Merge branch '6040-zone-ignores-template-acl' into 'main'

See merge request isc-projects/bind9!12132

4 days agoWhen configuring zone ACL, check template too 12132/head
Matthijs Mekking [Thu, 28 May 2026 13:13:26 +0000 (15:13 +0200)] 
When configuring zone ACL, check template too

When zone templates were introduced, we forgot to add parsing ACL
from templates in 'configure_zone_acl()'. This commit fixes the
omission.

4 days agoTest ACL from template
Matthijs Mekking [Thu, 28 May 2026 13:06:50 +0000 (15:06 +0200)] 
Test ACL from template

Add an acl system test case where the ACL comes from a template. It
should override the ACL from the options.

4 days agofix: test: Fix pytest-xdist loadscope splitting on "::" in params
Michal Nowak [Thu, 28 May 2026 16:01:39 +0000 (18:01 +0200)] 
fix: test: Fix pytest-xdist loadscope splitting on "::" in params

LoadScopeScheduling._split_scope() uses rsplit("::", 1) to
extract the test file scope from a node ID.  When parametrized
test values contain "::" (IPv6 addresses like "cafe:cafe::cafe"
or "::1"), the split lands inside the parameter instead of at
the .py:: boundary.  This creates spurious scopes that get
assigned to different workers, each triggering a full fixture
setup (starting named instances).

Override _split_scope() in conftest.py to split on ".py::"
which is unambiguous.

Six tests in synthrecord/tests_synthrecord.py are affected.
A verification script is included in util/.

Assisted-by: Claude:claude-opus-4-7
Merge branch 'mnowak/fix-xdist-loadscope-split' into 'main'

See merge request isc-projects/bind9!12103

4 days agoFix pytest-xdist loadscope splitting on "::" in params 12103/head
Michal Nowak [Tue, 26 May 2026 16:09:21 +0000 (16:09 +0000)] 
Fix pytest-xdist loadscope splitting on "::" in params

LoadScopeScheduling._split_scope() uses rsplit("::", 1) to
extract the test file scope from a node ID.  When parametrized
test values contain "::" (IPv6 addresses like "cafe:cafe::cafe"
or "::1"), the split lands inside the parameter instead of at
the .py:: boundary.  This creates spurious scopes that get
assigned to different workers, each triggering a full fixture
setup (starting named instances).

Override _split_scope() in conftest.py to split on ".py::"
which is unambiguous.

Six tests in synthrecord/tests_synthrecord.py are affected.
A verification script is included in util/.

Assisted-by: Claude:claude-opus-4-7
4 days agofix: ci: Make cross-version-config-tests allow_failure: true
Michal Nowak [Thu, 28 May 2026 15:59:30 +0000 (17:59 +0200)] 
fix: ci: Make cross-version-config-tests allow_failure: true

The issue #6007 failed to mark cross-version-config-tests with
allow_failure: true. This should be reverted when the June release is
out.

Closes #6007

Merge branch '6007-allow-failure-cross-version-config-tests' into 'main'

See merge request isc-projects/bind9!12136

4 days agoMake cross-version-config-tests allow_failure: true 12136/head
Michal Nowak [Thu, 28 May 2026 15:49:22 +0000 (17:49 +0200)] 
Make cross-version-config-tests allow_failure: true

The issue #6007 failed to mark cross-version-config-tests with
allow_failure: true. This should be reverted when the June release is
out.

4 days agochg: test: Prioritize the 10 slowest system test scopes
Michal Nowak [Thu, 28 May 2026 14:54:58 +0000 (16:54 +0200)] 
chg: test: Prioritize the 10 slowest system test scopes

Update PRIORITY_TESTS with the 10 longest-running test
scopes measured from CI (job 7468217).  These get scheduled
first so that with --dist=loadscope they land on separate
workers instead of piling up at the end.

Also fix "serve-stale/" to "serve_stale/" to match the
actual directory name, and add a startup check that fails
if any PRIORITY_TESTS entry does not match an existing
directory.

Assisted-by: Claude:claude-opus-4-7
Merge branch 'mnowak/prioritize-slow-system-tests' into 'main'

See merge request isc-projects/bind9!12104

4 days agoPrioritize the 10 slowest system test scopes 12104/head
Michal Nowak [Tue, 26 May 2026 16:40:13 +0000 (16:40 +0000)] 
Prioritize the 10 slowest system test scopes

Update PRIORITY_TESTS with the 10 longest-running test
scopes measured from CI (job 7468217).  These get scheduled
first so that with --dist=loadscope they land on separate
workers instead of piling up at the end.

Also fix "serve-stale/" to "serve_stale/" to match the
actual directory name, and add a startup check that fails
if any PRIORITY_TESTS entry does not match an existing
directory.

Assisted-by: Claude:claude-opus-4-7
4 days agofix: dev: Check options in templates that must be non-zero
Matthijs Mekking [Thu, 28 May 2026 14:26:03 +0000 (14:26 +0000)] 
fix: dev: Check options in templates that must be non-zero

`named-checkconf` should reject a template that has options that must be non-zero
(`max-refresh-time`, `max-retry-time`, `min-refresh-time`, `min-retry-time`).

`rndc addzone` with a zone that refers to such template should fail cleanly.

Closes #6041

Merge branch '6041-check-nonzero-skips-templates' into 'main'

See merge request isc-projects/bind9!12126

4 days agoCheck options in templates that must be non-zero 12126/head
Matthijs Mekking [Thu, 28 May 2026 09:51:04 +0000 (11:51 +0200)] 
Check options in templates that must be non-zero

Without this, named-checkconf falsely accepts badly configured zones,
and rndc addzone would abort on adding a zone referring to such
templates.

4 days agoTest checkconf and addzone with bad templates
Matthijs Mekking [Thu, 28 May 2026 09:46:39 +0000 (11:46 +0200)] 
Test checkconf and addzone with bad templates

named-checkconf should reject a template that has options that must be
non-zero (max-refresh-time, max-retry-time, min-refresh-time,
min-retry-time).

rndc addzone with a zone that refers to such template should fail
cleanly.

4 days agofix: ci: Drop ccache support from CI
Michal Nowak [Thu, 28 May 2026 12:21:39 +0000 (14:21 +0200)] 
fix: ci: Drop ccache support from CI

The population of the compile cache is so slow, that a BIND 9 build can
take 20 minutes.

Assisted-by: Claude:claude-opus-4-7
Merge branch 'mnowak/drop-ccache-support' into 'main'

See merge request isc-projects/bind9!12127

4 days agoDrop ccache support from CI 12127/head
Michal Nowak [Thu, 28 May 2026 10:24:14 +0000 (12:24 +0200)] 
Drop ccache support from CI

The population of the compile cache is so slow, that a BIND 9 build can
take 20 minutes.

Assisted-by: Claude:claude-opus-4-7
5 days agofix: usr: Restore delegdb size after `rndc flush`
Colin Vidal [Thu, 28 May 2026 11:59:46 +0000 (13:59 +0200)] 
fix: usr: Restore delegdb size after `rndc flush`

When the delegation database was flushed using `rndc flush`, its size was also reset but not restored. As a result, after `rndc flush` was used at least once, the delegation database size could grow unbounded. This has now been fixed.

Merge branch 'colin/delegdb-config' into 'main'

See merge request isc-projects/bind9!12101

5 days agoAdd system test for delegdb size preservation across `rndc flush` 12101/head
Colin Vidal [Wed, 27 May 2026 08:50:42 +0000 (10:50 +0200)] 
Add system test for delegdb size preservation across `rndc flush`

Test that flushing the delegdb via `rndc flush` preserves its
configured size limit.  The test checks delegdb watermarks after
`named` startup, flushes caches, and verifies that the delegdb
watermarks are correctly restored afterwards.

To distinguish between the previous `delegdb` memory contexts and the
new ones, we need to know exactly when the previous `delegdb` memory
contexts are removed (this is not immediate, since those are removed
during RCU reclamation phase). A trace is therefore added when a memory
context is destroyed, if `ISC_MEM_DEBUGTRACE` is set.

5 days agoFix delegdb flush API
Colin Vidal [Tue, 26 May 2026 16:13:44 +0000 (18:13 +0200)] 
Fix delegdb flush API

The `rndc flush` command flushes the delegdb by deleting the
existing database and creating a new one. In the process, the
delegdb was losing its configured size limit; as a result, once
flushed, the delegdb size became unbounded.

This is now fixed by using `dns_delegdb_getconfig()` to back up the
current configuration before instantiating a new delegdb, then
restoring it with `dns_delegdb_setconfig()`.

5 days agoAdd delegdb configuration struct
Colin Vidal [Tue, 26 May 2026 16:11:12 +0000 (18:11 +0200)] 
Add delegdb configuration struct

Instead of having independent APIs to configure various aspects of the
delegdb (i.e. cache size, other settings that may come up later), a
single configuration struct is passed to `dns_delegdb_setconfig()`, which
internally does all the plumbing. To avoid relying on
atomics/synchronization, `dns_delegdb_setconfig()` must be called from
exclusive mode (for now).

The configuration can be retrieved at any time (not necessarily from
exclusive mode) using `dns_delegdb_getconfig()`. This is useful, for
instance, to flush the delegdb without losing its parameters.

5 days agorem: usr: Remove legacy special handling for SIG, NXT, and KEY records
Ondřej Surý [Thu, 28 May 2026 11:21:07 +0000 (13:21 +0200)] 
rem: usr: Remove legacy special handling for SIG, NXT, and KEY records

BIND no longer applies legacy RFC 2535 handling to the obsolete ``SIG``, ``NXT``
and ``KEY`` record types; they are now served as plain zone data. Zones with
both a ``CNAME`` and a ``KEY`` and or ``NXT`` at the same name — invalid under
:rfc:`2181` — will now fail to load and must be corrected.

Closes #6007

Merge branch '6007-remove-SIG-and-NXT-special-handling' into 'main'

See merge request isc-projects/bind9!12056

5 days agoDrop RFC 2535 special-casing of the KEY record type 12056/head
Ondřej Surý [Tue, 19 May 2026 13:58:54 +0000 (15:58 +0200)] 
Drop RFC 2535 special-casing of the KEY record type

After SIG and NXT lost their special handling, KEY remained the only
RFC 2535-era type still receiving coexistence allowances: KEY
alongside CNAME at the same owner, KEY answered from the parent side
of a zone cut, KEY kept across CNAME eviction in the cache.  RFC 3755
retains type 25 only for SIG(0) and TKEY transaction signatures, and
neither relies on those allowances in practice.  The in-tree comment
that flagged the RFC 3007 parent-side carve-out as "unclear" predicted
this cleanup.

Zones that publish CNAME and KEY at the same owner — already invalid
under RFC 2181 — now fail to load.  System test fixtures are updated
accordingly, and a new test asserts that SIG, NXT, and KEY records
pick up covering RRSIGs when their zone is signed.

5 days agoStop treating SIG and NXT records specially
Ondřej Surý [Tue, 19 May 2026 13:38:28 +0000 (15:38 +0200)] 
Stop treating SIG and NXT records specially

RFC 3755 retired SIG and NXT in favour of RRSIG and NSEC.  BIND still
warned about them at zone load, refused them in dynamic updates,
parsed SIG with a non-zero "type covered" field as a signature on an
RRset, and tracked them via dns_rdatatype_issig().  Those carve-outs
were the sole path that made the GL#5818 crash class reachable.

Treat both types as ordinary unknown rdata: they load, transfer, sign
and answer like any other record, and dynamic updates carry them
through the generic path.  SIG(0) is unaffected; its message-parsing
carve-out is preserved.

5 days agonew: test: Add isctest.mark.with_developer pytest mark
Nicki Křížek [Thu, 28 May 2026 09:37:56 +0000 (11:37 +0200)] 
new: test: Add isctest.mark.with_developer pytest mark

Merge branch 'nicki/systest-with-developer' into 'main'

See merge request isc-projects/bind9!12118

5 days agoAdd isctest.mark.with_developer pytest mark 12118/head
Nicki Křížek [Wed, 27 May 2026 15:28:07 +0000 (15:28 +0000)] 
Add isctest.mark.with_developer pytest mark

Tests that exercise instrumentation, log output, or other behaviour
that only exists in developer builds (the gcc:almalinux9:amd64 CI job
sets -Ddeveloper=disabled to guard against such accidental coupling)
can now decorate themselves with isctest.mark.with_developer to skip on
non-developer builds.

Assisted-by: Claude:claude-opus-4-7
5 days agoAdd FEATURE_DEVELOPER variable to isctest
Nicki Křížek [Wed, 27 May 2026 15:27:17 +0000 (15:27 +0000)] 
Add FEATURE_DEVELOPER variable to isctest

System tests can check FEATURE_DEVELOPER in the environment, but the
recommended pattern is the with_developer pytest marker added next.

Assisted-by: Claude:claude-opus-4-7
5 days agoAdd --enable-developer probe to feature-test
Nicki Křížek [Wed, 27 May 2026 15:26:47 +0000 (15:26 +0000)] 
Add --enable-developer probe to feature-test

System tests that depend on log output, instrumentation, or other
behaviour only present in developer builds can use this probe to detect
the build configuration at runtime.

Assisted-by: Claude:claude-opus-4-7
5 days agoDefine DEVELOPER_MODE in developer-mode builds
Nicki Křížek [Wed, 27 May 2026 15:26:15 +0000 (15:26 +0000)] 
Define DEVELOPER_MODE in developer-mode builds

So that build-time consumers (e.g. feature-test) can detect developer
mode through a single dedicated symbol rather than proxying through
implementation-detail defines like ISC_MEM_TRACKLINES.

Assisted-by: Claude:claude-opus-4-7
5 days agofix: usr: Fix nxdomain-redirect combined with dns64
Ondřej Surý [Thu, 28 May 2026 09:11:57 +0000 (11:11 +0200)] 
fix: usr: Fix nxdomain-redirect combined with dns64

When a resolver was configured with both `nxdomain-redirect` and `dns64`
in the same view, an AAAA query for a nonexistent name could abort
`named`. The combination failed whenever the redirect zone held A
records but no AAAA records.  The server now serves the empty AAAA
response from the redirect zone as-is, instead of attempting DNS64
synthesis on top of it.

Closes #5789

Merge branch '5789-fix-nxdomain-redirect-dns64-assert' into 'main'

See merge request isc-projects/bind9!12059

5 days agoSkip DNS64 synthesis when answering a redirected response 12059/head
Ondřej Surý [Wed, 20 May 2026 16:28:15 +0000 (18:28 +0200)] 
Skip DNS64 synthesis when answering a redirected response

redirect2() swaps qctx->db to the redirect zone before
query_nodata() runs. The DNS64 fallback there issues an A lookup
for the original query name, which is out of zone for the
redirect db, and the resulting query_notfound() trips
INSIST(!is_zone). The cached NCACHENXRRSET variant trips a
REQUIRE in dns_rdataset_first() on a disassociated rdataset.
The synth-from-dnssec entry reaches the same fallback via
query_coveringnsec(). Guarding the fallback with
!qctx->redirected leaves the nxdomain-redirect NXRRSET answer to
be served as-is.

5 days agoSystem test for nxdomain-redirect combined with dns64
Ondřej Surý [Wed, 20 May 2026 16:28:15 +0000 (18:28 +0200)] 
System test for nxdomain-redirect combined with dns64

An AAAA query for a non-existent name into a view that combines
nxdomain-redirect with dns64 used to abort named via the DNS64
fallback in query_nodata(). The new module exercises all three
documented entry paths into query_redirect(): the authoritative
NXDOMAIN path (ns7, tripping INSIST(!is_zone) in
query_notfound()), the recursive NCACHENXRRSET path (ns8,
tripping REQUIRE in dns_rdataset_first() on a disassociated
rdataset), and the synth-from-dnssec path (ns10 validating
against ns9's signed root, with a primer A query so the second
AAAA reaches query_redirect() via query_coveringnsec()). ns9
serves as a neutral upstream so the cached and synthesized
negatives land real NXRRSETs.

Assisted-by: Claude:claude-opus-4-7
5 days agorem: dev: Remove useless PR-Agent jobs
Ondřej Surý [Thu, 28 May 2026 07:50:56 +0000 (09:50 +0200)] 
rem: dev: Remove useless PR-Agent jobs

The experiment was a failure, the PR-Agent doesn't send a full context
to the AI Agents and the results are abysmal because of that.

Merge branch 'ondrej/remove-useless-pr-agent' into 'main'

See merge request isc-projects/bind9!12119

5 days agoRemove useless PR-Agent jobs 12119/head
Ondřej Surý [Thu, 28 May 2026 07:35:13 +0000 (09:35 +0200)] 
Remove useless PR-Agent jobs

The experiment was a failure, the PR-Agent doesn't send a full context
to the AI Agents and the results are abysmal because of that.

5 days agochg: test: Improve pytest jinja2 templates
Nicki Křížek [Wed, 27 May 2026 15:54:34 +0000 (17:54 +0200)] 
chg: test: Improve pytest jinja2 templates

- Enable rendering ns-specific data in jinja2 templates using the `ns` varible.
- Add common zone/config snippets an `_common` templates.
- Allow jinja2 imports from `_common`.
- Improve the `_common/controls.conf.j2` snippet to render ns-specific IP rather than hardocded one.

Merge branch 'nicki/pytest-template-improvements' into 'main'

See merge request isc-projects/bind9!11805

5 days agoRestrict cross-test jinja2 includes to _common/ 11805/head
Nicki Křížek [Wed, 20 May 2026 14:34:02 +0000 (14:34 +0000)] 
Restrict cross-test jinja2 includes to _common/

The previous loader was a FileSystemLoader rooted at $srcdir, which
allowed any system test to include any other test's templates -- a
wider scope than intended. Every existing cross-test include already
targets _common/, so make that the only path.

ChoiceLoader + PrefixLoader keeps the existing '_common/foo.j2' path
convention working without changes to call sites. The '_common/'
prefix is deliberately kept rather than dropping it by rooting the
FileSystemLoader at _common/ directly:

  - It signals at the include site that the file is a shared
    template, not a sibling of the current test; readers don't need
    to know the loader configuration to understand where the file
    lives.
  - It prevents shadowing: a test-local 'controls.conf.j2' would
    not collide with the shared one, and the unqualified name keeps
    its test-local meaning.
  - It makes the dependency greppable: 'grep -rl _common/'
    identifies every test that consumes shared snippets.

Assisted-by: Claude:claude-opus-4-7
5 days agoCreate common templates for test zones
Nicki Křížek [Fri, 20 Mar 2026 09:09:55 +0000 (10:09 +0100)] 
Create common templates for test zones

Add commonly used zone-related data (config snippet and zone file
snippets) as templates which can be reused by filling in different data.

Adjust the isctest.template.Zone to use filepath argument rather than
filename for clarity.

5 days agoInclude controls.conf as jinja2 template
Nicki Křížek [Wed, 1 Apr 2026 16:25:28 +0000 (18:25 +0200)] 
Include controls.conf as jinja2 template

Rather than using named.conf include, render the controls directly into
the config using jinja2 template include.

5 days agoAdd _common dir to jinja2 template loader
Nicki Křížek [Tue, 7 Apr 2026 12:43:11 +0000 (14:43 +0200)] 
Add _common dir to jinja2 template loader

This allows include of template snippets from _common/ directory.

5 days agoReduce whitespace in jinja2 templates
Nicki Křížek [Tue, 7 Apr 2026 12:40:33 +0000 (14:40 +0200)] 
Reduce whitespace in jinja2 templates

Omit extra newlines when combining and including templates.

Adjust the xfer/ns8/small.db.j2 so it doesn't trim the endline twice
(as that would join the two subsequent records on the same line).

5 days agoAllow instantiating template dataclasses in jinja2 templates
Nicki Křížek [Wed, 1 Apr 2026 17:42:38 +0000 (19:42 +0200)] 
Allow instantiating template dataclasses in jinja2 templates

In some cases, the template data might need to be set directly in the
jinja2 templates using `{% set %}`. Expose the template dataclasses to
the templates so we can use these existing classes, rather than creating
ad-hoc data containers.

5 days agoAdd a directory-specific nameserver data to templates
Nicki Křížek [Wed, 1 Apr 2026 15:10:08 +0000 (17:10 +0200)] 
Add a directory-specific nameserver data to templates

If a template is being rendered into a directory that represents a
nameserver (e.g. "ns1"), include a nameserver-specific information in
the data - variable called "ns" which has information about the
nameserver this file belongs to.

Ensure the "ns" variable is only exposed to the template when rendered,
without affecting the environment variables (always work with a copy of
the env_vars).

5 days agoImprove isctest.template dataclasses' defaults
Nicki Křížek [Wed, 1 Apr 2026 15:04:22 +0000 (17:04 +0200)] 
Improve isctest.template dataclasses' defaults

Extend the Nameserver to generate the default IPv4/IPv6 values, add NSX
values for the predefined nameservers (there are 11 of them, as per
bin/tests/system/ifconfig.sh.in max value). Add the missing ns11
fixture.

Extend the Zone to derive the zone filename by default, unless
specified.

Adjust the existing uses of these classes to utilize the simplified
defaults.

6 days agofix: usr: Fix crash on badly configured secondary signer
Matthijs Mekking [Wed, 27 May 2026 09:45:23 +0000 (09:45 +0000)] 
fix: usr: Fix crash on badly configured secondary signer

A badly configured secondary signer that was missing the 'file' entry caused the server to crash, rather than to reject the configuration. This has been fixed.

Closes #5993

Merge branch '5993-fix-bump-in-the-wire-crash' into 'main'

See merge request isc-projects/bind9!12045

6 days agoFix startup crash on bump in the wire signer 12045/head
Matthijs Mekking [Mon, 18 May 2026 13:15:39 +0000 (15:15 +0200)] 
Fix startup crash on bump in the wire signer

A secondary server that is configured as a bump in the wire signer
with inline-signing implicitly enabled via dnssec-policy requires
a 'file' entry.

6 days agoCheck conf dnssec-policy inline-signing secondary
Matthijs Mekking [Mon, 18 May 2026 13:13:38 +0000 (15:13 +0200)] 
Check conf dnssec-policy inline-signing secondary

Add a variant of checking configuration where inline-signing is
enabled on the secondary, requiring the 'file' entry. This time,
inline-signing is implicitly enabled via dnssec-policy.

6 days agofix: doc: Ignore gitlab.gnome.org links in Sphinx linkcheck
Michal Nowak [Wed, 27 May 2026 09:20:49 +0000 (11:20 +0200)] 
fix: doc: Ignore gitlab.gnome.org links in Sphinx linkcheck

Merge branch 'mnowak/linkcheck-fix' into 'main'

See merge request isc-projects/bind9!12109

6 days agoClean up OpenSSL/BoringSSL/LibreSSL reference URLs in changelog 12109/head
Michal Nowak [Wed, 27 May 2026 08:51:53 +0000 (10:51 +0200)] 
Clean up OpenSSL/BoringSSL/LibreSSL reference URLs in changelog

Drop the #Lxxx-Lyyy fragments (replaced with prose line numbers) and
unwrap the line-broken URLs so Sphinx linkcheck can validate them.

Assisted-by: Claude:claude-opus-4-7
6 days agoIgnore gitlab.gnome.org links in Sphinx linkcheck
Michal Nowak [Wed, 27 May 2026 08:51:46 +0000 (10:51 +0200)] 
Ignore gitlab.gnome.org links in Sphinx linkcheck

GNOME GitLab returns HTTP 406 to Sphinx's linkcheck requests, the
same behavior already worked around for gitlab.isc.org.

Assisted-by: Claude:claude-opus-4-7
6 days agochg: ci: Add rule for stable tags in CI and use it in the update-stable-tag job
Andoni Duarte [Wed, 27 May 2026 08:24:38 +0000 (08:24 +0000)] 
chg: ci: Add rule for stable tags in CI and use it in the update-stable-tag job

Add a rule to match open source stable tags in CI and apply it to the
update-stable-tag job.

Merge branch 'andoni/show-update-stable-tag-job-in-stable-versions' into 'main'

See merge request isc-projects/bind9!11646

6 days agoAdd rule for the stable tags in CI and use for job update-stable-tag 11646/head
Andoni Duarte Pintado [Mon, 9 Mar 2026 16:30:09 +0000 (17:30 +0100)] 
Add rule for the stable tags in CI and use for job update-stable-tag

The update-stable-tag job should only be run for the stable tag, which
is used by Read the Docs to build the docs for the "stable" version.

A new rule called rule_tag_open_source_stable is introduced, in order to
prevent the job from appearing in the pipeline for non-stable versions.
Having this rule in YAML is necessary, because if it were in the script
itself, the job would show up in the pipeline.

Besides, the new rule allows other jobs to be run only for the stable
tag in the future, without modifying their internal logic.

The CI variable STABLE_VERSION contains a regular expression in
Gitlab CI sense[1]: it uses the RE2 syntax[2] and must be enclosed by
slashes (i.e. /.../). It must be updated every time the minor version
is changed: releasing v9.22 will require changing STABLE_VERSION from
"/v9.20/" to "/v9.22/".

The variable is imported from common Gitlab CI YAML in the project
isc-projects/bind9-qa, so as to maintain it in a central place.

[1]: https://docs.gitlab.com/ci/jobs/job_rules/#compare-a-variable-to-a-regular-expression
[2]: https://github.com/google/re2/wiki/Syntax

6 days agoInclude common Gitlab CI YAML from isc-projects/bind9-qa
Andoni Duarte Pintado [Fri, 22 May 2026 15:38:40 +0000 (17:38 +0200)] 
Include common Gitlab CI YAML from isc-projects/bind9-qa

The template file .gitlab-ci-common.yml is to be used across ISC
projects, while it is maintained in the isc-projects/bind9-qa project.

6 days agochg: test: Move requirement checks to `pytest_configure` hook
Štěpán Balážik [Tue, 26 May 2026 17:04:05 +0000 (17:04 +0000)] 
chg: test: Move requirement checks to `pytest_configure` hook

This leads to nicer logging if requirements aren't met.

Merge branch 'stepan/dont-run-system-tests-without-requirements' into 'main'

See merge request isc-projects/bind9!11551

6 days agoMove pytest requirements check to pytest_configure hook 11551/head
Štěpán Balážik [Fri, 13 Feb 2026 10:53:16 +0000 (11:53 +0100)] 
Move pytest requirements check to pytest_configure hook

Logging from a pytest hook looks better.

Reorder the check for presence of `featuretest` before `init_vars` to
produce more sensible errors.

6 days agochg: ci: Run unit tests with PKCS#11-aware OpenSSL
Michal Nowak [Tue, 26 May 2026 15:01:06 +0000 (17:01 +0200)] 
chg: ci: Run unit tests with PKCS#11-aware OpenSSL

Closes isc-projects/bind9#4958

Closes isc-projects/bind9#4957

Merge branch 'mnowak/pkcs11-aware-unit-gcc-ossl3-amd64' into 'main'

See merge request isc-projects/bind9!9543

6 days agoCall tzset() after setenv("TZ", ...) in unit tests 9543/head
Michal Nowak [Thu, 14 May 2026 12:28:06 +0000 (12:28 +0000)] 
Call tzset() after setenv("TZ", ...) in unit tests

POSIX does not require localtime_r() to behave as if tzset() was called,
so the TZ environment change isn't picked up if some library has already
primed libc's tz cache.  Loading pkcs11-provider during OpenSSL init
does exactly that, causing the time and dnstap cmocka tests to format
timestamps in UTC instead of the requested zone.

Assisted-by: Claude:claude-opus-4-7
6 days agoRun unit tests with PKCS#11-aware OpenSSL
Michal Nowak [Mon, 23 Sep 2024 18:15:05 +0000 (20:15 +0200)] 
Run unit tests with PKCS#11-aware OpenSSL

6 days agofix: test: Handle large query IDs in xfer/ans5 properly
Štěpán Balážik [Tue, 26 May 2026 13:49:04 +0000 (13:49 +0000)] 
fix: test: Handle large query IDs in xfer/ans5 properly

Previously, the server would crash if it received a query with an ID
close to 65535 in the badmessageid case, as adding 50 to it would not
fit in uint16.

This was an oversight in porting it from Perl to Python in
f9ed3650acdc2c5b38d8b36729b045ca63f983ef.

Fixes #6025.

Merge branch 'stepan/fix-xfer-large-qid' into 'main'

See merge request isc-projects/bind9!12097

6 days agoHandle large query IDs in xfer/ans5 properly 12097/head
Štěpán Balážik [Tue, 26 May 2026 12:57:47 +0000 (14:57 +0200)] 
Handle large query IDs in xfer/ans5 properly

Previously, the server would crash if it received a query with an ID
close to 65535 in the badmessageid case, as adding 50 to it would not
fit in uint16.

This was an oversight in porting it from Perl to Python in
f9ed3650acdc2c5b38d8b36729b045ca63f983ef.

6 days agofix:usr: Enable Edwards curves with PKCS#11
Michal Nowak [Tue, 26 May 2026 13:35:03 +0000 (15:35 +0200)] 
fix:usr: Enable Edwards curves with PKCS#11

Ed25519 and Ed448 curves did not work in PKCS#11. This has been fixed.

Closes isc-projects/bind9#5762

Merge branch 'mnowak/pkcs11-enable-edwards-curves' into 'main'

See merge request isc-projects/bind9!11591

7 days agoGenerate Ed25519/Ed448 keys via PKCS#11 when a label is set 11591/head
Michal Nowak [Thu, 14 May 2026 14:50:58 +0000 (14:50 +0000)] 
Generate Ed25519/Ed448 keys via PKCS#11 when a label is set

When a dst_key_t carries a PKCS#11 URI in key->label (as named
does for dnssec-policy zones backed by a key-store "hsm"), key
generation must happen inside the HSM, not in software.
opensslecdsa_generate already branches on key->label and calls
the matching pkcs11 wrapper; the EDDSA generator silently ignored
the label and produced a software key, which named then wrote to
the .private file with both a Label: line and the raw PrivateKey:
bytes -- a corrupt hybrid record that prevented zone signing.

Add the missing wrapper:

  - lib/isc/ossl_wrap/ossl3.c gains generate_pkcs11_eddsa_key()
    and the public isc_ossl_wrap_generate_pkcs11_ed25519_key() /
    isc_ossl_wrap_generate_pkcs11_ed448_key() entry points.  They
    use EVP_PKEY_CTX_new_from_name(NULL, "ED25519" or "ED448",
    "provider=pkcs11") with the pkcs11_uri and pkcs11_key_usage
    parameters, mirroring the existing EC wrapper.
  - lib/isc/ossl_wrap/ossl1_1.c provides stubs returning
    ISC_R_NOTIMPLEMENTED for the new EDDSA wrappers; the
    pkcs11-provider stack requires OpenSSL 3.  The pre-existing
    isc_ossl_wrap_generate_pkcs11_rsa_key() stub used to silently
    delegate to software keygen -- that hid the same "HSM label
    on a software key" hazard for RSA on OpenSSL 1.1 builds, so
    align it with the EDDSA stubs and return ISC_R_NOTIMPLEMENTED
    too.
  - lib/isc/include/isc/ossl_wrap.h declares the new wrappers.
  - lib/dns/openssleddsa_link.c routes openssleddsa_generate()
    through the new wrappers when key->label is non-NULL, leaving
    the existing EVP_PKEY_keygen() path untouched for software
    keys.  The Ed448 case is guarded by HAVE_OPENSSL_ED448 to
    match the surrounding code.

Assisted-by: Claude:claude-opus-4-7
7 days agoTolerate non-extractable Ed25519/Ed448 private keys in tofile
Michal Nowak [Thu, 14 May 2026 14:50:18 +0000 (14:50 +0000)] 
Tolerate non-extractable Ed25519/Ed448 private keys in tofile

openssleddsa_tofile() called EVP_PKEY_get_raw_private_key()
unconditionally whenever the dst_key_t had a private EVP_PKEY
attached and aborted with ISC_R_FAILURE on any error.  That is
wrong for keys whose private material lives in a hardware token
(PKCS#11): the provider deliberately refuses to export the raw
bytes, but the keypair is still valid and the .private file
should be written containing only the PKCS#11 label, with no raw
key material.  Without this, "dnssec-keyfromlabel -a ed25519 -l
pkcs11:..." fails with "failed to write key ...: failure" even
though pkcs11-tool has generated a valid Ed25519 key in SoftHSM.

Mirror the behaviour already implemented in opensslecdsa_tofile():
if the raw private key cannot be retrieved AND the key has a
PKCS#11 label to fall back on, clear the OpenSSL error queue and
fall through to writing just the Label element.

If extraction fails and there is no label to fall back on, return
the OpenSSL failure rather than silently producing a .private
file with neither raw key material nor a label, which would be
unusable on the next load.

Consolidate buffer cleanup into a single cleanup: path, freeing
with the original allocation size (alginfo->key_size) rather than
the potentially-modified len output parameter.

Assisted-by: Claude:claude-opus-4-7
7 days agoEnable Edwards curves with PKCS#11
Michal Nowak [Mon, 23 Feb 2026 16:30:50 +0000 (17:30 +0100)] 
Enable Edwards curves with PKCS#11

Ed25519 and Ed448 support (PKCS#11 v3.2) was added to libp11-0.4.17.

7 days agofix: ci: Misc .gitlab-ci.yml fixes
Michal Nowak [Mon, 25 May 2026 16:35:24 +0000 (18:35 +0200)] 
fix: ci: Misc .gitlab-ci.yml fixes

The meson-format job had two `rules:` blocks. YAML silently overwrites
the first with the second, so the job only ran on MRs with meson.build
changes. The intended rules (tags, schedules, other pipeline sources)
were silently discarded. Remove the duplicate to restore the original
intent.

Assisted-by: Claude:claude-opus-4-7
Merge branch 'mnowak/fix-gitlab-ci' into 'main'

See merge request isc-projects/bind9!12093

7 days agoAdd missing autorebase rule to meson-format CI job 12093/head
Michal Nowak [Sun, 24 May 2026 19:16:17 +0000 (19:16 +0000)] 
Add missing autorebase rule to meson-format CI job

The clang-format and coccinelle jobs both include
*rule_branch_after_autorebase in their rules, but meson-format
did not. This meant meson-format would not run after autorebase
operations push new commits.

Assisted-by: Claude:claude-opus-4-7
7 days agoRemove duplicate <<: *build_job merge in clang:tsan CI job
Michal Nowak [Sun, 24 May 2026 19:15:52 +0000 (19:15 +0000)] 
Remove duplicate <<: *build_job merge in clang:tsan CI job

The clang:tsan job merged *build_job twice (lines 1723 and 1729).
The second merge is redundant — copy-paste artifact.

Assisted-by: Claude:claude-opus-4-7
7 days agoAdd missing TSAN_SYMBOLIZER_PATH in system:gcc:tsan CI job
Michal Nowak [Sun, 24 May 2026 19:15:40 +0000 (19:15 +0000)] 
Add missing TSAN_SYMBOLIZER_PATH in system:gcc:tsan CI job

The system:gcc:tsan job had an empty variables: block, unlike its
three sibling TSAN jobs (unit:gcc:tsan, system:clang:tsan,
unit:clang:tsan) which all set TSAN_SYMBOLIZER_PATH.

Assisted-by: Claude:claude-opus-4-7
7 days agoFix duplicate rules: key in meson-format CI job
Michal Nowak [Sun, 24 May 2026 17:50:49 +0000 (17:50 +0000)] 
Fix duplicate rules: key in meson-format CI job

The meson-format job had two `rules:` blocks. YAML silently overwrites
the first with the second, so the job only ran on MRs with meson.build
changes. The intended rules (tags, schedules, other pipeline sources)
were silently discarded. Remove the duplicate to restore the original
intent.

Assisted-by: Claude:claude-opus-4-7
7 days agofix: nil: Fix mypy var-annotated error on FEATURE_VARS
Nicki Křížek [Mon, 25 May 2026 13:03:19 +0000 (15:03 +0200)] 
fix: nil: Fix mypy var-annotated error on FEATURE_VARS

Mypy reports 'Need type annotation for "FEATURE_VARS"'; init_features()
populates it with str->str entries.

Assisted-by: Claude:claude-opus-4-7
Merge branch 'nicki/fix-isctest-vars-mypy-annotation' into 'main'

See merge request isc-projects/bind9!12086

7 days agoFix mypy var-annotated error on FEATURE_VARS 12086/head
Nicki Křížek [Mon, 25 May 2026 12:23:03 +0000 (12:23 +0000)] 
Fix mypy var-annotated error on FEATURE_VARS

Mypy reports 'Need type annotation for "FEATURE_VARS"'; init_features()
populates it with str->str entries.

Assisted-by: Claude:claude-opus-4-7
10 days agonew: ci: Add Debian "trixie" (386)
Michal Nowak [Fri, 22 May 2026 16:30:49 +0000 (18:30 +0200)] 
new: ci: Add Debian "trixie" (386)

Merge branch 'mnowak/add-debian-trixie-386' into 'main'

See merge request isc-projects/bind9!12079

11 days agoTolerate dnspython post-2038 timestamp overflow on 32-bit 12079/head
Michal Nowak [Thu, 21 May 2026 07:31:15 +0000 (07:31 +0000)] 
Tolerate dnspython post-2038 timestamp overflow on 32-bit

dnspython's RRSIG.to_text() converts the signature inception/expiration
fields by calling time.gmtime(), which on 32-bit platforms raises
OverflowError for values past 2038-01-19 (INT32_MAX). Several DNSSEC
test fixtures use far-future expirations: the precomputed RRSIGs in
the dnssec test's rsasha1.example.db.in zone expire in 2093, ans4 of
the chain test hardcodes 2090, and ans10 of the dnssec test uses
2**32-1 (year 2106). Whenever a response carrying such an RRSIG is
formatted with str()/to_text() the overflow propagates out and either
fails the test (when triggered in isctest.query's debug logging) or
kills the asyncserver-based ans* server (when triggered in its
response logger), which in turn cascades into "Failed to stop
servers" teardown errors and SERVFAIL responses for subsequent tests.

Wrap the to_text() calls in isctest/query.py and the str(response)
call in asyncserver's _log_response() with try/except OverflowError,
falling back to a placeholder message. The conversions are only used
for debug logging, so losing the human-readable form there does not
affect what the tests actually validate.

Assisted-by: Claude:claude-opus-4-7