]> git.ipfire.org Git - thirdparty/ipxe.git/log
thirdparty/ipxe.git
4 weeks ago[build] Fail Secure Boot builds unless all files are permitted
Michael Brown [Wed, 14 Jan 2026 16:56:38 +0000 (16:56 +0000)] 
[build] Fail Secure Boot builds unless all files are permitted

Add the Secure Boot permissibility check as a dependency for targets
built with the Secure Boot flag enabled.  Attempting to build e.g.

  make bin-x86_64-efi-sb/snponly.efi

will now fail unless all files used in the final binary are marked as
being permitted for Secure Boot.

This does not affect the standard build targets (without the "-sb"
suffix on the build directory).

Signed-off-by: Michael Brown <mcb30@ipxe.org>
4 weeks ago[build] Mark MD4 and MD5 as forbidden for UEFI Secure Boot
Michael Brown [Wed, 14 Jan 2026 15:51:07 +0000 (15:51 +0000)] 
[build] Mark MD4 and MD5 as forbidden for UEFI Secure Boot

A past security review identified MD4 and MD5 support as features that
ought to be disabled by default.  (There is zero impact on UEFI Secure
Boot itself from having these algorithms enabled: this was just a side
comment in the review.)

As noted in the resulting commit 7f2006a ("[crypto] Disable MD5 as an
OID-identifiable algorithm by default"), the actual MD5 code will
almost certainly still be present in the binary due to its implicit
use by various features.  Disabling MD5 support via config/crypto.h
simply removes the OID-identified algorithm, which prevents it from
being used as an explicitly identified algorithm (e.g. in an X.509
certificate digest).

Match the intent of this review comment by marking the OID-identified
algorithms for MD4 and MD5 as forbidden for UEFI Secure Boot.

Extend this to also disable the "md4sum" command and the use of the
md5WithRSAEncryption OID-identified algorithm.  (The "md5sum" command
is left enabled for historical reasons, and we have no definition for
md4WithRSAEncryption anyway.)

Signed-off-by: Michael Brown <mcb30@ipxe.org>
4 weeks ago[build] Mark known reviewed files as permitted for UEFI Secure Boot
Michael Brown [Wed, 14 Jan 2026 14:36:49 +0000 (14:36 +0000)] 
[build] Mark known reviewed files as permitted for UEFI Secure Boot

Some past security reviews carried out for UEFI Secure Boot signing
submissions have covered specific drivers or functional areas of iPXE.
Mark all of the files comprising these areas as permitted for UEFI
Secure Boot.

Signed-off-by: Michael Brown <mcb30@ipxe.org>
4 weeks ago[build] Mark core files as permitted for UEFI Secure Boot
Michael Brown [Wed, 14 Jan 2026 13:25:34 +0000 (13:25 +0000)] 
[build] Mark core files as permitted for UEFI Secure Boot

Mark all files used in a standard build of bin-x86_64-efi/snponly.efi
as permitted for UEFI Secure Boot.  These files represent the core
functionality of iPXE that is guaranteed to have been included in
every binary that was previously subject to a security review and
signed by Microsoft.  It is therefore legitimate to assume that at
least these files have already been reviewed to the required standard
multiple times.

Signed-off-by: Michael Brown <mcb30@ipxe.org>
4 weeks ago[build] Check for standalone FILE_LICENCE() and FILE_SECBOOT() declarations
Michael Brown [Wed, 14 Jan 2026 13:20:11 +0000 (13:20 +0000)] 
[build] Check for standalone FILE_LICENCE() and FILE_SECBOOT() declarations

Tighten up the regular expression used to check for FILE_LICENCE() and
FILE_SECBOOT() declarations: ensure that they appear at the start of a
line (with optional whitespace) and include the expected opening
parenthesis.

Signed-off-by: Michael Brown <mcb30@ipxe.org>
4 weeks ago[console] Mark generated keymaps as permitted for Secure Boot
Michael Brown [Tue, 13 Jan 2026 15:41:21 +0000 (15:41 +0000)] 
[console] Mark generated keymaps as permitted for Secure Boot

Signed-off-by: Michael Brown <mcb30@ipxe.org>
4 weeks ago[build] Mark existing files as explicitly forbidden for Secure Boot
Michael Brown [Tue, 13 Jan 2026 14:38:37 +0000 (14:38 +0000)] 
[build] Mark existing files as explicitly forbidden for Secure Boot

The third-party 802.11 stack and NFS protocol code are known to
include multiple potential vulnerabilities and are explicitly
forbidden from being included in Secure Boot signed builds.  This is
currently handled at the per-directory level by defining a list of
source directories (SRCDIRS_INSEC) that are to be excluded from Secure
Boot builds.

Annotate all files in these directories with FILE_SECBOOT() to convey
this information to the new per-file Secure Boot permissibility check,
and remove the old separation between SRCDIRS and SRCDIRS_INSEC.

Signed-off-by: Michael Brown <mcb30@ipxe.org>
4 weeks ago[efi] Mark imported EDK2 headers as permitted for Secure Boot
Michael Brown [Tue, 13 Jan 2026 14:00:40 +0000 (14:00 +0000)] 
[efi] Mark imported EDK2 headers as permitted for Secure Boot

Signed-off-by: Michael Brown <mcb30@ipxe.org>
4 weeks ago[efi] Update to current EDK2 headers
Michael Brown [Tue, 13 Jan 2026 13:58:17 +0000 (13:58 +0000)] 
[efi] Update to current EDK2 headers

Signed-off-by: Michael Brown <mcb30@ipxe.org>
4 weeks ago[build] Define a mechanism for marking Secure Boot permissibility
Michael Brown [Tue, 13 Jan 2026 13:49:27 +0000 (13:49 +0000)] 
[build] Define a mechanism for marking Secure Boot permissibility

Not all files within the iPXE codebase are allowed to be included in
UEFI Secure Boot signed builds.

Following the pattern used by the existing FILE_LICENCE() macro and
licensing check: define a FILE_SECBOOT() macro that can be used to
declare a file as being permitted (or forbidden) in a UEFI Secure Boot
signed build, and a corresponding build target to perform the check.

Signed-off-by: Michael Brown <mcb30@ipxe.org>
5 weeks ago[neighbour] Treat delayed transmissions as pending operations
Michael Brown [Fri, 9 Jan 2026 18:29:53 +0000 (18:29 +0000)] 
[neighbour] Treat delayed transmissions as pending operations

Treat each delayed transmission as a pending operation, so that the
"sync" command can be used to ensure that all delayed packets have
been transmitted.

Signed-off-by: Michael Brown <mcb30@ipxe.org>
5 weeks ago[tcp] Report TCP statistics via the "ipstat" command
Michael Brown [Fri, 9 Jan 2026 16:36:52 +0000 (16:36 +0000)] 
[tcp] Report TCP statistics via the "ipstat" command

Gather some basic statistics on TCP connections to allow out-of-order
packets and duplicate packets to be observed even in non-debug builds.

Report these statistics via the existing "ipstat" command, rather than
introducing a separate "tcpstat" command, on the basis that we do not
need the additional overhead of a separate command.

Signed-off-by: Michael Brown <mcb30@ipxe.org>
5 weeks ago[malloc] Increase heap size to 4MB
Michael Brown [Fri, 9 Jan 2026 14:40:31 +0000 (14:40 +0000)] 
[malloc] Increase heap size to 4MB

Commit 2d180ce ("[tcp] Update maximum window size to 2MB") increased
the TCP window size to avoid filling the TCP window on typical modern
links.

The total heap size is only 512kB.  Given that RX I/O buffers are
typically subject to alignment constraints, it is plausible that we
may be able to actually buffer only 256kB of data before having to
discard queued out-of-order packets.

On a low latency network, this behaviour is not a problem: the sender
will rapidly retransmit the lost or discarded packets.  On a high
latency network, the sender's congestion control algorithm will end up
calculating a congestion window that is substantially smaller than our
advertised 2MB, which will result in a drastic reduction in actual
throughput.

We do not want to increase the heap size arbitrarily, since we still
have the constraint that memory used by iPXE may be permanently lost
to the operating system (depending on how the operating system is
booted).  However, the cost of keeping the heap size down to 512kB is
no longer acceptable given that large downloads over high-speed
wide-area networks are now routine.

Increase the heap size from 512kB to 4MB.  This should be sufficient
to hold an entire 2MB TCP window for a single connection under most
sensible conditions.  For example:

  * 1460-byte MSS => 1436 packets => 2872kB of 2kB RX I/O buffers

  * 8960-byte MSS => 234 packets => 3744kB of 16kB RX I/O buffers

The notable exception is that of a network where jumbo frames are in
use, but the TCP connection ends up using a standard 1460-byte MSS.
If this is found to be an issue in practice, then one possible
solution would be to shrink (or reallocate) I/O buffers for
out-of-order queued data.

Experimentation shows that before this change, an induced latency of
25ms (representative of a typical connection to a public cloud
provider) would cause the download speed to vary unpredictably between
2MB/s and 25MB/s.  After this change, the speed in this test scenario
remains consistently high at 25MB/s.

Signed-off-by: Michael Brown <mcb30@ipxe.org>
5 weeks ago[tcp] Discard packets that lie immediately before the receive window
Michael Brown [Fri, 9 Jan 2026 13:18:20 +0000 (13:18 +0000)] 
[tcp] Discard packets that lie immediately before the receive window

We will currently enqueue (rather than discard) retransmitted packets
that lie immediately before the current receive window.  These packets
will be harmlessly discarded when the receive queue is processed
immediately afterwards, but cause confusion when attempting to debug
TCP performance issues.

Fix by adjusting the comparison so that packets that lie immediately
before the receive window will be discarded immediately and never
enqueued.

Signed-off-by: Michael Brown <mcb30@ipxe.org>
5 weeks ago[neighbour] Add the ability to artificially delay outbound packets
Michael Brown [Tue, 6 Jan 2026 14:04:00 +0000 (14:04 +0000)] 
[neighbour] Add the ability to artificially delay outbound packets

Add a fault-injection mechanism that allows an arbitrary delay
(configured via config/fault.h) to be added to any packets transmitted
via the neighbour resolution mechanism, as a way of reproducing
symptoms that occur only on high-latency connections such as a
satellite uplink.

The neighbour discovery mechanism is not a natural conceptual fit for
this artficial delay, since neighbour discovery has nothing to do with
transmit latency.  However, the neighbour discovery mechanism happens
to already include a deferred transmission queue that can be (ab)used
to implement this artifical delay in a minimally intrusive way.  In
particular, there is zero code size impact on a standard build with no
artificial delay configured.

Implementing the delay only for packets transmitted via neighbour
resolution has the side effect that broadcast packets (such as DHCP
and ARP) are unaffected.  This is likely in practice to produce a
better emulation of a high-latency uplink scenario, where local
network traffic such as DHCP and ARP will complete quickly and only
the subsequent TCP/UDP traffic will experience delays.

Signed-off-by: Michael Brown <mcb30@ipxe.org>
5 weeks ago[neighbour] Split out deferred transmission from discovery completion
Michael Brown [Mon, 5 Jan 2026 15:53:20 +0000 (15:53 +0000)] 
[neighbour] Split out deferred transmission from discovery completion

Split out the logic for transmitting any deferred packets as a
separate function, as a precursor to supporting the ability to add
deliberate latency to transmitted packets.

Signed-off-by: Michael Brown <mcb30@ipxe.org>
5 weeks ago[neighbour] Use discovery protocol field to identify incomplete neighbours
Michael Brown [Mon, 5 Jan 2026 15:46:52 +0000 (15:46 +0000)] 
[neighbour] Use discovery protocol field to identify incomplete neighbours

Use the discovery protocol pointer field (rather than the running
state of the discovery timer) to determine whether or not neighbour
discovery is ongoing, as a precursor to allowing the timer to be
(ab)used for adding deliberate latency to transmitted packets.

Signed-off-by: Michael Brown <mcb30@ipxe.org>
6 weeks ago[neighbour] Always use network device's own link-layer address
Michael Brown [Mon, 5 Jan 2026 14:22:16 +0000 (14:22 +0000)] 
[neighbour] Always use network device's own link-layer address

The API for neighbour_tx() allows for an explicit source link-layer
address, but this will be ignored if the packet is deferred for
transmission after completion of neighbour discovery.  The network
device's own link-layer address will always be used when sending
neighbour discovery packets, and when sending any deferred packets
after discovery completes.

All callers pass in the network device's own link-layer address as the
source address anyway, and so this explicit source link-layer address
is never used for any meaningful purpose.

Simplify the neighbour_tx() API by removing the ability to pass in an
explicit source link-layer address.

Signed-off-by: Michael Brown <mcb30@ipxe.org>
7 weeks ago[crypto] Allow for zero-length big integer literals
Michael Brown [Mon, 29 Dec 2025 14:01:46 +0000 (14:01 +0000)] 
[crypto] Allow for zero-length big integer literals

Ensure that zero-length big integer literals are treated as containing
a zero value.  Avoid tests on every big integer arithmetic operation
by ensuring that bigint_required_size() always returns a non-zero
value: the zero-length tests can therefore be restricted to only
bigint_init() and bigint_done().

Signed-off-by: Michael Brown <mcb30@ipxe.org>
7 weeks ago[test] Update big integer tests to use okx()
Michael Brown [Mon, 29 Dec 2025 13:18:10 +0000 (13:18 +0000)] 
[test] Update big integer tests to use okx()

Signed-off-by: Michael Brown <mcb30@ipxe.org>
8 weeks ago[crypto] Fix identification of non-wrapped elliptic curve identifiers
Michael Brown [Mon, 22 Dec 2025 16:13:21 +0000 (16:13 +0000)] 
[crypto] Fix identification of non-wrapped elliptic curve identifiers

Signed-off-by: Michael Brown <mcb30@ipxe.org>
8 weeks ago[crypto] Add ECDSA-based TLS cipher suites
Michael Brown [Fri, 19 Dec 2025 18:18:45 +0000 (18:18 +0000)] 
[crypto] Add ECDSA-based TLS cipher suites

Signed-off-by: Michael Brown <mcb30@ipxe.org>
8 weeks ago[test] Add test cases for X.509 certificates with ECDSA signatures
Michael Brown [Fri, 19 Dec 2025 14:45:09 +0000 (14:45 +0000)] 
[test] Add test cases for X.509 certificates with ECDSA signatures

Signed-off-by: Michael Brown <mcb30@ipxe.org>
8 weeks ago[crypto] Add OID-identified algorithms for ECDSA with SHA2 hash family
Michael Brown [Fri, 19 Dec 2025 14:43:56 +0000 (14:43 +0000)] 
[crypto] Add OID-identified algorithms for ECDSA with SHA2 hash family

Signed-off-by: Michael Brown <mcb30@ipxe.org>
8 weeks ago[crypto] Allow ecPublicKey to be identified as a public-key algorithm
Michael Brown [Fri, 19 Dec 2025 15:24:47 +0000 (15:24 +0000)] 
[crypto] Allow ecPublicKey to be identified as a public-key algorithm

Add a public-key algorithm to the definition of the "ecPublicKey"
OID-identified algorithm, and move this definition to ecdsa.c to avoid
unconditionally dragging in ECDSA support.

Signed-off-by: Michael Brown <mcb30@ipxe.org>
8 weeks ago[test] Ensure OID-identified algorithms are present for X.509 tests
Michael Brown [Fri, 19 Dec 2025 14:24:27 +0000 (14:24 +0000)] 
[test] Ensure OID-identified algorithms are present for X.509 tests

The algorithms required for the X.509 tests are accessed indirectly
via their OID-identified algorithms, rather than directly via symbols.
Ensure that the required OID-identified algorithm definitions are
included regardless of the configuration in config/crypto.h.

Signed-off-by: Michael Brown <mcb30@ipxe.org>
8 weeks ago[x509] Correct debug message
Michael Brown [Fri, 19 Dec 2025 13:54:15 +0000 (13:54 +0000)] 
[x509] Correct debug message

Signed-off-by: Michael Brown <mcb30@ipxe.org>
8 weeks ago[crypto] Add support for ECDSA signatures
Michael Brown [Thu, 18 Dec 2025 23:33:24 +0000 (23:33 +0000)] 
[crypto] Add support for ECDSA signatures

Signed-off-by: Michael Brown <mcb30@ipxe.org>
8 weeks ago[test] Test verification of constructed signature
Michael Brown [Thu, 18 Dec 2025 23:10:57 +0000 (23:10 +0000)] 
[test] Test verification of constructed signature

Some signature schemes (such as ECDSA) allow for non-deterministic
signatures.  Provide more information in test results by performing
verification of the constructed signature even when it does not match
the expected test case result: this allows us to distinguish between a
bug that is generating invalid signatures and a bug that is generating
valid but non-canonical signatures.

Signed-off-by: Michael Brown <mcb30@ipxe.org>
8 weeks ago[crypto] Allow for an explicit representation of point at infinity
Michael Brown [Thu, 18 Dec 2025 15:38:11 +0000 (15:38 +0000)] 
[crypto] Allow for an explicit representation of point at infinity

ECDSA requires the ability to add two arbitrary curve points, either
of which may legitimately be the point at infinity.

Update the API so that curves must choose an explicit affine
representation for the point at infinity, and provide a method to test
for this representation.  Multiplication and addition will now allow
this representation to be provided as an input, and will not fail if
the result is the point at infinity.  Callers must explicitly check
for the point at infinity where needed (e.g. after computing the ECDHE
shared secret curve point).

Signed-off-by: Michael Brown <mcb30@ipxe.org>
2 months ago[test] Test signature verification independently of signing
Michael Brown [Wed, 17 Dec 2025 20:35:18 +0000 (20:35 +0000)] 
[test] Test signature verification independently of signing

Copy and modify the signature defined within the test case for
verification tests, rather than relying on the modifiable signature
constructed by the signing portion of the same test.

Signed-off-by: Michael Brown <mcb30@ipxe.org>
2 months ago[intel] Add PCI ID for I219-V and -LM 24 1573/head
Christian I. Nilsson [Mon, 15 Dec 2025 20:47:19 +0000 (21:47 +0100)] 
[intel] Add PCI ID for I219-V and -LM 24

Signed-off-by: Christian I. Nilsson <nikize@gmail.com>
2 months ago[efi] Retry calls to GetRNG() as needed 1571/head
Michael Brown [Thu, 11 Dec 2025 14:04:10 +0000 (14:04 +0000)] 
[efi] Retry calls to GetRNG() as needed

The UEFI specification allows GetRNG() to return EFI_NOT_READY, which
is not a particularly helpful error status since there is nothing that
can sensibly be done except to retry immediately.

Retry failed calls to GetRNG() up to a maximum number of attempts.

Debugged-by: Stoo Davies <sdavies@nvidia.com>
Signed-off-by: Michael Brown <mcb30@ipxe.org>
2 months ago[crypto] Generalise rsa_parse_integer() to asn1_enter_unsigned()
Michael Brown [Thu, 11 Dec 2025 15:02:28 +0000 (15:02 +0000)] 
[crypto] Generalise rsa_parse_integer() to asn1_enter_unsigned()

ECDSA signature values and private keys are fixed-length unsigned
integers modulo N (the group order of the elliptic curve) and are
therefore most naturally represented in ASN.1 using ASN1_OCTET_STRING.

Private key representations do use ASN1_OCTET_STRING, but signature
values tend to use ASN1_INTEGER, which adds no value but does ensure
that the encoding becomes variable-length and requires handling a
pointless extra zero byte if the MSB of the unsigned value happens to
be set.

RSA also makes use of ASN1_INTEGER for modulus and exponent values.
Generalise the existing rsa_parse_integer() to asn1_enter_unsigned()
to allow this code to be reused for ECDSA.

Signed-off-by: Michael Brown <mcb30@ipxe.org>
2 months ago[crypto] Allow for addition of arbitrary Weierstrass curve points
Michael Brown [Sat, 6 Dec 2025 16:59:29 +0000 (16:59 +0000)] 
[crypto] Allow for addition of arbitrary Weierstrass curve points

ECDSA verification requires the ability to add two arbitrary curve
points (as well as the ability to multiply a curve point by a scalar).

Add an elliptic curve method to perform arbitrary point addition.
Pass in curve points as affine coordinates: this will require some
redundant conversions between affine coorfinates and the internal
representation as projective coordinates in Montgomery form, but keeps
the API as simple as possible.  Since we do not expect to perform a
high volume of ECDSA signature verifications, these redundant
calculations are an acceptable cost for keeping the code simple.

Signed-off-by: Michael Brown <mcb30@ipxe.org>
2 months ago[crypto] Split out Weierstrass point initialisation and finalisation
Michael Brown [Fri, 5 Dec 2025 16:08:49 +0000 (16:08 +0000)] 
[crypto] Split out Weierstrass point initialisation and finalisation

Prepare for adding an operation to add arbitrary curve points by
splitting out initialisation and finalisation from the multiplication
operation.

Pass explicit temporary buffer pointers to weierstrass_init() and
weierstrass_done(), to ensure that stack consumption does not increase
as a result of splitting out this functionality.

Signed-off-by: Michael Brown <mcb30@ipxe.org>
2 months ago[crypto] Expose the (prime) group order as an elliptic curve property
Michael Brown [Fri, 5 Dec 2025 14:47:55 +0000 (14:47 +0000)] 
[crypto] Expose the (prime) group order as an elliptic curve property

ECDSA requires knowledge of the group order of the base point, and is
defined only for curves with a prime group order (e.g. the NIST
curves).

Add the group order as an explicit property of an elliptic curve, and
add tests to verify that the order is correct.

Signed-off-by: Michael Brown <mcb30@ipxe.org>
2 months ago[crypto] Verify that weierstrass_multiply() result is not point at infinity
Michael Brown [Fri, 5 Dec 2025 14:50:57 +0000 (14:50 +0000)] 
[crypto] Verify that weierstrass_multiply() result is not point at infinity

The point at infinity cannot be represented in affine coordinates, and
so cannot be returned as a valid result from weierstrass_multiply().

The implementation uses projective coordinates internally, in which a
point at infinity is represented by a zero Z-coordinate.  Treat a zero
Z-coordinate as an invalid result.

The projective coordinates are calculated modulo 4N, and so a zero
value may be represented as 0, N, 2N, or 3N.  To minimise code size,
defer the test until after inverting the Z co-ordinate via Fermat's
little theorem via bigint_mod_exp_ladder() (which will calculate the
inverse of zero as zero, and will always produce a result strictly
modulo N).

Defer the test further until after converting the result back to
affine coordinates, to allow the debug message showing the
multiplication result to be printed.

Signed-off-by: Michael Brown <mcb30@ipxe.org>
2 months ago[test] Allow for elliptic curve tests other than multiplication
Michael Brown [Fri, 5 Dec 2025 13:17:58 +0000 (13:17 +0000)] 
[test] Allow for elliptic curve tests other than multiplication

Rename elliptic_ok() to elliptic_multiply_ok() etc, to create
namespace for tests of other elliptic curve operations.

Signed-off-by: Michael Brown <mcb30@ipxe.org>
2 months ago[crypto] Expose the base point as an explicit elliptic curve property
Michael Brown [Fri, 5 Dec 2025 13:00:12 +0000 (13:00 +0000)] 
[crypto] Expose the base point as an explicit elliptic curve property

Add the generator base point as an explicit property of an elliptic
curve, and remove the ability to pass a NULL to elliptic_multiply() to
imply the use of the generator base point.

Signed-off-by: Michael Brown <mcb30@ipxe.org>
2 months ago[http] Abort connections after a long period of inactivity
Michael Brown [Thu, 4 Dec 2025 13:52:08 +0000 (13:52 +0000)] 
[http] Abort connections after a long period of inactivity

Once an HTTP download has started (i.e. once all request headers have
been sent), we generally have no more data to transmit.  If an HTTP
connection dies silently (e.g. due to a network failure, a NIC driver
bug, or a server crash) then there is no mechanism that will currently
detect this situation by default.

We do send TCP keep-alives (to maintain state in intermediate routers
and firewalls), but we do not attempt to elicit a response from the
server.  RFC 9293 explicitly states that the absence of a response to
a TCP keep-alive probe must not be interpreted as indicating a dead
connection, since TCP cannot guarantee reliable delivery of packets
that do not advance the sequence number.

Scripts may use the "--timeout" option to impose an overall time limit
on downloads, but this mechanism is off by default and requires
additional thought and configuration by the user (which goes against
iPXE's general philosophy of being as automatic as possible).

Add an idle connection watchdog timer which will cause the HTTP
download to abort after 120 seconds of inactivity.  Activity is
defined as an I/O buffer being delivered to the HTTP transaction's
upstream data transfer interface.

Downloads over HTTPS may experience a substantial delay until the
first recorded activity, since all TLS negotiation (including
cross-chained certificate downloads and OCSP checks) must complete
before any application data can be sent.  We choose to not reset the
watchdog timer during TLS negotiation, on the basis that 120 seconds
is already an unreasonably long time for a TLS negotiation to take to
complete.  If necessary, resetting the watchdog timer could be
accomplished by having the TLS layer deliver zero-length I/O buffers
(via xfer_seek()) to indicate forward progress being made.

When using PeerDist content encoding, the downloaded content
information is not passed through to the content-decoded interface and
so will not be classed as activity.  Any activity in the individual
PeerDist block downloads (either from peers or as range requests from
the origin server) will be classed as activity in the overall
download, since individual block downloads do not buffer data but
instead pass it through directly via the PeerDist download
multiplexer.

Signed-off-by: Michael Brown <mcb30@ipxe.org>
2 months ago[http] Rename connection retry timer
Michael Brown [Thu, 4 Dec 2025 13:47:30 +0000 (13:47 +0000)] 
[http] Rename connection retry timer

Signed-off-by: Michael Brown <mcb30@ipxe.org>
2 months ago[crypto] Allow for OID-identified elliptic curve algorithms
Michael Brown [Thu, 27 Nov 2025 16:39:52 +0000 (16:39 +0000)] 
[crypto] Allow for OID-identified elliptic curve algorithms

Elliptic curves in X.509 certificates are identified via the
id-ecPublicKey object identifier (1.2.840.10045.2.1), with the
specific elliptic curve identified via a second OID in the algorithm
parameters.

Signed-off-by: Michael Brown <mcb30@ipxe.org>
2 months ago[test] Include key matching in existing public-key tests
Michael Brown [Wed, 3 Dec 2025 15:18:37 +0000 (15:18 +0000)] 
[test] Include key matching in existing public-key tests

Signed-off-by: Michael Brown <mcb30@ipxe.org>
2 months ago[crypto] Remove obsolete maximum output length method
Michael Brown [Tue, 2 Dec 2025 13:13:01 +0000 (13:13 +0000)] 
[crypto] Remove obsolete maximum output length method

Now that public-key algorithms use ASN.1 builders to dynamically
allocate the output data, there is no further need for callers to be
able to determine the maximum output length.

Signed-off-by: Michael Brown <mcb30@ipxe.org>
2 months ago[crypto] Construct asymmetric ciphered data using ASN.1 builders
Michael Brown [Tue, 2 Dec 2025 13:12:25 +0000 (13:12 +0000)] 
[crypto] Construct asymmetric ciphered data using ASN.1 builders

Signed-off-by: Michael Brown <mcb30@ipxe.org>
2 months ago[crypto] Construct signatures using ASN.1 builders
Michael Brown [Mon, 1 Dec 2025 16:02:54 +0000 (16:02 +0000)] 
[crypto] Construct signatures using ASN.1 builders

Signed-off-by: Michael Brown <mcb30@ipxe.org>
2 months ago[crypto] Pass signatures for verification as ASN.1 cursors
Michael Brown [Mon, 1 Dec 2025 14:47:51 +0000 (14:47 +0000)] 
[crypto] Pass signatures for verification as ASN.1 cursors

Signed-off-by: Michael Brown <mcb30@ipxe.org>
2 months ago[crypto] Restructure handling of ASN.1 bit strings
Michael Brown [Fri, 28 Nov 2025 13:21:00 +0000 (13:21 +0000)] 
[crypto] Restructure handling of ASN.1 bit strings

Signature values in ASN.1 tend to be encoded as bit strings rather
than octet strings.  In practice, no existent signature scheme uses a
non-integral number of bytes.

Switch to using a standard ASN.1 cursor to hold signature values, to
simplify consuming code.  Restructure the API to treat entering an
ASN.1 bit string in the same way as entering any other ASN.1 type.

Signed-off-by: Michael Brown <mcb30@ipxe.org>
2 months ago[intel] Add PCI IDs for I225 and I226 chipsets
Bert Ezendam [Wed, 26 Nov 2025 14:11:18 +0000 (14:11 +0000)] 
[intel] Add PCI IDs for I225 and I226 chipsets

Identifiers are taken from the pci.ids database.

Signed-off-by: Bert Ezendam <bert.ezendam@alliander.com>
2 months ago[efi] Allow for creating devices with no EFI parent device
Michael Brown [Tue, 25 Nov 2025 11:59:03 +0000 (11:59 +0000)] 
[efi] Allow for creating devices with no EFI parent device

On some systems (observed on an AWS m8g.medium instance in eu-west-2),
the UEFI firmware fails to enumerate some of the underlying hardware
devices.  On these systems, we cannot comply with the UEFI device
model by adding our SNP device as a child of the hardware device and
appending to the parent hardware device path, since no parent hardware
device has been created.

Work around these systems by allowing for the creation of SNP devices
with no parent device.

Signed-off-by: Michael Brown <mcb30@ipxe.org>
2 months ago[pci] Use runtime selectable PCI I/O API for EFI cloud builds
Michael Brown [Mon, 24 Nov 2025 20:27:53 +0000 (20:27 +0000)] 
[pci] Use runtime selectable PCI I/O API for EFI cloud builds

On some systems (observed on an AWS m8g.medium instance in eu-west-2),
the UEFI firmware omits the PCI host bridge drivers for all but the
first PCI bus.  The observable result is that any devices on other PCI
buses (such as the ENA network device) are not enumerated by the UEFI
firmware and are therefore unusable by iPXE.

Support these systems by switching to using PCIAPI_CLOUD for EFI cloud
builds, trying the EFI PCI I/O API first and falling back to direct
access (via ECAM) for devices that the UEFI firmware has failed to
enumerate itself.

Signed-off-by: Michael Brown <mcb30@ipxe.org>
2 months ago[pci] Allow probing permission to vary by range
Michael Brown [Mon, 24 Nov 2025 23:09:53 +0000 (23:09 +0000)] 
[pci] Allow probing permission to vary by range

Make pci_can_probe() part of the runtime selectable PCI I/O API, and
defer this check to the per-range API.

Signed-off-by: Michael Brown <mcb30@ipxe.org>
2 months ago[pci] Use linker tables for runtime selectable PCI APIs
Michael Brown [Mon, 24 Nov 2025 20:18:52 +0000 (20:18 +0000)] 
[pci] Use linker tables for runtime selectable PCI APIs

Use the linker table mechanism to enumerate the underlying PCI I/O
APIs, to allow PCIAPI_CLOUD to become architecture-independent code.

Signed-off-by: Michael Brown <mcb30@ipxe.org>
2 months ago[pci] Allow PCI configuration space access mechanism to vary by range
Michael Brown [Mon, 24 Nov 2025 14:44:53 +0000 (14:44 +0000)] 
[pci] Allow PCI configuration space access mechanism to vary by range

On some systems (observed on an AWS EC2 c7a.medium instance in
eu-west-2), there is no single PCI configuration space access
mechanism that covers all PCI devices.  For example: the ECAM may
provide access only to bus 01 and above, with type 1 accesses required
to access bus 00.

Allow the choice of PCI configuration space access mechanism to be
made on a per-range basis, rather than being made just once in an
initialisation function.

Signed-off-by: Michael Brown <mcb30@ipxe.org>
2 months ago[arm] Avoid unaligned accesses for memcpy() and memset()
Michael Brown [Wed, 19 Nov 2025 22:17:14 +0000 (22:17 +0000)] 
[arm] Avoid unaligned accesses for memcpy() and memset()

iPXE runs only in environments that support unaligned accesses to RAM.
However, memcpy() and memset() are also used to write to graphical
framebuffer memory, which may support only aligned accesses on some
CPU architectures such as ARM.

Restructure the 64-bit ARM memcpy() and memset() routines along the
lines of the RISC-V implementations, which split the region into
pre-aligned, aligned, and post-aligned sections.

Signed-off-by: Michael Brown <mcb30@ipxe.org>
3 months ago[efi] Wrap a selection of runtime services calls
Michael Brown [Thu, 13 Nov 2025 14:38:12 +0000 (14:38 +0000)] 
[efi] Wrap a selection of runtime services calls

Allow DEBUG=efi_wrap to trace various runtime services calls as well
as the existing boot services calls.

Signed-off-by: Michael Brown <mcb30@ipxe.org>
3 months ago[efi] Allow SAN-booted images to be traced via DEBUG=efi_wrap
Michael Brown [Thu, 13 Nov 2025 13:17:25 +0000 (13:17 +0000)] 
[efi] Allow SAN-booted images to be traced via DEBUG=efi_wrap

Signed-off-by: Michael Brown <mcb30@ipxe.org>
3 months ago[efi] Add image security database GUID definition
Michael Brown [Wed, 12 Nov 2025 12:09:40 +0000 (12:09 +0000)] 
[efi] Add image security database GUID definition

Signed-off-by: Michael Brown <mcb30@ipxe.org>
3 months ago[efi] Add Microsoft vendor GUID definition
Michael Brown [Wed, 12 Nov 2025 12:01:37 +0000 (12:01 +0000)] 
[efi] Add Microsoft vendor GUID definition

Signed-off-by: Michael Brown <mcb30@ipxe.org>
3 months ago[efi] Add storage security command protocol header and GUID definition
Michael Brown [Tue, 11 Nov 2025 16:22:21 +0000 (16:22 +0000)] 
[efi] Add storage security command protocol header and GUID definition

Signed-off-by: Michael Brown <mcb30@ipxe.org>
3 months ago[efi] Update to current EDK2 headers
Michael Brown [Tue, 11 Nov 2025 16:18:45 +0000 (16:18 +0000)] 
[efi] Update to current EDK2 headers

Signed-off-by: Michael Brown <mcb30@ipxe.org>
3 months ago[efi] Mark Arm/ProcessorBind.h as a non-imported header
Michael Brown [Tue, 11 Nov 2025 16:14:22 +0000 (16:14 +0000)] 
[efi] Mark Arm/ProcessorBind.h as a non-imported header

Support for ARM32 has been removed from the EDK2 codebase.  However,
we may as well retain the ability to build iPXE for existing EFI
platforms.

Add an iPXE include guard to this file so that the EDK2 header import
script will no longer attempt to import it from the EDK2 tree.

Signed-off-by: Michael Brown <mcb30@ipxe.org>
3 months ago[efi] Mark Ip4Config.h as a non-imported header
Michael Brown [Tue, 11 Nov 2025 16:12:26 +0000 (16:12 +0000)] 
[efi] Mark Ip4Config.h as a non-imported header

The Ip4Config.h header has been removed from the EDK2 codebase as
obsolete.  However, we may still encounter it in the wild and so it is
useful to retain the GUID and the corresponding protocol name for
debug messages.

Add an iPXE include guard to this file so that the EDK2 header import
script will no longer attempt to import it from the EDK2 tree.

Signed-off-by: Michael Brown <mcb30@ipxe.org>
3 months ago[efi] Mark UgaDraw.h as a non-imported header
Michael Brown [Tue, 11 Nov 2025 16:09:27 +0000 (16:09 +0000)] 
[efi] Mark UgaDraw.h as a non-imported header

The UgaDraw.h header has been removed from the EDK2 codebase as
obsolete.  However, we may still encounter it in the wild and so it is
useful to retain the GUID and the corresponding protocol name for
debug messages.

Add an iPXE include guard to this file so that the EDK2 header import
script will no longer attempt to import it from the EDK2 tree.

Signed-off-by: Michael Brown <mcb30@ipxe.org>
3 months ago[efi] Switch back to VA_START() etc macros for EFIAPI functions
Michael Brown [Tue, 11 Nov 2025 14:45:01 +0000 (14:45 +0000)] 
[efi] Switch back to VA_START() etc macros for EFIAPI functions

Commit 670810b ("[efi] Use standard va_args macros instead of
VA_START() etc") fixed a 32-bit RISC-V build error, but broke the
functionality of the InstallMultipleProtocolInterfaces() and
UninstallMultipleProtocolInterfaces() wrapper functions.  GCC does not
automatically check the ABI of the current function when using the
__builtin_va_start() and related macros, and it is therefore necessary
for code to use __builtin_ms_va_start() etc from within functions
marked as EFIAPI.

Since commit 9016f2e ("[efi] Skip including the EDK2 ProcessorBind.h
header for 32-bit RISC-V") has now fixed the original 32-bit RISC-V
build error, we can switch back to using the EDK2 VA_START() etc
macros to obtain the correct behaviour.

Signed-off-by: Michael Brown <mcb30@ipxe.org>
3 months ago[efi] Skip including the EDK2 ProcessorBind.h header for 32-bit RISC-V
Michael Brown [Tue, 11 Nov 2025 14:38:59 +0000 (14:38 +0000)] 
[efi] Skip including the EDK2 ProcessorBind.h header for 32-bit RISC-V

We currently include the EDK2 RiscV64/ProcessorBind.h header when
building for 32-bit RISC-V, as a placeholder since there is no support
for 32-bit RISC-V in upstream EDK2.

This causes errors when attempting to use the EDK2 VA_START() et al
macros, since RiscV64/ProcessorBind.h ends up defining UINTN with a
size different from the size of a pointer.

Fix by falling back to the generic definitions for UINTN etc (as used
for EFI_HOSTONLY) whenever we don't have an architecture-specific
ProcessorBind.h header available.

Signed-off-by: Michael Brown <mcb30@ipxe.org>
3 months ago[pci] Move ECAM pci_can_probe() definition to correct header file
Michael Brown [Tue, 11 Nov 2025 13:13:54 +0000 (13:13 +0000)] 
[pci] Move ECAM pci_can_probe() definition to correct header file

Signed-off-by: Michael Brown <mcb30@ipxe.org>
3 months ago[spcr] Accept alternative type value for a 16550-compatible UART
Michael Brown [Wed, 5 Nov 2025 20:06:53 +0000 (20:06 +0000)] 
[spcr] Accept alternative type value for a 16550-compatible UART

Some systems (observed on an AWS EC2 m7i.metal-24xl instance in
eu-south-2) use the newer "16550-compatible with parameters defined in
Generic Address Structure" type value.  (There does not appear to be
any particular reason why the newer value needs to be used: the UART
is still a standard 16550 with single-byte registers.)

Accept this additional type value for a 16550-compatible UART.

Signed-off-by: Michael Brown <mcb30@ipxe.org>
3 months ago[acpi] Allow acpi_ioremap() to map a port I/O address
Michael Brown [Wed, 5 Nov 2025 17:39:43 +0000 (17:39 +0000)] 
[acpi] Allow acpi_ioremap() to map a port I/O address

Assume that on any platforms where port I/O is used (i.e. x86), a port
I/O address may be used directly for the combined MMIO and port I/O
accessors without requiring an explicit mapping operation.

Signed-off-by: Michael Brown <mcb30@ipxe.org>
3 months ago[ioapi] Allow iounmap() to be called for port I/O addresses
Michael Brown [Wed, 5 Nov 2025 17:29:39 +0000 (17:29 +0000)] 
[ioapi] Allow iounmap() to be called for port I/O addresses

Allow code using the combined MMIO and port I/O accessors to safely
call iounmap() to unmap the MMIO or port I/O region.

In the virtual offset I/O mapping API as used for UEFI, 32-bit BIOS,
and 32-bit RISC-V SBI, iounmap() is a no-op anyway.  In 64-bit RISC-V
SBI, we have no concept of port I/O and so the issue is moot.

This leaves only 64-bit BIOS, where it suffices to simply do nothing
for any pages outside of the chosen MMIO virtual address range.

For symmetry, we implement the equivalent change in the very closely
related RISC-V page management code.

Signed-off-by: Michael Brown <mcb30@ipxe.org>
3 months ago[spcr] Use the serial port defined by the ACPI SPCR by default
Michael Brown [Wed, 5 Nov 2025 14:19:56 +0000 (14:19 +0000)] 
[spcr] Use the serial port defined by the ACPI SPCR by default

On platforms where we expect ACPI tables to exist, use the serial port
defined by the ACPI Serial Port Console Redirection (SPCR) table by
default, falling back to the fixed serial port defined at build time.

Signed-off-by: Michael Brown <mcb30@ipxe.org>
3 months ago[spcr] Add support for the ACPI Serial Port Console Redirection table
Michael Brown [Wed, 5 Nov 2025 14:12:57 +0000 (14:12 +0000)] 
[spcr] Add support for the ACPI Serial Port Console Redirection table

The BIOS may provide an ACPI Serial Port Console Redirection (SPCR)
table to describe the serial port to be used for early boot messages.

Add support for parsing the SPCR and instantiating a 16550-based UART.
We do not currently attempt to support other types of UART, since iPXE
does not yet have drivers for other types.

Signed-off-by: Michael Brown <mcb30@ipxe.org>
3 months ago[acpi] Add acpi_ioremap() to map an ACPI-described address
Michael Brown [Wed, 5 Nov 2025 14:07:27 +0000 (14:07 +0000)] 
[acpi] Add acpi_ioremap() to map an ACPI-described address

An ACPI Generic Address Structure (GAS) may be used to describe the
location of a peripheral such as an early boot console.  Add the
relevant definitions and provide acpi_ioremap() as a helper function
to map a region described using this structure.

Signed-off-by: Michael Brown <mcb30@ipxe.org>
3 months ago[uart] Make baud rate a property of the UART
Michael Brown [Wed, 5 Nov 2025 12:16:22 +0000 (12:16 +0000)] 
[uart] Make baud rate a property of the UART

Make the current baud rate (if specified) a property of the UART, to
allow the default_serial_console() function to specify the default
baud rate as well as the default UART device.

Signed-off-by: Michael Brown <mcb30@ipxe.org>
3 months ago[uart] Support 16550 UARTs accessed via either MMIO or port I/O
Michael Brown [Tue, 4 Nov 2025 16:43:44 +0000 (16:43 +0000)] 
[uart] Support 16550 UARTs accessed via either MMIO or port I/O

Use the combined accessors ioread8() and iowrite8() to read and write
16550 UART registers, to allow the decision between using MMIO and
port I/O to be made at runtime.

Minimise the increase in code size for x86 by ignoring the register
shift, since this is essentially used only for non-x86 SoCs.

Signed-off-by: Michael Brown <mcb30@ipxe.org>
3 months ago[ioapi] Provide combined MMIO and port I/O accessors
Michael Brown [Tue, 4 Nov 2025 16:19:03 +0000 (16:19 +0000)] 
[ioapi] Provide combined MMIO and port I/O accessors

Some devices (such as a 16550 UART) may be accessed via either MMIO or
port I/O.  This is currently forced to be a compile-time decision.
For example: we currently access a 16550 UART via port I/O on x86 and
via MMIO on any other platform.

PCI UARTs with MMIO BARs do exist but are not currently supported in
an x86 build of iPXE.  Some AWS EC2 systems (observed on a c6i.metal
instance in eu-west-2) provide only a PCI MMIO UART, and it is
therefore currently impossible to get serial output from iPXE on these
instance types.

Add ioread8(), ioread16(), etc accessors that will select between MMIO
and port I/O at the point of use.  For non-x86 platforms where we
currently have no port I/O support, these simply become wrappers
around the corresponding readb(), readw(), etc MMIO accessors.  On
x86, we use the fairly well-known trick of treating any 16-bit address
(below 64kB) as a port I/O address.

This trick works even in the i386 BIOS build of iPXE (where virtual
addresses are offset from physical addresses by a runtime constant),
since the first 64kB of the virtual address space will correspond to
the iPXE binary itself (along with its uninitialised-data space), and
so must be RAM rather than a valid MMIO address range.

Signed-off-by: Michael Brown <mcb30@ipxe.org>
3 months ago[pci] Disable decoding while setting a BAR value
Michael Brown [Wed, 29 Oct 2025 23:07:32 +0000 (23:07 +0000)] 
[pci] Disable decoding while setting a BAR value

Setting the base address for a 64-bit BAR requires two separate 32-bit
writes to configuration space, and so will necessarily result in the
BAR temporarily holding an invalid partially written address.

Some hypervisors (observed on an AWS EC2 c7a.medium instance in
eu-west-2) will assume that guests will write BAR values only while
decoding is disabled, and may not rebuild MMIO mappings for the guest
if the BAR registers are written while decoding is enabled.  The
effect of this is that MMIO accesses are not routed through to the
device even though inspection from within the guest shows that every
single PCI configuration register has the correct value.  Writes to
the device will be ignored, and reads will return the all-ones pattern
that typically indicates a nonexistent device.

With the ENA network driver now using low latency transmit queues,
this results in the transmit descriptors being lost (since the MMIO
writes to BAR2 never reach the device), which in turn causes the
device to lock up as soon as the transmit doorbell is rung for the
first time.

Fix by disabling decoding of memory and I/O cycles while setting a BAR
address (as we already do while sizing a BAR), so that the invalid
partial address can never be decoded and so that hypervisors will
rebuild MMIO mappings as expected.

Signed-off-by: Michael Brown <mcb30@ipxe.org>
3 months ago[cloud] Display instance type in AWS EC2
Michael Brown [Wed, 29 Oct 2025 13:18:28 +0000 (13:18 +0000)] 
[cloud] Display instance type in AWS EC2

Experiments suggest that the instance type is exposed via the SMBIOS
product name.  Include this information within the default output,
since it is often helpful in debugging.

Signed-off-by: Michael Brown <mcb30@ipxe.org>
3 months ago[ena] Leave queue base address empty when creating a low latency queue
Michael Brown [Mon, 27 Oct 2025 12:41:36 +0000 (12:41 +0000)] 
[ena] Leave queue base address empty when creating a low latency queue

The queue base address is meaningless for a low latency queue, since
the queue entries are written directly to the on-device memory.  Any
non-zero queue base address will be safely ignored by the hardware,
but leaves open the possibility that future revisions could treat it
as an error.

Leave this field as zero, to match the behaviour of the Linux driver.

Signed-off-by: Michael Brown <mcb30@ipxe.org>
3 months ago[riscv] Correct page table stride calculation
Michael Brown [Mon, 27 Oct 2025 14:04:08 +0000 (14:04 +0000)] 
[riscv] Correct page table stride calculation

Signed-off-by: Michael Brown <mcb30@ipxe.org>
3 months ago[librm] Correct page table stride calculation
Michael Brown [Mon, 27 Oct 2025 14:02:50 +0000 (14:02 +0000)] 
[librm] Correct page table stride calculation

Signed-off-by: Michael Brown <mcb30@ipxe.org>
3 months ago[cloud] Display build architecture in AWS EC2
Michael Brown [Mon, 20 Oct 2025 11:35:36 +0000 (12:35 +0100)] 
[cloud] Display build architecture in AWS EC2

On some newer (7th and 8th generation) instance types, the 32-bit
build of iPXE cannot access PCI configuration space since the ECAM is
placed outside of the 32-bit address space.  The visible symptom is
that iPXE fails to detect any network devices.

The public AMIs are all now built as 64-bit binaries, but there is
nothing that prevents the building and importing of a 32-bit AMI.
There are still potentially valid use cases for 32-bit AMIs (e.g. if
planning to use the AMI only for older instance types), and so we
cannot sensibly prevent this error at build time.

Display the build architecture as part of the AWS EC2 embedded script,
to at least allow for easy identification of this particular failure
mode at run time.

Signed-off-by: Michael Brown <mcb30@ipxe.org>
3 months ago[cloud] Remove AWS public image access block only if not already unblocked
Michael Brown [Mon, 20 Oct 2025 11:56:34 +0000 (12:56 +0100)] 
[cloud] Remove AWS public image access block only if not already unblocked

Signed-off-by: Michael Brown <mcb30@ipxe.org>
4 months ago[cloud] Remove AWS public image access block automatically if needed
Michael Brown [Fri, 17 Oct 2025 13:21:06 +0000 (14:21 +0100)] 
[cloud] Remove AWS public image access block automatically if needed

Making images public is blocked by default in new AWS regions.  Remove
this block automatically whenever creating a public image.

Signed-off-by: Michael Brown <mcb30@ipxe.org>
4 months ago[ena] Limit receive queue size to work around hardware bugs
Michael Brown [Fri, 17 Oct 2025 11:35:11 +0000 (12:35 +0100)] 
[ena] Limit receive queue size to work around hardware bugs

Commit a801244 ("[ena] Increase receive ring size to 128 entries")
increased the receive ring size to 128 entries (while leaving the fill
level at 16), since using a smaller receive ring caused unexplained
failures on some instance types.

The original hardware bug that resulted in that commit seems to have
been fixed: experiments suggest that the original failure (observed on
a c6i.large instance in eu-west-2) will no longer reproduce when using
a receive ring containing only 16 entries (as was the case prior to
that commit).

Newer generations of the ENA hardware (observed on an m8i.large
instance in eu-south-2) seem to have a new and exciting hardware bug:
these instance types appear to use a hash of the received packet
header to determine which portion of the (out-of-order) receive ring
to use.  If that portion of the ring happens to be empty (e.g. because
only 32 entries of the 128-entry ring are filled at any one time),
then the packet will be silently dropped.

Work around this new hardware bug by reducing the receive ring size
down to the current fill level of 32 entries.  This appears to work on
all current instance types (but has not been exhaustively tested).

Signed-off-by: Michael Brown <mcb30@ipxe.org>
4 months ago[ena] Increase transmit queue size to match receive fill level
Michael Brown [Fri, 17 Oct 2025 12:24:16 +0000 (13:24 +0100)] 
[ena] Increase transmit queue size to match receive fill level

Avoid running out of transmit descriptors when sending TCP ACKs by
increasing the transmit queue size to match the increased received
fill level.

Signed-off-by: Michael Brown <mcb30@ipxe.org>
4 months ago[ena] Add memory barrier after writing to on-device memory
Michael Brown [Fri, 17 Oct 2025 11:34:03 +0000 (12:34 +0100)] 
[ena] Add memory barrier after writing to on-device memory

Ensure that writes to on-device memory have taken place before writing
to the doorbell register.

Signed-off-by: Michael Brown <mcb30@ipxe.org>
4 months ago[ena] Increase receive fill level
Michael Brown [Thu, 16 Oct 2025 15:33:38 +0000 (16:33 +0100)] 
[ena] Increase receive fill level

Experiments suggest that at least some instance types (observed with
c6i.large in eu-west-2) experience high packet drop rates with only 16
receive buffers allocated.  Increase the fill level to 32 buffers.

Signed-off-by: Michael Brown <mcb30@ipxe.org>
4 months ago[ena] Add support for low latency transmit queues
Michael Brown [Thu, 16 Oct 2025 14:58:23 +0000 (15:58 +0100)] 
[ena] Add support for low latency transmit queues

Newer generations of the ENA hardware require the use of low latency
transmit queues, where the submission queues and the initial portion
of the transmitted packet are written to on-device memory via BAR2
instead of being read from host memory.

Detect support for low latency queues and set the placement policy
appropriately.  We attempt the use of low latency queues only if the
device reports that it supports inline headers, 128-byte entries, and
two descriptors prior to the inlined header, on the basis that we
don't care about using low latency queues on older versions of the
hardware since those versions will support normal host memory
submission queues anyway.

We reuse the redundant memory allocated for the submission queue as
the bounce buffer for constructing the descriptors and inlined packet
data, since this avoids needing a separate allocation just for the
bounce buffer.

We construct a metadata submission queue entry prior to the actual
submission queue entry, since experimentation suggests that newer
generations of the hardware require this to be present even though it
conveys no information beyond its own existence.

Signed-off-by: Michael Brown <mcb30@ipxe.org>
4 months ago[ena] Record supported device features
Michael Brown [Thu, 16 Oct 2025 14:53:47 +0000 (15:53 +0100)] 
[ena] Record supported device features

Signed-off-by: Michael Brown <mcb30@ipxe.org>
4 months ago[ena] Cancel uncompleted transmit buffers on close
Michael Brown [Thu, 16 Oct 2025 15:31:03 +0000 (16:31 +0100)] 
[ena] Cancel uncompleted transmit buffers on close

Avoid spurious assertion failures by ensuring that references to
uncompleted transmit buffers are not retained after the device has
been closed.

Signed-off-by: Michael Brown <mcb30@ipxe.org>
4 months ago[ena] Map the on-device memory, if present
Michael Brown [Wed, 15 Oct 2025 14:27:03 +0000 (15:27 +0100)] 
[ena] Map the on-device memory, if present

Newer generations of the ENA hardware require the use of low latency
transmit queues, where the submission queues and the initial portion
of the transmitted packet are written to on-device memory via BAR2
instead of being read from host memory.

Prepare for this by mapping the on-device memory BAR.  As with the
register BAR, we may need to steal a base address from the upstream
PCI bridge since the BIOS on some instance types (observed with an
m8i.metal-48xl instance in eu-south-2) will fail to assign an address
to the device.

Signed-off-by: Michael Brown <mcb30@ipxe.org>
4 months ago[ena] Add descriptive messages for any admin queue command failures
Michael Brown [Wed, 15 Oct 2025 11:00:42 +0000 (12:00 +0100)] 
[ena] Add descriptive messages for any admin queue command failures

Signed-off-by: Michael Brown <mcb30@ipxe.org>
4 months ago[pci] Record prefetchable memory window for PCI bridges
Michael Brown [Tue, 14 Oct 2025 17:37:39 +0000 (18:37 +0100)] 
[pci] Record prefetchable memory window for PCI bridges

Signed-off-by: Michael Brown <mcb30@ipxe.org>
4 months ago[ena] Use pci_bar_set() to place device within bridge memory window
Michael Brown [Tue, 14 Oct 2025 13:44:56 +0000 (14:44 +0100)] 
[ena] Use pci_bar_set() to place device within bridge memory window

Use pci_bar_set() when we need to set a device base address (on
instance types such as c6i.metal where the BIOS fails to do so), so
that 64-bit BARs will be handled automatically.

This particular issue has so far been observed only on 6th generation
instances.  These use 32-bit BARs, and so the lack of support for
handling 64-bit BARs has not caused any observable issue.

Signed-off-by: Michael Brown <mcb30@ipxe.org>
4 months ago[pci] Handle sizing of 64-bit BARs
Michael Brown [Tue, 14 Oct 2025 12:46:54 +0000 (13:46 +0100)] 
[pci] Handle sizing of 64-bit BARs

Provide pci_bar_set() to handle setting the base address for a
potentially 64-bit BAR, and rewrite pci_bar_size() to correctly handle
sizing of 64-bit BARs.

Signed-off-by: Michael Brown <mcb30@ipxe.org>
4 months ago[tls] Disable renegotiation unless extended master secret is used
Michael Brown [Sun, 12 Oct 2025 21:37:49 +0000 (22:37 +0100)] 
[tls] Disable renegotiation unless extended master secret is used

RFC 7627 states that renegotiation becomes no longer secure under
various circumstances when the non-extended master secret is used.
The description of the precise set of circumstances is spread across
various points within the document and is not entirely clear.

Avoid a superset of the circumstances in which renegotiation
apparently becomes insecure by refusing renegotiation completely
unless the extended master secret is used.

Signed-off-by: Michael Brown <mcb30@ipxe.org>
4 months ago[tls] Refuse to resume sessions with mismatched master secret methods
Michael Brown [Sun, 12 Oct 2025 21:29:33 +0000 (22:29 +0100)] 
[tls] Refuse to resume sessions with mismatched master secret methods

RFC 7627 section 5.3 states that the client must abort the handshake
if the server attempts to resume a session where the master secret
calculation method stored in the session does not match the method
used for the connection being resumed.

Signed-off-by: Michael Brown <mcb30@ipxe.org>
4 months ago[tls] Add support for the Extended Master Secret
Michael Brown [Sun, 12 Oct 2025 21:26:49 +0000 (22:26 +0100)] 
[tls] Add support for the Extended Master Secret

RFC 7627 defines the Extended Master Secret (EMS) as an alternative
calculation that uses the digest of all handshake messages rather than
just the client and server random bytes.

Add support for negotiating the Extended Master Secret extension and
performing the relevant calculation of the master secret.

Signed-off-by: Michael Brown <mcb30@ipxe.org>