]> git.ipfire.org Git - thirdparty/iptables.git/log
thirdparty/iptables.git
4 years agoebtables: Exit gracefully on invalid table names
Phil Sutter [Thu, 28 Jan 2021 00:09:56 +0000 (01:09 +0100)] 
ebtables: Exit gracefully on invalid table names

Users are able to cause program abort by passing a table name that
doesn't exist:

| # ebtables-nft -t dummy -P INPUT ACCEPT
| ebtables: nft-cache.c:455: fetch_chain_cache: Assertion `t' failed.
| Aborted

Avoid this by checking table existence just like iptables-nft does upon
parsing '-t' optarg. Since the list of tables is known and fixed,
checking the given name's length is pointless. So just drop that check
in return.

With this patch in place, output looks much better:

| # ebtables-nft -t dummy -P INPUT ACCEPT
| ebtables v1.8.7 (nf_tables): table 'dummy' does not exist
| Perhaps iptables or your kernel needs to be upgraded.

Signed-off-by: Phil Sutter <phil@nwl.cc>
4 years agoconfigure: bump version for 1.8.7 release v1.8.7
Pablo Neira Ayuso [Wed, 13 Jan 2021 15:47:07 +0000 (16:47 +0100)] 
configure: bump version for 1.8.7 release

Update libtool version for libxtables since two new interfaces have been
added:

- xtables_parse_mac_and_mask()
- xtables_print_well_known_mac_and_mask()

Signed-off-by: Pablo Neira Ayuso <pablo@netfilter.org>
4 years agotests/shell: Fix nft-only/0009-needless-bitwise_0
Phil Sutter [Fri, 15 Jan 2021 20:58:48 +0000 (21:58 +0100)] 
tests/shell: Fix nft-only/0009-needless-bitwise_0

For whatever reason, stored expected output contains false handles. To
overcome this, filter the rule data lines from both expected and stored
output before comparing.

Fixes: 81a2e12851283 ("tests/shell: Add test for bitwise avoidance fixes")
Signed-off-by: Phil Sutter <phil@nwl.cc>
4 years agonft: Avoid pointless table/chain creation
Phil Sutter [Fri, 10 Jul 2020 16:23:50 +0000 (18:23 +0200)] 
nft: Avoid pointless table/chain creation

Accept a chain name in nft_xt_builtin_init() to limit the base chain
creation to that specific chain only.

Introduce nft_xt_builtin_table_init() to create just the table for
situations where no builtin chains are needed but the command may still
succeed in an empty ruleset, particularly when creating a custom chain,
restoring base chains or adding a set for ebtables among match.

Introduce nft_xt_fake_builtin_chains(), a function to call after cache
has been populated to fill empty base chain slots. This keeps ruleset
listing output intact if some base chains do not exist (or even the
whole ruleset is completely empty).

Signed-off-by: Phil Sutter <phil@nwl.cc>
4 years agotests: shell: Drop any dump sorting in place
Phil Sutter [Mon, 6 Jul 2020 16:40:16 +0000 (18:40 +0200)] 
tests: shell: Drop any dump sorting in place

With iptables-nft-save output now sorted just like legacy one, no
sorting to unify them is needed anymore.

Signed-off-by: Phil Sutter <phil@nwl.cc>
4 years agonft: cache: Sort custom chains by name
Phil Sutter [Thu, 30 Jul 2020 08:24:10 +0000 (10:24 +0200)] 
nft: cache: Sort custom chains by name

With base chains no longer residing in the tables' chain lists, they can
easily be sorted upon insertion. This on one hand aligns custom chain
ordering with legacy iptables and on the other makes it predictable,
which is very helpful when manually comparing ruleset dumps for
instance.

Adjust the one ebtables-nft test case this change breaks (as wrong
ordering is expected in there). The manual output sorting done for tests
which apply to legacy as well as nft is removed in a separate patch.

Signed-off-by: Phil Sutter <phil@nwl.cc>
4 years agonft: Introduce a dedicated base chain array
Phil Sutter [Tue, 7 Jul 2020 09:43:26 +0000 (11:43 +0200)] 
nft: Introduce a dedicated base chain array

Preparing for sorted chain output, introduce a per-table array holding
base chains indexed by nf_inet_hooks value. Since the latter is ordered
correctly, iterating over the array will return base chains in expected
order.

Signed-off-by: Phil Sutter <phil@nwl.cc>
4 years agonft: Introduce struct nft_chain
Phil Sutter [Wed, 29 Jul 2020 12:33:33 +0000 (14:33 +0200)] 
nft: Introduce struct nft_chain

Preparing for ordered output of user-defined chains, introduce a local
datatype wrapping nftnl_chain. In order to maintain the chain name hash
table, introduce nft_chain_list as well and use it instead of
nftnl_chain_list.

Signed-off-by: Phil Sutter <phil@nwl.cc>
4 years agonft: cache: Move nft_chain_find() over
Phil Sutter [Thu, 10 Sep 2020 14:19:44 +0000 (16:19 +0200)] 
nft: cache: Move nft_chain_find() over

It is basically just a cache lookup, hence fits better in here.

Signed-off-by: Phil Sutter <phil@nwl.cc>
4 years agonft: Implement nft_chain_foreach()
Phil Sutter [Wed, 8 Jul 2020 14:09:52 +0000 (16:09 +0200)] 
nft: Implement nft_chain_foreach()

This is just a fancy wrapper around nftnl_chain_list_foreach() with the
added benefit of detecting invalid table names or uninitialized chain
lists. This in turn allows to drop the checks in flush_rule_cache() and
ignore the return code of nft_chain_foreach() as it fails only if the
dropped checks had failed, too.

Since this wrapper does the chain list lookup by itself, use of
nft_chain_list_get() shrinks down to a single place, namely inside
nft_chain_find(). Therefore fold it into the latter.

Signed-off-by: Phil Sutter <phil@nwl.cc>
4 years agonft: cache: Introduce nft_cache_add_chain()
Phil Sutter [Fri, 10 Jul 2020 19:37:38 +0000 (21:37 +0200)] 
nft: cache: Introduce nft_cache_add_chain()

This is a convenience function for adding a chain to cache, for now just
a simple wrapper around nftnl_chain_list_add_tail().

Signed-off-by: Phil Sutter <phil@nwl.cc>
4 years agonft: Fix selective chain compatibility checks
Phil Sutter [Wed, 23 Sep 2020 17:13:45 +0000 (19:13 +0200)] 
nft: Fix selective chain compatibility checks

Since commit 80251bc2a56ed ("nft: remove cache build calls"), 'chain'
parameter passed to nft_chain_list_get() is no longer effective.
Before, it was used to fetch only that single chain from kernel when
populating the cache. So the returned list of chains for which
compatibility checks are done would contain only that single chain.

Re-establish the single chain compat checking by introducing a dedicated
code path to nft_is_chain_compatible() doing so.

Fixes: 80251bc2a56ed ("nft: remove cache build calls")
Signed-off-by: Phil Sutter <phil@nwl.cc>
4 years agoxtables-monitor:
Florian Westphal [Mon, 14 Dec 2020 16:11:23 +0000 (17:11 +0100)] 
xtables-monitor:

'LL=0x304' is not very convenient, print LOOPBACK instead.

Signed-off-by: Florian Westphal <fw@strlen.de>
4 years agoxtables-monitor: print packet first
Florian Westphal [Sat, 12 Dec 2020 15:15:34 +0000 (16:15 +0100)] 
xtables-monitor: print packet first

The trace mode should first print the packet that was received and
then the rule/verdict.

Furthermore, the monitor did sometimes print an extra newline.

After this patch, output is more consistent with nft monitor.

Signed-off-by: Florian Westphal <fw@strlen.de>
4 years agoxtables-monitor: fix packet family protocol
Florian Westphal [Sat, 12 Dec 2020 15:15:33 +0000 (16:15 +0100)] 
xtables-monitor: fix packet family protocol

This prints the family passed on the command line (which might be 0).
Print the table family instead.

Signed-off-by: Florian Westphal <fw@strlen.de>
4 years agoxtables-monitor: fix rule printing
Florian Westphal [Sat, 12 Dec 2020 15:15:32 +0000 (16:15 +0100)] 
xtables-monitor: fix rule printing

trace_print_rule does a rule dump.  This prints unrelated rules
in the same chain.  Instead the function should only request the
specific handle.

Furthermore, flush output buffer afterwards so this plays nice when
output isn't a terminal.

Signed-off-by: Florian Westphal <fw@strlen.de>
4 years agoextensions: dccp: Fix for DCCP type 'INVALID'
Phil Sutter [Wed, 2 Dec 2020 12:37:06 +0000 (13:37 +0100)] 
extensions: dccp: Fix for DCCP type 'INVALID'

Support for matching on invalid DCCP type field values was pretty
broken: While RFC4340 declares any type value from 10 to 15 invalid, the
extension's type name 'INVALID' mapped to type value 10 only. Fix this
by introduction of INVALID_OTHER_TYPE_MASK which has the remaining
invalid type's bits set and apply it if bit 10 is set after parsing the
type list. When printing, stop searching type names after printing
'INVALID' - unless numeric output was requested. The latter prints all
actual type values. Since parsing types in numeric form is not
supported, changing the output should not break existing scripts.

When translating into nftables syntax, the code returned prematurely if
'INVALID' was among the list of types - thereby emitting invalid syntax.
Instead print a real match for invalid types by use of a range
expression.

While being at it, fix syntax of translator output: If only
'--dccp-types' was translated, the output contained an extra 'dccp'. On
the other hand, if '--sport' and '--dport' was present, a required
'dccp' between the translations of both was missing.

Fixes: e40b11d7ef827 ("add support for new 'dccp' protocol match")
Fixes: c94a998724143 ("extensions: libxt_dccp: Add translation to nft")
Signed-off-by: Phil Sutter <phil@nwl.cc>
4 years agotests/shell: Test for fixed extension registration
Phil Sutter [Fri, 4 Dec 2020 16:44:51 +0000 (17:44 +0100)] 
tests/shell: Test for fixed extension registration

Use strace to look at iptables-restore behaviour with typically
problematic input (conntrack revision 0 is no longer supported by
current kernels) to make sure the fix in commit a1eaaceb0460b
("libxtables: Simplify pending extension registration") is still
effective.

Signed-off-by: Phil Sutter <phil@nwl.cc>
4 years agoxshared: Merge some command option-related code
Phil Sutter [Fri, 30 Oct 2020 11:42:57 +0000 (12:42 +0100)] 
xshared: Merge some command option-related code

Add OPT_FRAGMENT define into the enum of other OPT_* defines at the
right position and adjust the arptables-specific ones that follow
accordingly. Appropriately adjust inverse_for_options array in
xtables-arp.c.

Extend optflags from iptables.c by the arptables values for the sake of
completeness, then move it to xshared.h along with NUMBER_OF_OPT
definition. As a side-effect, this fixes for wrong ordering of entries
in arptables' 'optflags' copy.

Add arptables-specific bits to commands_v_options table (the speicific
options are matches on ARP header fields, just treat them like '-s'
option. This is also just a cosmetic change, arptables doesn't have a
generic_opt_check() implementation and hence doesn't use such a table.

With things potentially ready for common use, move commands_v_options
table along with generic_opt_check() and opt2char() into xshared.c and
drop the local (identical) implementations from iptables.c, ip6tables.c
xtables.c and xtables-arp.c. While doing so, fix ordering of entries in
that table: the row for CMD_ZERO_NUM was in the wrong position. Since
all moved rows though are identical, this had no effect in practice.

Fixes: d960a991350ca ("xtables-arp: Integrate OPT_* defines into xshared.h")
Fixes: 384958620abab ("use nf_tables and nf_tables compatibility interface")
Signed-off-by: Phil Sutter <phil@nwl.cc>
4 years agoxtables-arp: Don't use ARPT_INV_*
Phil Sutter [Tue, 3 Nov 2020 11:21:29 +0000 (12:21 +0100)] 
xtables-arp: Don't use ARPT_INV_*

Arptables invflags are partly identical to IPT_INV_* ones but the bits
are differently assigned. Eliminate this incompatibility by definition
of the unique invflags in nft-arp.h on bits that don't collide with
IPT_INV_* ones, then use those in combination with IPT_INV_* ones in
arptables-specific code.

Note that ARPT_INV_ARPPRO is replaced by IPT_INV_PROTO although these
are in fact different options - yet since '-p' option is not supported
by arptables, this does not lead to a collision.

Signed-off-by: Phil Sutter <phil@nwl.cc>
4 years agolibxtables: Extend MAC address printing/parsing support
Phil Sutter [Tue, 3 Nov 2020 11:08:39 +0000 (12:08 +0100)] 
libxtables: Extend MAC address printing/parsing support

Adding a parser which supports common names for special MAC/mask
combinations and a print routine detecting those special addresses and
printing the respective name allows to consolidate all the various
duplicated implementations.

The side-effects of this change are manageable:

* arptables now accepts "BGA" as alias for the bridge group address
* "mac" match now prints MAC addresses in lower-case which is consistent
  with the remaining code at least

Signed-off-by: Phil Sutter <phil@nwl.cc>
4 years agoiptables-test.py: Try to unshare netns by default
Phil Sutter [Tue, 17 Nov 2020 18:00:45 +0000 (19:00 +0100)] 
iptables-test.py: Try to unshare netns by default

If user did not explicitly requst to "test netnamespace path", try an
import of 'unshare' module and call unshare() to avoid killing the local
host's network by accident.

Signed-off-by: Phil Sutter <phil@nwl.cc>
4 years agoiptables-test.py: Accept multiple test files on commandline
Phil Sutter [Tue, 17 Nov 2020 15:18:33 +0000 (16:18 +0100)] 
iptables-test.py: Accept multiple test files on commandline

This allows to call the script like so:

| # ./iptables-test.py -n extensions/libebt_*.t

Signed-off-by: Phil Sutter <phil@nwl.cc>
4 years agoebtables: Fix for broken chain renaming
Phil Sutter [Tue, 17 Nov 2020 10:38:27 +0000 (11:38 +0100)] 
ebtables: Fix for broken chain renaming

Loading extensions pollutes 'errno' value, hence before using it to
indicate failure it should be sanitized. This was done by the called
function before the parsing/netlink split and not migrated by accident.
Move it into calling code to clarify the connection.

Fixes: a7f1e208cdf9c ("nft: split parsing from netlink commands")
Signed-off-by: Phil Sutter <phil@nwl.cc>
4 years agotests: shell: update format of registers in bitwise payloads.
Pablo Neira Ayuso [Mon, 16 Nov 2020 09:37:41 +0000 (10:37 +0100)] 
tests: shell: update format of registers in bitwise payloads.

libnftnl has been changed to bring the format of registers in bitwise
dumps in line with those in other types of expression.  Update the
expected output of Python test-cases.

Signed-off-by: Pablo Neira Ayuso <pablo@netfilter.org>
4 years agotests/shell: Add test for bitwise avoidance fixes
Phil Sutter [Tue, 10 Nov 2020 13:50:46 +0000 (14:50 +0100)] 
tests/shell: Add test for bitwise avoidance fixes

Masked address matching was recently improved to avoid bitwise
expression if the given mask covers full bytes. Make use of nft netlink
debug output to assert iptables-nft generates the right bytecode for
each situation.

Signed-off-by: Phil Sutter <phil@nwl.cc>
4 years agoebtables: Optimize masked MAC address matches
Phil Sutter [Fri, 30 Oct 2020 13:08:33 +0000 (14:08 +0100)] 
ebtables: Optimize masked MAC address matches

Just like with class-based prefix matches in iptables-nft, optimize
masked MAC address matches if the mask is on a byte-boundary.

To reuse the logic in add_addr(), extend it to accept the payload base
value via parameter.

Signed-off-by: Phil Sutter <phil@nwl.cc>
4 years agonft: Optimize class-based IP prefix matches
Phil Sutter [Fri, 2 Oct 2020 07:44:38 +0000 (09:44 +0200)] 
nft: Optimize class-based IP prefix matches

Payload expression works on byte-boundaries, leverage this with suitable
prefix lengths.

Signed-off-by: Phil Sutter <phil@nwl.cc>
4 years agoconfigure: bump version for 1.8.6 release v1.8.6
Pablo Neira Ayuso [Sat, 31 Oct 2020 17:26:57 +0000 (18:26 +0100)] 
configure: bump version for 1.8.6 release

Signed-off-by: Pablo Neira Ayuso <pablo@netfilter.org>
4 years agotests: shell: Improve concurrent noflush restore test a bit
Phil Sutter [Mon, 26 Oct 2020 16:25:03 +0000 (17:25 +0100)] 
tests: shell: Improve concurrent noflush restore test a bit

The described issue happens only if chain FOO does not exist at program
start so flush the ruleset after each iteration to make sure this is the
case. Sadly the bug is still not 100% reproducible on my testing VM.

While being at it, add a paragraph describing what exact situation the
test is trying to provoke.

Fixes: dac904bdcd9a1 ("nft: Fix for concurrent noflush restore calls")
Signed-off-by: Phil Sutter <phil@nwl.cc>
4 years agonft: Fix for concurrent noflush restore calls
Phil Sutter [Mon, 5 Oct 2020 14:06:49 +0000 (16:06 +0200)] 
nft: Fix for concurrent noflush restore calls

Transaction refresh was broken with regards to nft_chain_restore(): It
created a rule flush batch object only if the chain was found in cache
and a chain add object only if the chain was not found. Yet with
concurrent ruleset updates, one has to expect both situations:

* If a chain vanishes, the rule flush job must be skipped and instead
  the chain add job become active.

* If a chain appears, the chain add job must be skipped and instead
  rules flushed.

Change the code accordingly: Create both batch objects and set their
'skip' field depending on the situation in cache and adjust both in
nft_refresh_transaction().

As a side-effect, the implicit rule flush becomes explicit and all
handling of implicit batch jobs is dropped along with the related field
indicating such.

Reuse the 'implicit' parameter of __nft_rule_flush() to control the
initial 'skip' field value instead.

A subtle caveat is vanishing of existing chains: Creating the chain add
job based on the chain in cache causes a netlink message containing that
chain's handle which the kernel dislikes. Therefore unset the chain's
handle in that case.

Fixes: 58d7de0181f61 ("xtables: handle concurrent ruleset modifications")
Signed-off-by: Phil Sutter <phil@nwl.cc>
4 years agolibiptc: Avoid gcc-10 zero-length array warning
Phil Sutter [Thu, 8 Oct 2020 12:51:52 +0000 (14:51 +0200)] 
libiptc: Avoid gcc-10 zero-length array warning

Gcc-10 doesn't like the use of zero-length arrays as last struct member
to denote variable sized objects. The suggested alternative, namely to
use a flexible array member as defined by C99, is problematic as that
doesn't allow for said struct to be embedded into others. With the
relevant structs being part of kernel UAPI, this can't be precluded
though.

The call to memcpy() which triggers the warning copies data from one
struct xt_counters to another. Since this struct is flat and merely
contains two u64 fields, One can use direct assignment instead which
avoids the warning.

Signed-off-by: Phil Sutter <phil@nwl.cc>
4 years agoiptables-nft: fix basechain policy configuration
Pablo Neira Ayuso [Fri, 2 Oct 2020 11:44:36 +0000 (13:44 +0200)] 
iptables-nft: fix basechain policy configuration

Previous to this patch, the basechain policy could not be properly
configured if it wasn't explictly set when loading the ruleset, leading
to iptables-nft-restore (and ip6tables-nft-restore) trying to send an
invalid ruleset to the kernel.

Signed-off-by: Arturo Borrero Gonzalez <arturo@netfilter.org>
Signed-off-by: Pablo Neira Ayuso <pablo@netfilter.org>
4 years agonft: Fix error reporting for refreshed transactions
Phil Sutter [Mon, 5 Oct 2020 13:54:35 +0000 (15:54 +0200)] 
nft: Fix error reporting for refreshed transactions

When preparing a batch from the list of batch objects in nft_action(),
the sequence number used for each object is stored within that object
for later matching against returned error messages. Though if the
transaction has to be refreshed, some of those objects may be skipped,
other objects take over their sequence number and errors are matched to
skipped objects. Avoid this by resetting the skipped object's sequence
number to zero.

Fixes: 58d7de0181f61 ("xtables: handle concurrent ruleset modifications")
Signed-off-by: Phil Sutter <phil@nwl.cc>
Reviewed-by: Florian Westphal <fw@strlen.de>
4 years agonft: Make batch_add_chain() return the added batch object
Phil Sutter [Sat, 3 Oct 2020 15:46:09 +0000 (17:46 +0200)] 
nft: Make batch_add_chain() return the added batch object

Do this so in a later patch the 'skip' field can be adjusted.

While being at it, simplify a few callers and eliminate the need for a
'ret' variable.

Signed-off-by: Phil Sutter <phil@nwl.cc>
Reviewed-by: Florian Westphal <fw@strlen.de>
4 years agolibxtables: Register multiple extensions in ascending order
Phil Sutter [Tue, 22 Sep 2020 18:01:15 +0000 (20:01 +0200)] 
libxtables: Register multiple extensions in ascending order

The newly introduced ordered insert algorithm in
xtables_register_{match,target}() works best if extensions of same name
are passed in ascending revisions. Since this is the case in about all
extensions' arrays, iterate over them from beginning to end.

Signed-off-by: Phil Sutter <phil@nwl.cc>
4 years agolibxtables: Simplify pending extension registration
Phil Sutter [Fri, 18 Sep 2020 16:48:14 +0000 (18:48 +0200)] 
libxtables: Simplify pending extension registration

Assuming that pending extensions are sorted by first name and family,
then descending revision, the decision where to insert a newly
registered extension may be simplified by memorizing the previous
registration (which obviously is of same name and family and higher
revision).

As a side-effect, fix for unsupported old extension revisions lingering
in pending extension list forever and being retried with every use of
the given extension. Any revision being rejected by the kernel may
safely be dropped iff a previous (read: higher) revision was accepted
already.

Yet another side-effect of this change is the removal of an unwanted
recursion by xtables_fully_register_pending_*() into itself via
xtables_find_*().

Signed-off-by: Phil Sutter <phil@nwl.cc>
4 years agolibxtables: Make sure extensions register in revision order
Phil Sutter [Mon, 21 Sep 2020 11:42:06 +0000 (13:42 +0200)] 
libxtables: Make sure extensions register in revision order

Insert extensions into pending lists in ordered fashion: Group by
extension name (and, for matches, family) and order groups by descending
revision number.

This allows to simplify the later full registration considerably. Since
that involves kernel compatibility checks, the extra cycles here pay off
eventually.

Signed-off-by: Phil Sutter <phil@nwl.cc>
4 years agoextensions: libipt_icmp: Fix translation of type 'any'
Phil Sutter [Tue, 6 Oct 2020 17:07:19 +0000 (19:07 +0200)] 
extensions: libipt_icmp: Fix translation of type 'any'

By itself, '-m icmp --icmp-type any' is a noop, it matches any icmp
types. Yet nft_ipv4_xlate() does not emit an 'ip protocol' match if
there's an extension with same name present in the rule. Luckily, legacy
iptables demands icmp match to be prepended by '-p icmp', so we can
assume this is present and just emit the 'ip protocol' match from icmp
xlate callback.

Fixes: aa158ca0fda65 ("extensions: libipt_icmp: Add translation to nft")
Signed-off-by: Phil Sutter <phil@nwl.cc>
Reviewed-by: Florian Westphal <fw@strlen.de>
4 years agonft: Fix for broken address mask match detection
Phil Sutter [Mon, 28 Sep 2020 16:57:18 +0000 (18:57 +0200)] 
nft: Fix for broken address mask match detection

Trying to decide whether a bitwise expression is needed to match parts
of a source or destination address only, add_addr() checks if all bytes
in 'mask' are 0xff or not. The check is apparently broken though as each
byte in 'mask' is cast to a signed char before comparing against 0xff,
therefore the bitwise is always added:

| # ./bad/iptables-nft -A foo -s 10.0.0.1 -j ACCEPT
| # ./good/iptables-nft -A foo -s 10.0.0.2 -j ACCEPT
| # nft --debug=netlink list chain ip filter foo
| ip filter foo 5
|   [ payload load 4b @ network header + 12 => reg 1 ]
|   [ bitwise reg 1 = (reg=1 & 0xffffffff ) ^ 0x00000000 ]
|   [ cmp eq reg 1 0x0100000a ]
|   [ counter pkts 0 bytes 0 ]
|   [ immediate reg 0 accept ]
|
| ip filter foo 6 5
|   [ payload load 4b @ network header + 12 => reg 1 ]
|   [ cmp eq reg 1 0x0200000a ]
|   [ counter pkts 0 bytes 0 ]
|   [ immediate reg 0 accept ]
|
| table ip filter {
|  chain foo {
|  ip saddr 10.0.0.1 counter packets 0 bytes 0 accept
|  ip saddr 10.0.0.2 counter packets 0 bytes 0 accept
|  }
| }

Fix the cast, safe an extra op and gain 100% performance in ideal cases.

Fixes: 56859380eb328 ("xtables-compat: avoid unneeded bitwise ops")
Signed-off-by: Phil Sutter <phil@nwl.cc>
4 years agonft: Use nft_chain_find() in nft_chain_builtin_init()
Phil Sutter [Tue, 4 Aug 2020 15:02:21 +0000 (17:02 +0200)] 
nft: Use nft_chain_find() in nft_chain_builtin_init()

The replaced code is basically identical to nft_chain_find()'s body.

Signed-off-by: Phil Sutter <phil@nwl.cc>
4 years agonft: Fold nftnl_rule_list_chain_save() into caller
Phil Sutter [Wed, 8 Jul 2020 21:03:12 +0000 (23:03 +0200)] 
nft: Fold nftnl_rule_list_chain_save() into caller

Existence of this function was mostly code-duplication: Caller already
branches depending on whether 'chain' is NULL or not and even does the
chain list lookup.

While being at it, simplify __nftnl_rule_list_chain_save function name a
bit now that the non-prefixed name is gone.

Signed-off-by: Phil Sutter <phil@nwl.cc>
4 years agonft: Extend use of nftnl_chain_list_foreach()
Phil Sutter [Wed, 8 Jul 2020 14:46:14 +0000 (16:46 +0200)] 
nft: Extend use of nftnl_chain_list_foreach()

Make use of the callback-based iterator in nft_rule_list(),
nft_rule_list_save(), nft_rule_flush() and nft_rule_save().

Callback code for nft_rule_list() and nft_rule_list_save is pretty
similar, so introduce and use a common callback function.

For nft_rule_save(), turn nft_chain_save_rules() into a callback - it is
not used anywhere else, anyway.

Signed-off-by: Phil Sutter <phil@nwl.cc>
4 years agonft: cache: Check consistency with NFT_CL_FAKE, too
Phil Sutter [Wed, 29 Jul 2020 13:39:31 +0000 (15:39 +0200)] 
nft: cache: Check consistency with NFT_CL_FAKE, too

Athough this cache level fetches table names only, it shouldn't skip the
consistency check.

Fixes: f42bfb344af82 ("nft: cache: Re-establish cache consistency check")
Signed-off-by: Phil Sutter <phil@nwl.cc>
4 years agoMakefile: Add missing man pages to CLEANFILES
Phil Sutter [Mon, 17 Aug 2020 10:29:08 +0000 (12:29 +0200)] 
Makefile: Add missing man pages to CLEANFILES

The list of man pages to remove along with 'make clean' was missing a
few built ones, add them.

Signed-off-by: Phil Sutter <phil@nwl.cc>
4 years agonft: Fix for ruleset flush while restoring
Phil Sutter [Fri, 31 Jul 2020 16:20:17 +0000 (18:20 +0200)] 
nft: Fix for ruleset flush while restoring

If ruleset is flushed while an instance of iptables-nft-restore is
running and has seen a COMMIT line once, it doesn't notice the
disappeared table while handling the next COMMIT. This is due to table
existence being tracked via 'initialized' boolean which is only reset
by nft_table_flush().

To fix this, drop the dedicated 'initialized' boolean and switch users
to the recently introduced 'exists' one.

As a side-effect, this causes base chain existence being checked for
each command calling nft_xt_builtin_init() as the old 'initialized' bit
was used to track if that function has been called before or not.

Signed-off-by: Phil Sutter <phil@nwl.cc>
Acked-by: Pablo Neira Ayuso <pablo@netfilter.org>
4 years agoxtables-monitor: Fix ip6tables rule printing
Phil Sutter [Fri, 7 Aug 2020 14:42:07 +0000 (16:42 +0200)] 
xtables-monitor: Fix ip6tables rule printing

When printing an ip6tables rule event, false family ops are used as they
are initially looked up for AF_INET and reused no matter the current
rule's family. In practice, this means that nft_rule_print_save() calls
the wrong rule_to_cs, save_rule and clear_cs callbacks. Therefore, if a
rule specifies a source or destination address, the address is not
printed.

Fix this by performing a family lookup each time rule_cb is called.

Signed-off-by: Phil Sutter <phil@nwl.cc>
Acked-by: Pablo Neira Ayuso <pablo@netfilter.org>
4 years agotests: shell: Merge and extend return codes test
Phil Sutter [Thu, 6 Aug 2020 16:52:34 +0000 (18:52 +0200)] 
tests: shell: Merge and extend return codes test

Merge scripts for iptables and ip6tables, they were widely identical.
Also extend the test by one check (removing a non-existent rule with
valid chain and target) and quote the error messages where differences
are deliberately ignored.

Signed-off-by: Phil Sutter <phil@nwl.cc>
Acked-by: Pablo Neira Ayuso <pablo@netfilter.org>
4 years agonft: Fix command name in ip6tables error message
Phil Sutter [Fri, 7 Aug 2020 11:48:28 +0000 (13:48 +0200)] 
nft: Fix command name in ip6tables error message

Upon errors, ip6tables-nft would prefix its error messages with
'iptables:' instead of 'ip6tables:'. Turns out the command name was
hard-coded, use 'progname' variable instead.
While being at it, merge the two mostly identical fprintf() calls into
one.

Signed-off-by: Phil Sutter <phil@nwl.cc>
Acked-by: Pablo Neira Ayuso <pablo@netfilter.org>
4 years agonft: Eliminate table list from cache
Phil Sutter [Thu, 30 Jul 2020 09:54:36 +0000 (11:54 +0200)] 
nft: Eliminate table list from cache

The full list of tables in kernel is not relevant, only those used by
iptables-nft and for those, knowing if they exist or not is sufficient.
For holding that information, the already existing 'table' array in
nft_cache suits well.

Consequently, nft_table_find() merely checks if the new 'exists' boolean
is true or not and nft_for_each_table() iterates over the builtin_table
array in nft_handle, additionally checking the boolean in cache for
whether to skip the entry or not.

Signed-off-by: Phil Sutter <phil@nwl.cc>
4 years agoiptables: replace libnftnl table list by linux list
Pablo Neira Ayuso [Thu, 23 Jul 2020 12:15:53 +0000 (14:15 +0200)] 
iptables: replace libnftnl table list by linux list

This patch removes the libnftnl table list by linux list. This comes
with an extra memory allocation to store the nft_table object. Probably,
there is no need to cache the entire nftnl_table in the near future.

Signed-off-by: Pablo Neira Ayuso <pablo@netfilter.org>
4 years agonft: Reorder enum nft_table_type
Phil Sutter [Tue, 7 Jul 2020 16:40:11 +0000 (18:40 +0200)] 
nft: Reorder enum nft_table_type

This list of table types is used internally only, the actual values
don't matter that much. Reorder them to match the order in which
iptables-legacy-save prints them (if present). As a consequence, entries
in builtin_table array 'xtables_ipv4' are correctly sorted as well.

Signed-off-by: Phil Sutter <phil@nwl.cc>
4 years agonft: Use nft_chain_find() in two more places
Phil Sutter [Tue, 7 Jul 2020 16:35:26 +0000 (18:35 +0200)] 
nft: Use nft_chain_find() in two more places

This doesn't really increase functions' readability but prepares for
later changes.

Signed-off-by: Phil Sutter <phil@nwl.cc>
4 years agonft: Turn nft_chain_save() into a foreach-callback
Phil Sutter [Wed, 8 Jul 2020 13:18:48 +0000 (15:18 +0200)] 
nft: Turn nft_chain_save() into a foreach-callback

Let nftnl_chain_list_foreach() do the chain list iterating instead of
open-coding it. While being at it, simplify the policy value selection
code as well.

Signed-off-by: Phil Sutter <phil@nwl.cc>
4 years agonft: Drop pointless nft_xt_builtin_init() call
Phil Sutter [Fri, 10 Jul 2020 19:12:34 +0000 (21:12 +0200)] 
nft: Drop pointless nft_xt_builtin_init() call

When renaming a chain, either everything is in place already or the
command will bail anyway. So just drop this superfluous call.

Signed-off-by: Phil Sutter <phil@nwl.cc>
4 years agonft: cache: Drop duplicate chain check
Phil Sutter [Fri, 10 Jul 2020 19:53:08 +0000 (21:53 +0200)] 
nft: cache: Drop duplicate chain check

When fetching chains from kernel, checking for duplicate chain names is
not needed: Nftables doesn't support them in the first place. This is
merely a leftover from when multiple cache fetches could happen and so a
bit of sanity checking was in order.

Signed-off-by: Phil Sutter <phil@nwl.cc>
4 years agonft: Be lazy when flushing
Phil Sutter [Fri, 10 Jul 2020 18:42:11 +0000 (20:42 +0200)] 
nft: Be lazy when flushing

If neither chain nor verbose flag was specified and the table to flush
doesn't exist yet, no action is needed (as there is nothing to flush
anyway).

Signed-off-by: Phil Sutter <phil@nwl.cc>
4 years agonft: Make table creation purely implicit
Phil Sutter [Fri, 10 Jul 2020 18:08:35 +0000 (20:08 +0200)] 
nft: Make table creation purely implicit

While asserting a required builtin chain exists, its table is created
implicitly if missing. Exploit this from xtables-restore, too: The only
actions which need adjustment are chain_new and chain_restore, i.e. when
restoring (either builtin or custom) chains.

Note: The call to nft_table_builtin_add() wasn't sufficient as it
doesn't set the table as initialized and therefore a following call to
nft_xt_builtin_init() would override non-default base chain policies.

Note2: The 'table_new' callback in 'nft_xt_restore_cb' is left in place
as xtables-translate uses it to print an explicit 'add table' command.

Note3: nft_table_new() function was already unused since a7f1e208cdf9c
("nft: split parsing from netlink commands").

Signed-off-by: Phil Sutter <phil@nwl.cc>
4 years agoextensions: libxt_conntrack: provide translation for DNAT and SNAT --ctstate
Pablo Neira Ayuso [Wed, 22 Jul 2020 11:04:34 +0000 (13:04 +0200)] 
extensions: libxt_conntrack: provide translation for DNAT and SNAT --ctstate

iptables-translate -t filter -A INPUT -m conntrack --ctstate DNAT -j ACCEPT
nft add rule ip filter INPUT ct status dnat counter accept

Signed-off-by: Pablo Neira Ayuso <pablo@netfilter.org>
4 years agoiptables: accept lock file name at runtime
Giuseppe Scrivano [Fri, 17 Jul 2020 08:39:40 +0000 (10:39 +0200)] 
iptables: accept lock file name at runtime

allow users to override at runtime the lock file to use through the
XTABLES_LOCKFILE environment variable.

It allows to use iptables when the user has granted enough
capabilities (e.g. a user+network namespace) to configure the network
but that lacks access to the XT_LOCK_NAME (by default placed under
/run).

$ XTABLES_LOCKFILE=/tmp/xtables unshare -rn iptables ...

Signed-off-by: Giuseppe Scrivano <gscrivan@redhat.com>
Signed-off-by: Pablo Neira Ayuso <pablo@netfilter.org>
5 years agotests: shell: Add help output to run-tests.sh
Phil Sutter [Mon, 6 Jul 2020 11:11:36 +0000 (13:11 +0200)] 
tests: shell: Add help output to run-tests.sh

The script has quite a few options nowadays, so add a bit of help text
also.

Signed-off-by: Phil Sutter <phil@nwl.cc>
5 years agolibxtables: compiler warning fixes for NO_SHARED_LIBS
Maciej Żenczykowski [Tue, 23 Jun 2020 23:09:02 +0000 (16:09 -0700)] 
libxtables: compiler warning fixes for NO_SHARED_LIBS

Fixes two issues with NO_SHARED_LIBS:
 - #include <dlfcn.h> is ifdef'ed out and thus dlclose()
   triggers an undeclared function compiler warning
 - dlreg_add() is unused and thus triggers an unused
   function warning

Test: builds without warnings
Signed-off-by: Maciej Żenczykowski <maze@google.com>
Signed-off-by: Pablo Neira Ayuso <pablo@netfilter.org>
5 years agoxtables-translate: Use proper clear_cs function
Phil Sutter [Tue, 16 Jun 2020 11:06:26 +0000 (13:06 +0200)] 
xtables-translate: Use proper clear_cs function

Avoid memleaks by performing a full free of any allocated data in local
iptables_command_state variable.

Signed-off-by: Phil Sutter <phil@nwl.cc>
5 years agoxtables-translate: don't fail if help was requested
Arturo Borrero Gonzalez [Tue, 16 Jun 2020 09:20:42 +0000 (11:20 +0200)] 
xtables-translate: don't fail if help was requested

If the user called `iptables-translate -h` then we have CMD_NONE and we should gracefully handle
this case in do_command_xlate().

Before this patch, you would see:

 user@debian:~$ sudo iptables-translate -h
 [..]
 nft Unsupported command?
 user@debian:~$ echo $?
 1

After this patch:

 user@debian:~$ sudo iptables-translate -h
 [..]
 user@debian:~$ echo $?
 0

Fixes: d4409d449c10fa ("nft: Don't exit early after printing help texts")
Acked-by: Phil Sutter <phil@nwl.cc>
Signed-off-by: Arturo Borrero Gonzalez <arturo@netfilter.org>
5 years agobuild: Fix for failing 'make uninstall'
Phil Sutter [Tue, 9 Jun 2020 10:40:24 +0000 (12:40 +0200)] 
build: Fix for failing 'make uninstall'

Support for uninstalling is severely broken:

- extensions/GNUmakefile.in defines an 'install' target but lacks a
  respective 'uninstall' one, causing 'make uninstall' abort with an
  error message.

- iptables/Makefile.am defines an 'install-exec-hook' to create the
  binary symlinks which are left in place after 'make uninstall'.

Fix these problems by defining respective targets containing code copied
from automake-generated uninstall targets.

While being at it, add a few more uninstall-hooks removing custom
directories created by 'make install' if they are empty afterwards.

Reported-by: Richard Guy Briggs <rgb@redhat.com>
Signed-off-by: Phil Sutter <phil@nwl.cc>
Tested-by: Richard Guy Briggs <rgb@redhat.com>
5 years agoxtables-restore: Fix verbose mode table flushing
Phil Sutter [Tue, 12 May 2020 10:59:42 +0000 (12:59 +0200)] 
xtables-restore: Fix verbose mode table flushing

When called with --verbose mode, iptables-nft-restore did not print
anything when flushing the table. Fix this by adding a "manual" mode to
nft_cmd_table_flush(), turning it into a wrapper around '-F' and '-X'
commands, which is exactly what iptables-legacy-restore does to flush a
table. This though requires a real cache, so don't set NFT_CL_FAKE then.

Signed-off-by: Phil Sutter <phil@nwl.cc>
5 years agobuild: resolve iptables-apply not getting installed
Jan Engelhardt [Wed, 3 Jun 2020 13:38:48 +0000 (15:38 +0200)] 
build: resolve iptables-apply not getting installed

ip6tables-apply gets installed but iptables-apply does not.
That is wrong.

» make install DESTDIR=$PWD/r
» find r -name "*app*"
r/usr/local/sbin/ip6tables-apply
r/usr/local/share/man/man8/iptables-apply.8
r/usr/local/share/man/man8/ip6tables-apply.8

Fixes: v1.8.5~87
Signed-off-by: Jan Engelhardt <jengelh@inai.de>
Signed-off-by: Pablo Neira Ayuso <pablo@netfilter.org>
5 years agodoc: document danger of applying REJECT to INVALID CTs
Jan Engelhardt [Wed, 3 Jun 2020 13:36:04 +0000 (15:36 +0200)] 
doc: document danger of applying REJECT to INVALID CTs

Signed-off-by: Jan Engelhardt <jengelh@inai.de>
Signed-off-by: Pablo Neira Ayuso <pablo@netfilter.org>
5 years agoconfigure: bump version for 1.8.5 release v1.8.5
Pablo Neira Ayuso [Wed, 3 Jun 2020 09:37:52 +0000 (11:37 +0200)] 
configure: bump version for 1.8.5 release

Signed-off-by: Pablo Neira Ayuso <pablo@netfilter.org>
5 years agobuild: bump dependency on libnftnl
Phil Sutter [Wed, 3 Jun 2020 09:41:55 +0000 (11:41 +0200)] 
build: bump dependency on libnftnl

Recently added full among match support depends on concatenated ranges
in nftables sets, a feature which was not available in libnftnl before
version 1.1.6.

Fixes: c33bae9c6c7a4 ("ebtables: among: Support mixed MAC and MAC/IP entries")
Signed-off-by: Phil Sutter <phil@nwl.cc>
5 years agoinclude: Avoid undefined left-shift in xt_sctp.h
Phil Sutter [Thu, 5 Dec 2019 12:35:25 +0000 (13:35 +0100)] 
include: Avoid undefined left-shift in xt_sctp.h

Pull the fix in kernel commit 164166558aace ("netfilter: uapi: Avoid
undefined left-shift in xt_sctp.h") into iptables repository. The
original description is:

With 'bytes(__u32)' being 32, a left-shift of 31 may happen which is
undefined for the signed 32-bit value 1. Avoid this by declaring 1 as
unsigned.

Signed-off-by: Phil Sutter <phil@nwl.cc>
Acked-by: Pablo Neira Ayuso <pablo@netfilter.org>
5 years agotests: shell: Fix syntax in ipt-restore/0010-noflush-new-chain_0
Phil Sutter [Fri, 29 May 2020 14:39:31 +0000 (16:39 +0200)] 
tests: shell: Fix syntax in ipt-restore/0010-noflush-new-chain_0

The here-doc statement missed the final delimiter. Worked anyways
because end-of-file would do the trick.

Fixes: a103fbfadf4c1 ("xtables-restore: Fix parser feed from line buffer")
Signed-off-by: Phil Sutter <phil@nwl.cc>
5 years agodoc: libxt_MARK: OUTPUT chain is fine, too
Phil Sutter [Tue, 19 May 2020 23:00:57 +0000 (01:00 +0200)] 
doc: libxt_MARK: OUTPUT chain is fine, too

In order to route packets originating from the host itself based on
fwmark, mangle table's OUTPUT chain must be used. Mention this chain as
alternative to PREROUTING.

Fixes: c9be7f153f7bf ("doc: libxt_MARK: no longer restricted to mangle table")
Signed-off-by: Phil Sutter <phil@nwl.cc>
5 years agonft: Drop save_counters callback from family_ops
Phil Sutter [Fri, 8 May 2020 13:40:52 +0000 (15:40 +0200)] 
nft: Drop save_counters callback from family_ops

All families use the same callback function, just fold it into the sole
place it's called.

Signed-off-by: Phil Sutter <phil@nwl.cc>
5 years agonft: Merge nft_*_rule_find() functions
Phil Sutter [Thu, 7 May 2020 16:53:47 +0000 (18:53 +0200)] 
nft: Merge nft_*_rule_find() functions

Both ebtables and arptables are fine with using nft_ipv46_rule_find()
instead of their own implementations. Take the chance and move the
former into nft.c as a static helper since it is used in a single place,
only. Then get rid of the callback from family_ops.

Signed-off-by: Phil Sutter <phil@nwl.cc>
5 years agonfnl_osf: Improve error handling
Phil Sutter [Sat, 9 May 2020 11:42:56 +0000 (13:42 +0200)] 
nfnl_osf: Improve error handling

For some error cases, no log message was created - hence apart from the
return code there was no indication of failing execution.

If a line load fails, don't abort but continue with the remaining
file contents. The current pf.os file in this repository serves as
proof-of-concept:

Lines 700 and 701: Duplicates of lines 698 and 699 because 'W*' and 'W0'
parse into the same data.

Line 704: Duplicate of line 702 because apart from 'W*' and 'W0', only
the first three fields on right-hand side are sent to the kernel.

When loading, these dups are ignored (they would bounce if NLM_F_EXCL
was given). Upon deletion, they cause ENOENT response from kernel. In
order to align duplicate-tolerance in both modes, just ignore that
ENOENT.

Signed-off-by: Phil Sutter <phil@nwl.cc>
5 years agonfnl_osf: Fix broken conversion to nfnl_query()
Phil Sutter [Sat, 9 May 2020 11:36:49 +0000 (13:36 +0200)] 
nfnl_osf: Fix broken conversion to nfnl_query()

Due to missing NLM_F_ACK flag in request, nfnetlink code in kernel
didn't create an own ACK message but left it upon subsystem to ACK or
not. Since nfnetlink_osf doesn't ACK by itself, nfnl_query() got stuck
waiting for a reply.

Whoever did the conversion from deprecated nfnl_talk() obviously didn't
even test basic functionality of the tool.

Fixes: 52aa15098ebd6 ("nfnl_osf: Replace deprecated nfnl_talk() by nfnl_query()")
Signed-off-by: Phil Sutter <phil@nwl.cc>
5 years agolibip6t_srh.t: switch to lowercase, add /128 suffix, require success
Maciej Żenczykowski [Mon, 11 May 2020 21:33:49 +0000 (14:33 -0700)] 
libip6t_srh.t: switch to lowercase, add /128 suffix, require success

This looks like an oversight which is easy to fix.

Furthermore:
  git grep ';;OK'
does not find any other matches, so this is the last unverified test case.

Test:
  [root@f32vm IPT]# uname -r
  5.6.10-300.fc32.x86_64

  [root@f32vm IPT]# md5sum extensions/libip6t_srh.t
  b98864bdd6c39a0dd96022c47e652edb  extensions/libip6t_srh.t

  [root@f32vm IPT]# ./iptables-test.py extensions/libip6t_srh.t
  extensions/libip6t_srh.t: OK
  1 test files, 27 unit tests, 27 passed

Signed-off-by: Maciej Żenczykowski <maze@google.com>
Signed-off-by: Pablo Neira Ayuso <pablo@netfilter.org>
5 years agoiptables-test: Don't choke on empty lines
Phil Sutter [Fri, 8 May 2020 12:57:36 +0000 (14:57 +0200)] 
iptables-test: Don't choke on empty lines

The script code wasn't expecting empty lines:

| Traceback (most recent call last):
|   File "./iptables-test.py", line 380, in <module>
|     main()
|   File "./iptables-test.py", line 370, in main
|     file_tests, file_passed = run_test_file(filename, args.netns)
|   File "./iptables-test.py", line 265, in run_test_file
|     if item[1] == "=":
| IndexError: list index out of range

Fix this by ignoring empty lines or those consisting of whitespace only.

While being at it, remove the empty line from libxt_IDLETIMER.t which
exposed the problem.

Signed-off-by: Phil Sutter <phil@nwl.cc>
5 years agonft: Don't exit early after printing help texts
Phil Sutter [Wed, 6 May 2020 12:39:52 +0000 (14:39 +0200)] 
nft: Don't exit early after printing help texts

Follow regular code path after handling --help option to gracefully
deinit and free stuff.

Signed-off-by: Phil Sutter <phil@nwl.cc>
5 years agonft: Fix leak when replacing a rule
Phil Sutter [Wed, 6 May 2020 11:33:20 +0000 (13:33 +0200)] 
nft: Fix leak when replacing a rule

If nft_rule_append() is called with a reference rule, it is supposed to
insert the new rule at the reference position and then remove the
reference from cache. Instead, it removed the new rule from cache again
right after inserting it. Also, it missed to free the removed rule.

Fixes: 5ca9acf51adf9 ("xtables: Fix position of replaced rules in cache")
Signed-off-by: Phil Sutter <phil@nwl.cc>
5 years agoarptables: Fix leak in nft_arp_print_rule()
Phil Sutter [Wed, 6 May 2020 10:27:49 +0000 (12:27 +0200)] 
arptables: Fix leak in nft_arp_print_rule()

The function missed to clear struct iptables_command_state again after
use.

Signed-off-by: Phil Sutter <phil@nwl.cc>
5 years agonft: Use clear_cs() instead of open coding
Phil Sutter [Tue, 5 May 2020 17:36:13 +0000 (19:36 +0200)] 
nft: Use clear_cs() instead of open coding

In a few places, initialized struct iptables_command_state was not fully
deinitialized. Change them to call nft_clear_iptables_command_state()
which does it properly.

Signed-off-by: Phil Sutter <phil@nwl.cc>
5 years agolibxtables: Introduce xtables_fini()
Phil Sutter [Tue, 5 May 2020 11:56:11 +0000 (13:56 +0200)] 
libxtables: Introduce xtables_fini()

Record handles of loaded shared objects in a linked list and dlclose()
them from the newly introduced function. While functionally not
necessary, this clears up valgrind's memcheck output when also
displaying reachable memory.

Since this is an extra function that doesn't change the existing API,
increment both current and age.

Signed-off-by: Phil Sutter <phil@nwl.cc>
5 years agoebtables: Free statically loaded extensions again
Phil Sutter [Tue, 5 May 2020 11:45:06 +0000 (13:45 +0200)] 
ebtables: Free statically loaded extensions again

All ebtables extensions are loaded upon program start as due to the lack
of '-m' parameters, loading on demand is not possible. Introduce
nft_fini_eb() to counteract nft_init_eb() and free dynamic memory in
matches and targets from there.

Signed-off-by: Phil Sutter <phil@nwl.cc>
5 years agonft: Fix leak when deleting rules
Phil Sutter [Tue, 5 May 2020 11:41:43 +0000 (13:41 +0200)] 
nft: Fix leak when deleting rules

For NFT_COMPAT_RULE_DELETE jobs, batch_obj_del() has to do the rule
freeing, they are no longer in cache.

Signed-off-by: Phil Sutter <phil@nwl.cc>
5 years agonft: Fix leaks in ebt_add_policy_rule()
Phil Sutter [Mon, 4 May 2020 17:30:29 +0000 (19:30 +0200)] 
nft: Fix leaks in ebt_add_policy_rule()

The function leaked memory allocated in temporary struct
iptables_command_state, clean it immediately after use.

In any of the udata-related error cases, allocated nftnl_rule would
leak, fix this by introducing a common error path to goto.

In regular code path, the allocated nftnl_rule would still leak:
batch_obj_del() does not free rules in NFT_COMPAT_RULE_APPEND jobs, as
they typically sit in cache as well. Policy rules in turn weren't added
to cache: They are created immediately before commit and never
referenced from other rules. Add them now so they are freed just like
regular rules.

Fixes: aff1162b3e4b7 ("ebtables-nft: Support user-defined chain policies")
Signed-off-by: Phil Sutter <phil@nwl.cc>
5 years agonft: Clear all lists in nft_fini()
Phil Sutter [Mon, 4 May 2020 17:20:52 +0000 (19:20 +0200)] 
nft: Clear all lists in nft_fini()

Remove and free any pending entries in obj_list and err_list as well. To
get by without having to declare list-specific cursors, use generic
list_head types and call list_entry() explicitly.

Signed-off-by: Phil Sutter <phil@nwl.cc>
5 years agonft: cache: Re-establish cache consistency check
Phil Sutter [Fri, 1 May 2020 05:59:36 +0000 (07:59 +0200)] 
nft: cache: Re-establish cache consistency check

Restore code ensuring __nft_build_cache() returns a consistent cache in
which all ruleset elements belong to the same generation.

This check was removed by commit 200bc39965149 ("nft: cache: Fix
iptables-save segfault under stress") as it could lead to segfaults if a
partial cache fetch was done while cache's chain list was traversed.
With the new cache fetch logic, __nft_build_cache() is never called
while holding references to cache entries.

Signed-off-by: Phil Sutter <phil@nwl.cc>
5 years agotests: shell: Implement --valgrind mode
Phil Sutter [Tue, 5 May 2020 16:37:49 +0000 (18:37 +0200)] 
tests: shell: Implement --valgrind mode

Wrap every call to $XT_MULTI with valgrind, or actually a wrapper script
which does the valgrind wrap and stores the log if it contains something
relevant.

Carefully name the wrapper script(s) so that test cases' checks on
$XT_MULTI name stay intact.

This mode slows down testsuite execution horribly. Luckily, it's not
meant for constant use, though.

For now, ignore commands with non-zero exit status - error paths
typically hit direct exit() calls and therefore leave reachable memory
in place.

Signed-off-by: Phil Sutter <phil@nwl.cc>
5 years agonft: Fix for '-F' in iptables dumps
Phil Sutter [Fri, 24 Apr 2020 09:32:08 +0000 (11:32 +0200)] 
nft: Fix for '-F' in iptables dumps

When restoring a dump which contains an explicit flush command,
previously added rules are removed from cache and the following commit
will try to create netlink messages based on freed memory.

Fix this by weeding any rule-based commands from obj_list if they
address the same chain.

Signed-off-by: Phil Sutter <phil@nwl.cc>
5 years agonft: cache: Optimize caching for flush command
Phil Sutter [Mon, 27 Apr 2020 10:08:59 +0000 (12:08 +0200)] 
nft: cache: Optimize caching for flush command

When flushing all chains and verbose mode is not enabled,
nft_rule_flush() uses a shortcut: It doesn't specify a chain name for
NFT_MSG_DELRULE, so the kernel will flush all existing chains without
user space needing to know which they are.

The above allows to avoid a chain cache, but there's a caveat:
nft_xt_builtin_init() will create base chains as it assumes they are
missing and thereby possibly overrides any non-default chain policies.

Solve this by making nft_xt_builtin_init() cache-aware: If a command
doesn't need a chain cache, there's no need to bother with creating any
non-existing builtin chains, either. For the sake of completeness, also
do nothing if cache is not initialized (although that shouldn't happen).

Signed-off-by: Phil Sutter <phil@nwl.cc>
5 years agonft: cache: Fetch cache for specific chains
Phil Sutter [Thu, 19 Mar 2020 17:58:29 +0000 (18:58 +0100)] 
nft: cache: Fetch cache for specific chains

Iterate over command list and collect chains to cache. Insert them into
a sorted list to pass to __nft_build_cache().

If a command is interested in all chains (e.g., --list), cmd->chain
remains unset. To record this case reliably, use a boolean
('all_chains'). Otherwise, it is hard to distinguish between first call
to nft_cache_level_set() and previous command with NULL cmd->chain
value.

When caching only specific chains, manually add builtin ones for the
given table as well - otherwise nft_xt_builtin_init() will act as if
they don't exist and possibly override non-default chain policies.

Signed-off-by: Phil Sutter <phil@nwl.cc>
5 years agonft-cache: Introduce __fetch_chain_cache()
Phil Sutter [Fri, 20 Mar 2020 09:06:16 +0000 (10:06 +0100)] 
nft-cache: Introduce __fetch_chain_cache()

Extract the inner part of fetch_chain_cache() into a dedicated function,
preparing for individual chain caching.

Signed-off-by: Phil Sutter <phil@nwl.cc>
5 years agonft-cache: Fetch cache per table
Phil Sutter [Wed, 18 Mar 2020 16:08:31 +0000 (17:08 +0100)] 
nft-cache: Fetch cache per table

Restore per-table operation of cache routines as initially implemented
in commit e2883c5531e6e ("nft-cache: Support partial cache per table").

As before, this doesn't limit fetching of tables (their number is
supposed to be low) but instead limits fetching of sets, chains and
rules to the specified table.

For this to behave correctly when restoring without flushing over
multiple tables, cache must be freed fully after each commit - otherwise
the previous table's cache level is reused for the current one. The
exception being fake cache, used for flushing restore: NFT_CL_FAKE is
set just once at program startup, so it must stay set otherwise
consecutive tables cause pointless cache fetching.

The sole use-case requiring a multi-table cache, iptables-save, is
indicated by req->table being NULL. Therefore, req->table assignment is
a bit sloppy: All calls to nft_cache_level_set() are assumed to set the
same table value, collision detection exists merely to catch programming
mistakes.

Make nft_fini() call nft_release_cache() instead of flush_chain_cache(),
the former does a full cache deinit including cache_req contents.

Signed-off-by: Phil Sutter <phil@nwl.cc>
5 years agonft: cache: Introduce struct nft_cache_req
Phil Sutter [Tue, 7 Apr 2020 12:05:34 +0000 (14:05 +0200)] 
nft: cache: Introduce struct nft_cache_req

This embedded struct collects cache requirement info gathered from parsed
nft_cmds and is interpreted by __nft_build_cache().

While being at it, remove unused parameters passed to the latter
function, nft_handle pointer is sufficient.

Signed-off-by: Phil Sutter <phil@nwl.cc>
5 years agonft: cache: Improve fake cache integration
Phil Sutter [Tue, 7 Apr 2020 11:47:54 +0000 (13:47 +0200)] 
nft: cache: Improve fake cache integration

With NFT_CL_FAKE being highest cache level while at the same time
__nft_build_cache() treating it equal to NFT_CL_TABLES, no special
handling for fake cache is required anymore.

Signed-off-by: Phil Sutter <phil@nwl.cc>
5 years agonft: cache: Simplify rule and set fetchers
Phil Sutter [Thu, 26 Mar 2020 03:47:11 +0000 (04:47 +0100)] 
nft: cache: Simplify rule and set fetchers

Since no incremental cache fetching happens anymore, code fetching rules
for chains or elements for sets may safely assume that whatever is in
cache also didn't get populated with rules or elements before.

Therefore no (optional) chain name needs to be passed on to
fetch_rule_cache() and fetch_set_cache() doesn't have to select for
which sets in a table to call set_fetch_elem_cb().

Signed-off-by: Phil Sutter <phil@nwl.cc>
5 years agonft: missing nft_fini() call in bridge family
Pablo Neira Ayuso [Mon, 6 Jan 2020 12:20:18 +0000 (13:20 +0100)] 
nft: missing nft_fini() call in bridge family

Signed-off-by: Pablo Neira Ayuso <pablo@netfilter.org>
Signed-off-by: Phil Sutter <phil@nwl.cc>
5 years agonft: remove cache build calls
Pablo Neira Ayuso [Mon, 6 Jan 2020 12:20:16 +0000 (13:20 +0100)] 
nft: remove cache build calls

The cache requirements are now calculated once from the parsing phase.
There is no need to call __nft_build_cache() from several spots in the
codepath anymore.

Signed-off-by: Pablo Neira Ayuso <pablo@netfilter.org>
Signed-off-by: Phil Sutter <phil@nwl.cc>