]> git.ipfire.org Git - thirdparty/kernel/linux.git/commit
linux/log2.h: reduce instruction count for is_power_of_2()
authorMaciej W. Rozycki <macro@orcam.me.uk>
Sun, 11 Jan 2026 21:21:57 +0000 (21:21 +0000)
committerAndrew Morton <akpm@linux-foundation.org>
Tue, 27 Jan 2026 03:07:14 +0000 (19:07 -0800)
commit4cc67b048459bebb7a60b693044ec83fb853eba1
treefb153fa505f7376b51ba0f8bc6177c1e04def724
parent5e65b5ca7d4e1f5d18e03ada94f549086ceb6500
linux/log2.h: reduce instruction count for is_power_of_2()

Follow an observation that (n ^ (n - 1)) will only ever retain the most
significant bit set in the word operated on if that is the only bit set in
the first place, and use it to determine whether a number is a whole power
of 2, avoiding the need for an explicit check for nonzero.

This reduces the sequence produced to 3 instructions only across Alpha,
MIPS, and RISC-V targets, down from 4, 5, and 4 respectively, removing a
branch in the two latter cases.  And it's 5 instructions on POWER and
x86-64 vs 8 and 9 respectively.  There are no branches now emitted here
for targets that have a suitable conditional set operation, although an
inline expansion will often end with one, depending on what code a call to
this function is used in.

Credit goes to GCC authors for coming up with this optimisation used as
the fallback for (__builtin_popcountl(n) == 1), equivalent to this code,
for targets where the hardware population count operation is considered
expensive.

Link: https://lkml.kernel.org/r/alpine.DEB.2.21.2601111836250.30566@angie.orcam.me.uk
Signed-off-by: Maciej W. Rozycki <macro@orcam.me.uk>
Cc: Jens Axboe <axboe@kernel.dk>
Cc: John Garry <john.g.garry@oracle.com>
Cc: "Martin K. Petersen" <martin.petersen@oracle.com>
Cc: Su Hui <suhui@nfschina.com>
Signed-off-by: Andrew Morton <akpm@linux-foundation.org>
include/linux/log2.h