]> git.ipfire.org Git - thirdparty/zlib-ng.git/commit
Improve pipeling for AVX512 chunking
authorAdam Stylinski <kungfujesus06@gmail.com>
Sat, 30 Nov 2024 14:23:28 +0000 (09:23 -0500)
committerHans Kristian Rosbach <hk-github@circlestorm.org>
Tue, 10 Dec 2024 21:17:14 +0000 (22:17 +0100)
commit43d74a223b30902b44b01bf4c4888d8deb35e253
treeef1813e6dfbeee03b01156404456cb81c23fd713
parenta4e7c34a4ac171ba878eec86bdd2a58c1d03f8e5
Improve pipeling for AVX512 chunking

For reasons that aren't quite so clear, using the masked writes here
did not pipeline very well. Either setting up the mask stalled things
or masked moves have issues overlapping regular moves. Simply putting
the masked moves behind a branch that is rarely taken seemed to do the
trick in improving the ILP. While here, put masked loads behind the same
branch in case there were ever a hazard for overreading.
arch/x86/chunkset_avx512.c
chunkset_tpl.h