]> git.ipfire.org Git - thirdparty/glibc.git/commit
x86: Improve memset-vec-unaligned-erms.S
authorNoah Goldstein <goldstein.w.n@gmail.com>
Thu, 20 May 2021 17:13:51 +0000 (13:13 -0400)
committerSunil K Pandey <skpgkp2@gmail.com>
Mon, 2 May 2022 18:50:57 +0000 (11:50 -0700)
commit6903448d936ee49e09db3d13830373f47f58c791
treea81d8d53756d501540542a9504d3141c2eb9c70c
parent903190e981e995f9f10063fd717ce72ab1c6cb04
x86: Improve memset-vec-unaligned-erms.S

No bug. This commit makes a few small improvements to
memset-vec-unaligned-erms.S. The changes are 1) only aligning to 64
instead of 128. Either alignment will perform equally well in a loop
and 128 just increases the odds of having to do an extra iteration
which can be significant overhead for small values. 2) Align some
targets and the loop. 3) Remove an ALU from the alignment process. 4)
Reorder the last 4x VEC so that they are stored after the loop. 5)
Move the condition for leq 8x VEC to before the alignment
process. test-memset and test-wmemset are both passing.

Signed-off-by: Noah Goldstein <goldstein.w.n@gmail.com>
Reviewed-by: H.J. Lu <hjl.tools@gmail.com>
(cherry picked from commit 6abf27980a947f9b6e514d6b33b83059d39566ae)
sysdeps/x86_64/multiarch/memset-vec-unaligned-erms.S