]> git.ipfire.org Git - thirdparty/glibc.git/commit
x86: Add seperate non-temporal tunable for memset
authorNoah Goldstein <goldstein.w.n@gmail.com>
Fri, 24 May 2024 17:38:51 +0000 (12:38 -0500)
committerNoah Goldstein <goldstein.w.n@gmail.com>
Thu, 30 May 2024 17:36:09 +0000 (12:36 -0500)
commit46b5e98ef6f1b9f4b53851f152ecb8209064b26c
treef3008f5bbe51de418ade2aeb13363408c7ba2536
parent5bf0ab80573d66e4ae5d94b094659094336da90f
x86: Add seperate non-temporal tunable for memset

The tuning for non-temporal stores for memset vs memcpy is not always
the same. This includes both the exact value and whether non-temporal
stores are profitable at all for a given arch.

This patch add `x86_memset_non_temporal_threshold`. Currently we
disable non-temporal stores for non Intel vendors as the only
benchmarks showing its benefit have been on Intel hardware.
Reviewed-by: H.J. Lu <hjl.tools@gmail.com>
manual/tunables.texi
sysdeps/x86/cacheinfo.h
sysdeps/x86/dl-cacheinfo.h
sysdeps/x86/dl-diagnostics-cpu.c
sysdeps/x86/dl-tunables.list
sysdeps/x86/include/cpu-features.h
sysdeps/x86_64/multiarch/memset-vec-unaligned-erms.S