Remove SPR/GNR/DMR from avx512_{move,store}_by pieces tune.

author hongtao.liu <hongtao.liu@intel.com>

Tue, 16 Sep 2025 01:23:45 +0000 (03:23 +0200)

committer liuhongt <hongtao.liu@intel.com>

Thu, 18 Sep 2025 01:35:52 +0000 (18:35 -0700)
author hongtao.liu <hongtao.liu@intel.com>
Tue, 16 Sep 2025 01:23:45 +0000 (03:23 +0200)
committer liuhongt <hongtao.liu@intel.com>
Thu, 18 Sep 2025 01:35:52 +0000 (18:35 -0700)
diff --git a/gcc/config/i386/x86-tune.def b/gcc/config/i386/x86-tune.def

index a86cbad281c13e503fe9588ad17d8b872f78edb9..255ea4a16ccb60070bbb60d1375a4760b3c16fbe 100644 (file)
--- a/gcc/config/i386/x86-tune.def
+++ b/gcc/config/i386/x86-tune.def
@@ -612,6 +612,8 @@ DEF_TUNE (X86_TUNE_AVX256_AVOID_VEC_PERM,
  /* X86_TUNE_AVX256_SPLIT_REGS: if true, AVX512 ops are split into two AVX256 ops.  */
  DEF_TUNE (X86_TUNE_AVX512_SPLIT_REGS, "avx512_split_regs", m_ZNVER4)
  
+/* It's better to align MOVE_MAX with prefer_vector_width to reduce
+   risk of STLF stalls(small store followed by big load.)  */
  /* X86_TUNE_AVX256_MOVE_BY_PIECES: Optimize move_by_pieces with 256-bit
     AVX instructions.  */
  DEF_TUNE (X86_TUNE_AVX256_MOVE_BY_PIECES, "avx256_move_by_pieces",
@@ -625,14 +627,12 @@ DEF_TUNE (X86_TUNE_AVX256_STORE_BY_PIECES, "avx256_store_by_pieces",
  /* X86_TUNE_AVX512_MOVE_BY_PIECES: Optimize move_by_pieces with 512-bit
     AVX instructions.  */
  DEF_TUNE (X86_TUNE_AVX512_MOVE_BY_PIECES, "avx512_move_by_pieces",
-         m_SAPPHIRERAPIDS | m_GRANITERAPIDS | m_GRANITERAPIDS_D
-         | m_DIAMONDRAPIDS | m_ZNVER4 | m_ZNVER5)
+          m_ZNVER4 | m_ZNVER5)
  
  /* X86_TUNE_AVX512_STORE_BY_PIECES: Optimize store_by_pieces with 512-bit
     AVX instructions.  */
  DEF_TUNE (X86_TUNE_AVX512_STORE_BY_PIECES, "avx512_store_by_pieces",
-         m_SAPPHIRERAPIDS | m_GRANITERAPIDS | m_GRANITERAPIDS_D
-         | m_DIAMONDRAPIDS | m_ZNVER4 | m_ZNVER5)
+         m_ZNVER4 | m_ZNVER5)
  
  /* X86_TUNE_AVX512_TWO_EPILOGUES: Use two vector epilogues for 512-bit
     vectorized loops.  */
diff --git a/gcc/testsuite/gcc.target/i386/pieces-memcpy-18.c b/gcc/testsuite/gcc.target/i386/pieces-memcpy-18.c

index b15a0db9ff0ce17db744844cf329b177d620245a..b4995ac0598cf2b2929690f922e596200c2d9802 100644 (file)
--- a/gcc/testsuite/gcc.target/i386/pieces-memcpy-18.c
+++ b/gcc/testsuite/gcc.target/i386/pieces-memcpy-18.c
@@ -1,5 +1,5 @@
  /* { dg-do compile } */
-/* { dg-options "-O2 -march=sapphirerapids" } */
+/* { dg-options "-O2 -march=znver5" } */
  
  extern char *dst, *src;
  
diff --git a/gcc/testsuite/gcc.target/i386/pieces-memcpy-21.c b/gcc/testsuite/gcc.target/i386/pieces-memcpy-21.c

index ef439f20f74dc3a0f8ce3a90dc99b716f208cb2b..804a2989d640157c1c301df27cee585841ac0a3c 100644 (file)
--- a/gcc/testsuite/gcc.target/i386/pieces-memcpy-21.c
+++ b/gcc/testsuite/gcc.target/i386/pieces-memcpy-21.c
@@ -1,5 +1,5 @@
  /* { dg-do compile } */
-/* { dg-options "-O2 -mtune=sapphirerapids -march=x86-64 -mavx2" } */
+/* { dg-options "-O2 -mtune=znver5 -march=x86-64 -mavx2" } */
  
  extern char *dst, *src;
  
diff --git a/gcc/testsuite/gcc.target/i386/pieces-memset-46.c b/gcc/testsuite/gcc.target/i386/pieces-memset-46.c

index be1b054eed2b9ce8b2b53862847901ecaa7209e7..43d636ee3ff8e4099c7e9c57225dcdd06d3b88fa 100644 (file)
--- a/gcc/testsuite/gcc.target/i386/pieces-memset-46.c
+++ b/gcc/testsuite/gcc.target/i386/pieces-memset-46.c
@@ -1,5 +1,5 @@
  /* { dg-do compile } */
-/* { dg-options "-O2 -march=sapphirerapids" } */
+/* { dg-options "-O2 -march=znver5" } */
  
  extern char *dst;
  
diff --git a/gcc/testsuite/gcc.target/i386/pieces-memset-49.c b/gcc/testsuite/gcc.target/i386/pieces-memset-49.c

index ad43f89a9bd89c7901b92f7c61962476439d7e91..ca4933ac1d80e6ec74b0a319831fa4deb02aca09 100644 (file)
--- a/gcc/testsuite/gcc.target/i386/pieces-memset-49.c
+++ b/gcc/testsuite/gcc.target/i386/pieces-memset-49.c
@@ -1,5 +1,5 @@
  /* { dg-do compile } */
-/* { dg-options "-O2 -mtune=sapphirerapids -march=x86-64 -mavx2" } */
+/* { dg-options "-O2 -mtune=znver5 -march=x86-64 -mavx2" } */
  
  extern char *dst;
author	hongtao.liu <hongtao.liu@intel.com>
	Tue, 16 Sep 2025 01:23:45 +0000 (03:23 +0200)
committer	liuhongt <hongtao.liu@intel.com>
	Thu, 18 Sep 2025 01:35:52 +0000 (18:35 -0700)
gcc/config/i386/x86-tune.def		patch \| blob \| blame \| history
gcc/testsuite/gcc.target/i386/pieces-memcpy-18.c		patch \| blob \| blame \| history
gcc/testsuite/gcc.target/i386/pieces-memcpy-21.c		patch \| blob \| blame \| history
gcc/testsuite/gcc.target/i386/pieces-memset-46.c		patch \| blob \| blame \| history
gcc/testsuite/gcc.target/i386/pieces-memset-49.c		patch \| blob \| blame \| history