Add X86_TUNE_AVX512_TWO_EPILOGUES, enable for Zen4 and Zen5

author Richard Biener <rguenther@suse.de>

Fri, 8 Nov 2024 10:17:22 +0000 (11:17 +0100)

committer Richard Biener <rguenth@gcc.gnu.org>

Tue, 12 Nov 2024 08:54:25 +0000 (09:54 +0100)
author Richard Biener <rguenther@suse.de>
Fri, 8 Nov 2024 10:17:22 +0000 (11:17 +0100)
committer Richard Biener <rguenth@gcc.gnu.org>
Tue, 12 Nov 2024 08:54:25 +0000 (09:54 +0100)
diff --git a/gcc/config/i386/i386.cc b/gcc/config/i386/i386.cc

index 6ac3a5d55f2981ff56d6227229c2cbf6f558ad61..526c9df7618d91fe0822763852d9b19e50df7329 100644 (file)
--- a/gcc/config/i386/i386.cc
+++ b/gcc/config/i386/i386.cc
@@ -25353,6 +25353,18 @@ ix86_vector_costs::finish_cost (const vector_costs *scalar_costs)
         && TARGET_AVX256_AVOID_VEC_PERM)
        m_costs[i] = INT_MAX;
  
+  /* When X86_TUNE_AVX512_TWO_EPILOGUES is enabled arrange for both
+     a AVX2 and a SSE epilogue for AVX512 vectorized loops.  */
+  if (loop_vinfo
+      && ix86_tune_features[X86_TUNE_AVX512_TWO_EPILOGUES])
+    {
+      if (GET_MODE_SIZE (loop_vinfo->vector_mode) == 64)
+       m_suggested_epilogue_mode = V32QImode;
+      else if (LOOP_VINFO_EPILOGUE_P (loop_vinfo)
+              && GET_MODE_SIZE (loop_vinfo->vector_mode) == 32)
+       m_suggested_epilogue_mode = V16QImode;
+    }
+
    vector_costs::finish_cost (scalar_costs);
  }
  
diff --git a/gcc/config/i386/x86-tune.def b/gcc/config/i386/x86-tune.def

index 6ebb2fd3414e8734ae7601a0d46eecb60e5c0a78..81dd895ac819eaaf9d375ee1c144ee8199279ceb 100644 (file)
--- a/gcc/config/i386/x86-tune.def
+++ b/gcc/config/i386/x86-tune.def
@@ -597,6 +597,11 @@ DEF_TUNE (X86_TUNE_AVX512_MOVE_BY_PIECES, "avx512_move_by_pieces",
  DEF_TUNE (X86_TUNE_AVX512_STORE_BY_PIECES, "avx512_store_by_pieces",
           m_SAPPHIRERAPIDS | m_ZNVER4 | m_ZNVER5)
  
+/* X86_TUNE_AVX512_TWO_EPILOGUES: Use two vector epilogues for 512-bit
+   vectorized loops.  */
+DEF_TUNE (X86_TUNE_AVX512_TWO_EPILOGUES, "avx512_two_epilogues",
+         m_ZNVER4 | m_ZNVER5)
+
  /*****************************************************************************/
  /*****************************************************************************/
  /* Historical relics: tuning flags that helps a specific old CPU designs     */
author	Richard Biener <rguenther@suse.de>
	Fri, 8 Nov 2024 10:17:22 +0000 (11:17 +0100)
committer	Richard Biener <rguenth@gcc.gnu.org>
	Tue, 12 Nov 2024 08:54:25 +0000 (09:54 +0100)
gcc/config/i386/i386.cc		patch \| blob \| blame \| history
gcc/config/i386/x86-tune.def		patch \| blob \| blame \| history