vect: Fix ncopies when costing SLP reductions [PR116901]

author Richard Sandiford <richard.sandiford@arm.com>

Wed, 12 Mar 2025 09:40:10 +0000 (09:40 +0000)

committer Richard Sandiford <richard.sandiford@arm.com>

Wed, 12 Mar 2025 09:40:10 +0000 (09:40 +0000)
author Richard Sandiford <richard.sandiford@arm.com>
Wed, 12 Mar 2025 09:40:10 +0000 (09:40 +0000)
committer Richard Sandiford <richard.sandiford@arm.com>
Wed, 12 Mar 2025 09:40:10 +0000 (09:40 +0000)
diff --git a/gcc/testsuite/gcc.target/aarch64/sve/reduc_strict_4.c b/gcc/testsuite/gcc.target/aarch64/sve/reduc_strict_4.c

index 9a12edad42ecbe8b595771fd94982cc8aa65c5e6..8dad5ee601663886909160b1de9a55e0b5bbf497 100644 (file)
--- a/gcc/testsuite/gcc.target/aarch64/sve/reduc_strict_4.c
+++ b/gcc/testsuite/gcc.target/aarch64/sve/reduc_strict_4.c
@@ -1,5 +1,5 @@
  /* { dg-do compile } */
-/* { dg-options "-O2 -ftree-vectorize" } */
+/* { dg-options "-O2 -ftree-vectorize -fno-vect-cost-model" } */
  
  double mat[100][8];
  
diff --git a/gcc/testsuite/gcc.target/aarch64/sve/reduc_strict_5.c b/gcc/testsuite/gcc.target/aarch64/sve/reduc_strict_5.c

index 7c3068fe87ad36e4f691093e25d9665a0ab49165..9e117812d340ae4f12d07e117533510b83edf031 100644 (file)
--- a/gcc/testsuite/gcc.target/aarch64/sve/reduc_strict_5.c
+++ b/gcc/testsuite/gcc.target/aarch64/sve/reduc_strict_5.c
@@ -1,5 +1,5 @@
  /* { dg-do compile } */
-/* { dg-options "-O2 -ftree-vectorize" } */
+/* { dg-options "-O2 -ftree-vectorize -fno-vect-cost-model" } */
  
  double mat[100][12];
  
diff --git a/gcc/tree-vect-loop.cc b/gcc/tree-vect-loop.cc

index 52533623cab93ad47a8ca436961e1b655c1ca7c7..9413dcef702597ab27165e676546b190e2bd36ba 100644 (file)
--- a/gcc/tree-vect-loop.cc
+++ b/gcc/tree-vect-loop.cc
@@ -8180,7 +8180,7 @@ vectorizable_reduction (loop_vec_info loop_vinfo,
      return false;
  
    if (slp_node)
-    ncopies = 1;
+    ncopies = SLP_TREE_NUMBER_OF_VEC_STMTS (slp_node);
    else
      ncopies = vect_get_num_copies (loop_vinfo, vectype_in);
  
@@ -8288,7 +8288,7 @@ vectorizable_reduction (loop_vec_info loop_vinfo,
         || reduction_type == CONST_COND_REDUCTION
         || reduction_type == EXTRACT_LAST_REDUCTION)
        && slp_node
-      && SLP_TREE_NUMBER_OF_VEC_STMTS (slp_node) > 1)
+      && ncopies > 1)
      {
        if (dump_enabled_p ())
         dump_printf_loc (MSG_MISSED_OPTIMIZATION, vect_location,
@@ -8297,6 +8297,7 @@ vectorizable_reduction (loop_vec_info loop_vinfo,
      }
  
    if ((double_reduc || reduction_type != TREE_CODE_REDUCTION)
+      && !slp_node
        && ncopies > 1)
      {
        if (dump_enabled_p ())
@@ -8523,11 +8524,10 @@ vectorizable_reduction (loop_vec_info loop_vinfo,
     participating.  When unrolling we want each unrolled iteration to have its
     own reduction accumulator since one of the main goals of unrolling a
     reduction is to reduce the aggregate loop-carried latency.  */
-  if ((ncopies > 1
-       || (slp_node
-          && !REDUC_GROUP_FIRST_ELEMENT (stmt_info)
-          && SLP_TREE_LANES (slp_node) == 1
-          && vect_get_num_copies (loop_vinfo, vectype_in) > 1))
+  if (ncopies > 1
+      && (!slp_node
+         || (!REDUC_GROUP_FIRST_ELEMENT (stmt_info)
+             && SLP_TREE_LANES (slp_node) == 1))
        && (STMT_VINFO_RELEVANT (stmt_info) <= vect_used_only_live)
        && reduc_chain_length == 1
        && loop_vinfo->suggested_unroll_factor == 1)
author	Richard Sandiford <richard.sandiford@arm.com>
	Wed, 12 Mar 2025 09:40:10 +0000 (09:40 +0000)
committer	Richard Sandiford <richard.sandiford@arm.com>
	Wed, 12 Mar 2025 09:40:10 +0000 (09:40 +0000)
gcc/testsuite/gcc.target/aarch64/sve/reduc_strict_4.c		patch \| blob \| blame \| history
gcc/testsuite/gcc.target/aarch64/sve/reduc_strict_5.c		patch \| blob \| blame \| history
gcc/tree-vect-loop.cc		patch \| blob \| blame \| history