PR middle-end/119442: expr.cc: Fix vec_duplicate into vector boolean modes

author Kyrylo Tkachov <ktkachov@nvidia.com>

Mon, 24 Mar 2025 08:53:06 +0000 (01:53 -0700)

committer Kyrylo Tkachov <ktkachov@nvidia.com>

Mon, 31 Mar 2025 09:15:28 +0000 (11:15 +0200)
author Kyrylo Tkachov <ktkachov@nvidia.com>
Mon, 24 Mar 2025 08:53:06 +0000 (01:53 -0700)
committer Kyrylo Tkachov <ktkachov@nvidia.com>
Mon, 31 Mar 2025 09:15:28 +0000 (11:15 +0200)
diff --git a/gcc/expr.cc b/gcc/expr.cc

index 9f4382d7986b332d65a34f6fb7ba5c2996375a1c..2147eedad7bea1d02606a16f5a15428570497b5e 100644 (file)
--- a/gcc/expr.cc
+++ b/gcc/expr.cc
@@ -7920,11 +7920,16 @@ store_constructor (tree exp, rtx target, int cleared, poly_int64 size,
         gcc_assert (eltmode != BLKmode);
  
         /* Try using vec_duplicate_optab for uniform vectors.  */
+       icode = optab_handler (vec_duplicate_optab, mode);
         if (!TREE_SIDE_EFFECTS (exp)
             && VECTOR_MODE_P (mode)
-           && eltmode == GET_MODE_INNER (mode)
-           && ((icode = optab_handler (vec_duplicate_optab, mode))
-               != CODE_FOR_nothing)
+           && icode != CODE_FOR_nothing
+           /* If the vec_duplicate target pattern does not specify an element
+              mode check that eltmode is the normal inner mode of the
+              requested vector mode.  But if the target allows eltmode
+              explicitly go ahead and use it.  */
+           && (eltmode == GET_MODE_INNER (mode)
+               || insn_data[icode].operand[1].mode == eltmode)
             && (elt = uniform_vector_p (exp))
             && !VECTOR_TYPE_P (TREE_TYPE (elt)))
           {
diff --git a/gcc/testsuite/gcc.target/aarch64/vls_sve_vec_dup_1.c b/gcc/testsuite/gcc.target/aarch64/vls_sve_vec_dup_1.c

new file mode 100644 (file)

index 0000000..ada0d4f
--- /dev/null
+++ b/gcc/testsuite/gcc.target/aarch64/vls_sve_vec_dup_1.c
@@ -0,0 +1,15 @@
+/* { dg-do compile } */
+/* { dg-options "-O3 -march=armv8.2-a+sve -msve-vector-bits=128" } */
+
+float fasten_main_etot_0;
+void fasten_main() {
+  for (int l = 0; l < 2;) {
+    int phphb_nz;
+    for (; l < 32; l++) {
+      float dslv_e = l && phphb_nz;
+      fasten_main_etot_0 += dslv_e;
+    }
+  }
+}
+
+/* { dg-final { scan-assembler-not {bfi\tw\[0-9\]+} } } */
author	Kyrylo Tkachov <ktkachov@nvidia.com>
	Mon, 24 Mar 2025 08:53:06 +0000 (01:53 -0700)
committer	Kyrylo Tkachov <ktkachov@nvidia.com>
	Mon, 31 Mar 2025 09:15:28 +0000 (11:15 +0200)
gcc/expr.cc		patch \| blob \| blame \| history
gcc/testsuite/gcc.target/aarch64/vls_sve_vec_dup_1.c	[new file with mode: 0644]	patch \| blob