PR rtl-optimization/119046: Don't mark PARALLEL RTXes with floating-point mode as...

author Kyrylo Tkachov <ktkachov@nvidia.com>

Thu, 27 Feb 2025 17:00:25 +0000 (09:00 -0800)

committer Kyrylo Tkachov <ktkachov@nvidia.com>

Wed, 5 Mar 2025 15:21:36 +0000 (16:21 +0100)
author Kyrylo Tkachov <ktkachov@nvidia.com>
Thu, 27 Feb 2025 17:00:25 +0000 (09:00 -0800)
committer Kyrylo Tkachov <ktkachov@nvidia.com>
Wed, 5 Mar 2025 15:21:36 +0000 (16:21 +0100)
diff --git a/gcc/rtlanal.cc b/gcc/rtlanal.cc

index 8caffafdaa44eeb14cf1a7b407d336545f2f0376..7ad67afb9fe8fc3797a8abbbb0ba67ea208c7996 100644 (file)
--- a/gcc/rtlanal.cc
+++ b/gcc/rtlanal.cc
@@ -3252,6 +3252,7 @@ may_trap_p_1 (const_rtx x, unsigned flags)
         return true;
        break;
  
+    case PARALLEL:
      case NEG:
      case ABS:
      case SUBREG:
diff --git a/gcc/testsuite/gcc.target/aarch64/pr119046.c b/gcc/testsuite/gcc.target/aarch64/pr119046.c

new file mode 100644 (file)

index 0000000..aa5fa7c
--- /dev/null
+++ b/gcc/testsuite/gcc.target/aarch64/pr119046.c
@@ -0,0 +1,16 @@
+/* { dg-do compile } */
+/* { dg-additional-options "-O2" } */
+
+#include <arm_neon.h>
+
+float32x4_t madd_helper_1(float32x4_t a, float32x4_t b, float32x4_t d)
+{
+  float32x4_t t = a;
+  t = vfmaq_f32 (t, vdupq_n_f32(vgetq_lane_f32 (b, 1)), d);
+  t = vfmaq_f32 (t, vdupq_n_f32(vgetq_lane_f32 (b, 1)), d);
+  return t;
+}
+
+/* { dg-final { scan-assembler-not {\tdup\tv[0-9]+\.4s, v[0-9]+.s\[1\]\n} } } */
+/* { dg-final { scan-assembler-times {\tfmla\tv[0-9]+\.4s, v[0-9]+\.4s, v[0-9]+\.s\[1\]\n} 2 } } */
+
author	Kyrylo Tkachov <ktkachov@nvidia.com>
	Thu, 27 Feb 2025 17:00:25 +0000 (09:00 -0800)
committer	Kyrylo Tkachov <ktkachov@nvidia.com>
	Wed, 5 Mar 2025 15:21:36 +0000 (16:21 +0100)
gcc/rtlanal.cc		patch \| blob \| blame \| history
gcc/testsuite/gcc.target/aarch64/pr119046.c	[new file with mode: 0644]	patch \| blob