simplify-rtx: Simplify ROTATE:HI (X:HI, 8) into BSWAP:HI (X)

author Kyrylo Tkachov <ktkachov@nvidia.com>

Thu, 17 Oct 2024 13:39:57 +0000 (06:39 -0700)

committer Kyrylo Tkachov <ktkachov@nvidia.com>

Mon, 4 Nov 2024 08:41:09 +0000 (09:41 +0100)
author Kyrylo Tkachov <ktkachov@nvidia.com>
Thu, 17 Oct 2024 13:39:57 +0000 (06:39 -0700)
committer Kyrylo Tkachov <ktkachov@nvidia.com>
Mon, 4 Nov 2024 08:41:09 +0000 (09:41 +0100)
diff --git a/gcc/simplify-rtx.cc b/gcc/simplify-rtx.cc

index 0ff72638d85f85c71cf7719d77c061652330fe6c..751c908113eff4b5ffd378ded99d374fe4f21aa2 100644 (file)
--- a/gcc/simplify-rtx.cc
+++ b/gcc/simplify-rtx.cc
@@ -4328,6 +4328,14 @@ simplify_context::simplify_binary_operation_1 (rtx_code code,
                                       mode, op0, new_amount_rtx);
         }
  #endif
+      /* ROTATE/ROTATERT:HI (X:HI, 8) is BSWAP:HI (X).  Other combinations
+        such as SImode with a count of 16 do not correspond to RTL BSWAP
+        semantics.  */
+      tem = unwrap_const_vec_duplicate (trueop1);
+      if (GET_MODE_UNIT_BITSIZE (mode) == (2 * BITS_PER_UNIT)
+         && CONST_INT_P (tem) && INTVAL (tem) == BITS_PER_UNIT)
+       return simplify_gen_unary (BSWAP, mode, op0, mode);
+
        /* FALLTHRU */
      case ASHIFTRT:
        if (trueop1 == CONST0_RTX (mode))
diff --git a/gcc/testsuite/gcc.target/aarch64/rot_to_bswap.c b/gcc/testsuite/gcc.target/aarch64/rot_to_bswap.c

new file mode 100644 (file)

index 0000000..f5b002d
--- /dev/null
+++ b/gcc/testsuite/gcc.target/aarch64/rot_to_bswap.c
@@ -0,0 +1,23 @@
+/* { dg-do compile } */
+/* { dg-options "-O2 --param aarch64-autovec-preference=asimd-only" } */
+
+#pragma GCC target "+nosve"
+
+
+#define N 1024
+
+unsigned short in_s[N];
+unsigned short out_s[N];
+
+void
+foo16 (void)
+{
+  for (unsigned i = 0; i < N; i++)
+  {
+    unsigned short x = in_s[i];
+    out_s[i] = (x >> 8) | (x << 8);
+  }
+}
+
+/* { dg-final { scan-assembler {\trev16\tv([123])?[0-9]\.16b, v([123])?[0-9]\.16b} } } */
+
author	Kyrylo Tkachov <ktkachov@nvidia.com>
	Thu, 17 Oct 2024 13:39:57 +0000 (06:39 -0700)
committer	Kyrylo Tkachov <ktkachov@nvidia.com>
	Mon, 4 Nov 2024 08:41:09 +0000 (09:41 +0100)
gcc/simplify-rtx.cc		patch \| blob \| blame \| history
gcc/testsuite/gcc.target/aarch64/rot_to_bswap.c	[new file with mode: 0644]	patch \| blob