aarch64: Use canonical RTL representation for SVE2 XAR and extend it to fixed-width...

author Kyrylo Tkachov <ktkachov@nvidia.com>

Tue, 22 Oct 2024 10:27:47 +0000 (03:27 -0700)

committer Kyrylo Tkachov <ktkachov@nvidia.com>

Mon, 4 Nov 2024 08:41:09 +0000 (09:41 +0100)
author Kyrylo Tkachov <ktkachov@nvidia.com>
Tue, 22 Oct 2024 10:27:47 +0000 (03:27 -0700)
committer Kyrylo Tkachov <ktkachov@nvidia.com>
Mon, 4 Nov 2024 08:41:09 +0000 (09:41 +0100)
diff --git a/gcc/config/aarch64/aarch64-sve-builtins-sve2.cc b/gcc/config/aarch64/aarch64-sve-builtins-sve2.cc

index 64f86035c30e76229decff68a2f24ded63fd3153..f0ab7400ef50fe45904f75ce568ef493a37d518b 100644 (file)
--- a/gcc/config/aarch64/aarch64-sve-builtins-sve2.cc
+++ b/gcc/config/aarch64/aarch64-sve-builtins-sve2.cc
@@ -108,6 +108,22 @@ public:
    }
  };
  
+class svxar_impl : public function_base
+{
+public:
+  rtx
+  expand (function_expander &e) const override
+  {
+    /* aarch64_sve2_xar represents this operation with a left-rotate RTX.
+       Convert the right-rotate amount from the intrinsic to fit this.  */
+    machine_mode mode = e.vector_mode (0);
+    HOST_WIDE_INT rot = GET_MODE_UNIT_BITSIZE (mode)
+                       - INTVAL (e.args[2]);
+    e.args[2] = aarch64_simd_gen_const_vector_dup (mode, rot);
+    return e.use_exact_insn (code_for_aarch64_sve2_xar (mode));
+  }
+};
+
  class svcdot_impl : public function_base
  {
  public:
@@ -795,6 +811,6 @@ FUNCTION (svwhilege, while_comparison, (UNSPEC_WHILEGE, UNSPEC_WHILEHS))
  FUNCTION (svwhilegt, while_comparison, (UNSPEC_WHILEGT, UNSPEC_WHILEHI))
  FUNCTION (svwhilerw, svwhilerw_svwhilewr_impl, (UNSPEC_WHILERW))
  FUNCTION (svwhilewr, svwhilerw_svwhilewr_impl, (UNSPEC_WHILEWR))
-FUNCTION (svxar, CODE_FOR_MODE0 (aarch64_sve2_xar),)
+FUNCTION (svxar, svxar_impl,)
  
  } /* end namespace aarch64_sve */
diff --git a/gcc/config/aarch64/aarch64-sve2.md b/gcc/config/aarch64/aarch64-sve2.md

index 5f2697c31797b7334dc28a67a72ce34478e3be7a..8047f405a17cf34007841ffab30eb14f0002e85d 100644 (file)
--- a/gcc/config/aarch64/aarch64-sve2.md
+++ b/gcc/config/aarch64/aarch64-sve2.md
@@ -1266,18 +1266,28 @@
  ;; - XAR
  ;; -------------------------------------------------------------------------
  
+;; Also allow the Advanced SIMD modes as the the SVE2 XAR instruction
+;; can handle more element sizes than the TARGET_SHA3 one from Advanced SIMD.
+;; Don't allow the V2DImode use here unless !TARGET_SHA3 as the Advanced SIMD
+;; version should be preferred when available as it is non-destructive on its
+;; input.
  (define_insn "@aarch64_sve2_xar<mode>"
-  [(set (match_operand:SVE_FULL_I 0 "register_operand")
-       (rotatert:SVE_FULL_I
-         (xor:SVE_FULL_I
-           (match_operand:SVE_FULL_I 1 "register_operand")
-           (match_operand:SVE_FULL_I 2 "register_operand"))
-         (match_operand:SVE_FULL_I 3 "aarch64_simd_rshift_imm")))]
-  "TARGET_SVE2"
-  {@ [ cons: =0 , 1  , 2 ; attrs: movprfx ]
-     [ w        , %0 , w ; *              ] xar\t%0.<Vetype>, %0.<Vetype>, %2.<Vetype>, #%3
-     [ ?&w      , w  , w ; yes            ] movprfx\t%0, %1\;xar\t%0.<Vetype>, %0.<Vetype>, %2.<Vetype>, #%3
+  [(set (match_operand:SVE_ASIMD_FULL_I 0 "register_operand" "=w,?&w")
+       (rotate:SVE_ASIMD_FULL_I
+         (xor:SVE_ASIMD_FULL_I
+           (match_operand:SVE_ASIMD_FULL_I 1 "register_operand" "%0,w")
+           (match_operand:SVE_ASIMD_FULL_I 2 "register_operand" "w,w"))
+         (match_operand:SVE_ASIMD_FULL_I 3 "aarch64_simd_lshift_imm")))]
+  "TARGET_SVE2 && !(<MODE>mode == V2DImode && TARGET_SHA3)"
+  {
+    operands[3]
+      = GEN_INT (GET_MODE_UNIT_BITSIZE (<MODE>mode)
+                - INTVAL (unwrap_const_vec_duplicate (operands[3])));
+    if (which_alternative == 0)
+      return "xar\t%Z0.<Vetype>, %Z0.<Vetype>, %Z2.<Vetype>, #%3";
+    return "movprfx\t%Z0, %Z1\;xar\t%Z0.<Vetype>, %Z0.<Vetype>, %Z2.<Vetype>, #%3";
    }
+  [(set_attr "movprfx" "*,yes")]
  )
  
  ;; -------------------------------------------------------------------------
diff --git a/gcc/config/aarch64/iterators.md b/gcc/config/aarch64/iterators.md

index 0bc98315bb68ffe858ca634fd72505dfb0f17218..8269b0cdcd926f524c9c6b9f2f072937d92f7529 100644 (file)
--- a/gcc/config/aarch64/iterators.md
+++ b/gcc/config/aarch64/iterators.md
@@ -446,6 +446,9 @@
  ;; All fully-packed SVE integer vector modes.
  (define_mode_iterator SVE_FULL_I [VNx16QI VNx8HI VNx4SI VNx2DI])
  
+;; All fully-packed SVE integer and Advanced SIMD integer modes.
+(define_mode_iterator SVE_ASIMD_FULL_I [SVE_FULL_I VDQ_I])
+
  ;; All fully-packed SVE floating-point vector modes.
  (define_mode_iterator SVE_FULL_F [VNx8HF VNx4SF VNx2DF])
  
diff --git a/gcc/testsuite/gcc.target/aarch64/sve2/acle/asm/xar_s16.c b/gcc/testsuite/gcc.target/aarch64/sve2/acle/asm/xar_s16.c

index 34351d52718e39fc948122bbe18955866cdc5926..f69ba3f7b06bdaea0641970204bf4452f926b5f9 100644 (file)
--- a/gcc/testsuite/gcc.target/aarch64/sve2/acle/asm/xar_s16.c
+++ b/gcc/testsuite/gcc.target/aarch64/sve2/acle/asm/xar_s16.c
@@ -70,7 +70,11 @@ TEST_UNIFORM_Z (xar_2_s16_untied, svint16_t,
  
  /*
  ** xar_16_s16_tied1:
-**     xar     z0\.h, z0\.h, z1\.h, #16
+** (
+**     eor     z0\.d, z1\.d, z0\.d
+** |
+**     eor     z0\.d, z0\.d, z1\.d
+** )
  **     ret
  */
  TEST_UNIFORM_Z (xar_16_s16_tied1, svint16_t,
@@ -79,7 +83,11 @@ TEST_UNIFORM_Z (xar_16_s16_tied1, svint16_t,
  
  /*
  ** xar_16_s16_tied2:
-**     xar     z0\.h, z0\.h, z1\.h, #16
+** (
+**     eor     z0\.d, z1\.d, z0\.d
+** |
+**     eor     z0\.d, z0\.d, z1\.d
+** )
  **     ret
  */
  TEST_UNIFORM_Z (xar_16_s16_tied2, svint16_t,
@@ -89,11 +97,9 @@ TEST_UNIFORM_Z (xar_16_s16_tied2, svint16_t,
  /*
  ** xar_16_s16_untied:
  ** (
-**     movprfx z0, z1
-**     xar     z0\.h, z0\.h, z2\.h, #16
+**     eor     z0\.d, z1\.d, z2\.d
  ** |
-**     movprfx z0, z2
-**     xar     z0\.h, z0\.h, z1\.h, #16
+**     eor     z0\.d, z2\.d, z1\.d
  ** )
  **     ret
  */
diff --git a/gcc/testsuite/gcc.target/aarch64/sve2/acle/asm/xar_s32.c b/gcc/testsuite/gcc.target/aarch64/sve2/acle/asm/xar_s32.c

index 366a617280760e18e73a7f077ac19267dfaa99b9..540f7b875ecc67f7b965ae85c37f76ce949ae075 100644 (file)
--- a/gcc/testsuite/gcc.target/aarch64/sve2/acle/asm/xar_s32.c
+++ b/gcc/testsuite/gcc.target/aarch64/sve2/acle/asm/xar_s32.c
@@ -70,7 +70,11 @@ TEST_UNIFORM_Z (xar_2_s32_untied, svint32_t,
  
  /*
  ** xar_32_s32_tied1:
-**     xar     z0\.s, z0\.s, z1\.s, #32
+** (
+**     eor     z0\.d, z1\.d, z0\.d
+** |
+**     eor     z0\.d, z0\.d, z1\.d
+** )
  **     ret
  */
  TEST_UNIFORM_Z (xar_32_s32_tied1, svint32_t,
@@ -79,7 +83,11 @@ TEST_UNIFORM_Z (xar_32_s32_tied1, svint32_t,
  
  /*
  ** xar_32_s32_tied2:
-**     xar     z0\.s, z0\.s, z1\.s, #32
+** (
+**     eor     z0\.d, z0\.d, z1\.d
+** |
+**     eor     z0\.d, z1\.d, z0\.d
+** )
  **     ret
  */
  TEST_UNIFORM_Z (xar_32_s32_tied2, svint32_t,
@@ -89,11 +97,9 @@ TEST_UNIFORM_Z (xar_32_s32_tied2, svint32_t,
  /*
  ** xar_32_s32_untied:
  ** (
-**     movprfx z0, z1
-**     xar     z0\.s, z0\.s, z2\.s, #32
+**     eor     z0\.d, z1\.d, z2\.d
  ** |
-**     movprfx z0, z2
-**     xar     z0\.s, z0\.s, z1\.s, #32
+**     eor     z0\.d, z2\.d, z1\.d
  ** )
  **     ret
  */
diff --git a/gcc/testsuite/gcc.target/aarch64/sve2/acle/asm/xar_s64.c b/gcc/testsuite/gcc.target/aarch64/sve2/acle/asm/xar_s64.c

index dedda2ed044492ca66b0ce91831e712b37dc2cac..9491dbdb848a98e7b59d6c31fa16d33151d60305 100644 (file)
--- a/gcc/testsuite/gcc.target/aarch64/sve2/acle/asm/xar_s64.c
+++ b/gcc/testsuite/gcc.target/aarch64/sve2/acle/asm/xar_s64.c
@@ -70,7 +70,11 @@ TEST_UNIFORM_Z (xar_2_s64_untied, svint64_t,
  
  /*
  ** xar_64_s64_tied1:
-**     xar     z0\.d, z0\.d, z1\.d, #64
+** (
+**     eor     z0\.d, z1\.d, z0\.d
+** |
+**     eor     z0\.d, z0\.d, z1\.d
+** )
  **     ret
  */
  TEST_UNIFORM_Z (xar_64_s64_tied1, svint64_t,
@@ -79,7 +83,11 @@ TEST_UNIFORM_Z (xar_64_s64_tied1, svint64_t,
  
  /*
  ** xar_64_s64_tied2:
-**     xar     z0\.d, z0\.d, z1\.d, #64
+** (
+**     eor     z0\.d, z1\.d, z0\.d
+** |
+**     eor     z0\.d, z0\.d, z1\.d
+** )
  **     ret
  */
  TEST_UNIFORM_Z (xar_64_s64_tied2, svint64_t,
@@ -89,11 +97,9 @@ TEST_UNIFORM_Z (xar_64_s64_tied2, svint64_t,
  /*
  ** xar_64_s64_untied:
  ** (
-**     movprfx z0, z1
-**     xar     z0\.d, z0\.d, z2\.d, #64
+**     eor     z0\.d, z1\.d, z2\.d
  ** |
-**     movprfx z0, z2
-**     xar     z0\.d, z0\.d, z1\.d, #64
+**     eor     z0\.d, z2\.d, z1\.d
  ** )
  **     ret
  */
diff --git a/gcc/testsuite/gcc.target/aarch64/sve2/acle/asm/xar_s8.c b/gcc/testsuite/gcc.target/aarch64/sve2/acle/asm/xar_s8.c

index 904352b93da8876b6c929e3b8e4fbfdb8132d98d..e62e5bca5ba2e3cbc7c60570e498c267cdb9522e 100644 (file)
--- a/gcc/testsuite/gcc.target/aarch64/sve2/acle/asm/xar_s8.c
+++ b/gcc/testsuite/gcc.target/aarch64/sve2/acle/asm/xar_s8.c
@@ -70,7 +70,11 @@ TEST_UNIFORM_Z (xar_2_s8_untied, svint8_t,
  
  /*
  ** xar_8_s8_tied1:
-**     xar     z0\.b, z0\.b, z1\.b, #8
+** (
+**     eor     z0\.d, z1\.d, z0\.d
+** |
+**     eor     z0\.d, z0\.d, z1\.d
+** )
  **     ret
  */
  TEST_UNIFORM_Z (xar_8_s8_tied1, svint8_t,
@@ -79,7 +83,11 @@ TEST_UNIFORM_Z (xar_8_s8_tied1, svint8_t,
  
  /*
  ** xar_8_s8_tied2:
-**     xar     z0\.b, z0\.b, z1\.b, #8
+** (
+**     eor     z0\.d, z1\.d, z0\.d
+** |
+**     eor     z0\.d, z0\.d, z1\.d
+** )
  **     ret
  */
  TEST_UNIFORM_Z (xar_8_s8_tied2, svint8_t,
@@ -89,11 +97,9 @@ TEST_UNIFORM_Z (xar_8_s8_tied2, svint8_t,
  /*
  ** xar_8_s8_untied:
  ** (
-**     movprfx z0, z1
-**     xar     z0\.b, z0\.b, z2\.b, #8
+**     eor     z0\.d, z1\.d, z2\.d
  ** |
-**     movprfx z0, z2
-**     xar     z0\.b, z0\.b, z1\.b, #8
+**     eor     z0\.d, z2\.d, z1\.d
  ** )
  **     ret
  */
diff --git a/gcc/testsuite/gcc.target/aarch64/sve2/acle/asm/xar_u16.c b/gcc/testsuite/gcc.target/aarch64/sve2/acle/asm/xar_u16.c

index c7b9665aeed412109e92f1c9fcfa2489e8e65d3c..6269145bc6de4f6abe1dd01186e7c21874f3fd5b 100644 (file)
--- a/gcc/testsuite/gcc.target/aarch64/sve2/acle/asm/xar_u16.c
+++ b/gcc/testsuite/gcc.target/aarch64/sve2/acle/asm/xar_u16.c
@@ -70,7 +70,11 @@ TEST_UNIFORM_Z (xar_2_u16_untied, svuint16_t,
  
  /*
  ** xar_16_u16_tied1:
-**     xar     z0\.h, z0\.h, z1\.h, #16
+** (
+**     eor     z0\.d, z1\.d, z0\.d
+** |
+**     eor     z0\.d, z0\.d, z1\.d
+** )
  **     ret
  */
  TEST_UNIFORM_Z (xar_16_u16_tied1, svuint16_t,
@@ -79,7 +83,11 @@ TEST_UNIFORM_Z (xar_16_u16_tied1, svuint16_t,
  
  /*
  ** xar_16_u16_tied2:
-**     xar     z0\.h, z0\.h, z1\.h, #16
+** (
+**     eor     z0\.d, z1\.d, z0\.d
+** |
+**     eor     z0\.d, z0\.d, z1\.d
+** )
  **     ret
  */
  TEST_UNIFORM_Z (xar_16_u16_tied2, svuint16_t,
@@ -89,11 +97,9 @@ TEST_UNIFORM_Z (xar_16_u16_tied2, svuint16_t,
  /*
  ** xar_16_u16_untied:
  ** (
-**     movprfx z0, z1
-**     xar     z0\.h, z0\.h, z2\.h, #16
+**     eor     z0\.d, z1\.d, z2\.d
  ** |
-**     movprfx z0, z2
-**     xar     z0\.h, z0\.h, z1\.h, #16
+**     eor     z0\.d, z2\.d, z1\.d
  ** )
  **     ret
  */
diff --git a/gcc/testsuite/gcc.target/aarch64/sve2/acle/asm/xar_u32.c b/gcc/testsuite/gcc.target/aarch64/sve2/acle/asm/xar_u32.c

index 115ead7701c303abfa1e6eb2a4df20b7e7099cd1..99efd14e1ed9122598afd739f3382ce3ac071062 100644 (file)
--- a/gcc/testsuite/gcc.target/aarch64/sve2/acle/asm/xar_u32.c
+++ b/gcc/testsuite/gcc.target/aarch64/sve2/acle/asm/xar_u32.c
@@ -70,7 +70,11 @@ TEST_UNIFORM_Z (xar_2_u32_untied, svuint32_t,
  
  /*
  ** xar_32_u32_tied1:
-**     xar     z0\.s, z0\.s, z1\.s, #32
+** (
+**     eor     z0\.d, z1\.d, z0\.d
+** |
+**     eor     z0\.d, z0\.d, z1\.d
+** )
  **     ret
  */
  TEST_UNIFORM_Z (xar_32_u32_tied1, svuint32_t,
@@ -79,7 +83,11 @@ TEST_UNIFORM_Z (xar_32_u32_tied1, svuint32_t,
  
  /*
  ** xar_32_u32_tied2:
-**     xar     z0\.s, z0\.s, z1\.s, #32
+** (
+**     eor     z0\.d, z1\.d, z0\.d
+** |
+**     eor     z0\.d, z0\.d, z1\.d
+** )
  **     ret
  */
  TEST_UNIFORM_Z (xar_32_u32_tied2, svuint32_t,
@@ -89,11 +97,9 @@ TEST_UNIFORM_Z (xar_32_u32_tied2, svuint32_t,
  /*
  ** xar_32_u32_untied:
  ** (
-**     movprfx z0, z1
-**     xar     z0\.s, z0\.s, z2\.s, #32
+**     eor     z0\.d, z1\.d, z2\.d
  ** |
-**     movprfx z0, z2
-**     xar     z0\.s, z0\.s, z1\.s, #32
+**     eor     z0\.d, z2\.d, z1\.d
  ** )
  **     ret
  */
diff --git a/gcc/testsuite/gcc.target/aarch64/sve2/acle/asm/xar_u64.c b/gcc/testsuite/gcc.target/aarch64/sve2/acle/asm/xar_u64.c

index 1d0d90e90d60779011aee795fb8ab73cbbb16e3b..5c770ffdadbf58757c0d7255e64d85a71064ed4b 100644 (file)
--- a/gcc/testsuite/gcc.target/aarch64/sve2/acle/asm/xar_u64.c
+++ b/gcc/testsuite/gcc.target/aarch64/sve2/acle/asm/xar_u64.c
@@ -70,7 +70,11 @@ TEST_UNIFORM_Z (xar_2_u64_untied, svuint64_t,
  
  /*
  ** xar_64_u64_tied1:
-**     xar     z0\.d, z0\.d, z1\.d, #64
+** (
+**     eor     z0\.d, z1\.d, z0\.d
+** |
+**     eor     z0\.d, z0\.d, z1\.d
+** )
  **     ret
  */
  TEST_UNIFORM_Z (xar_64_u64_tied1, svuint64_t,
@@ -79,7 +83,11 @@ TEST_UNIFORM_Z (xar_64_u64_tied1, svuint64_t,
  
  /*
  ** xar_64_u64_tied2:
-**     xar     z0\.d, z0\.d, z1\.d, #64
+** (
+**     eor     z0\.d, z1\.d, z0\.d
+** |
+**     eor     z0\.d, z0\.d, z1\.d
+** )
  **     ret
  */
  TEST_UNIFORM_Z (xar_64_u64_tied2, svuint64_t,
@@ -89,11 +97,9 @@ TEST_UNIFORM_Z (xar_64_u64_tied2, svuint64_t,
  /*
  ** xar_64_u64_untied:
  ** (
-**     movprfx z0, z1
-**     xar     z0\.d, z0\.d, z2\.d, #64
+**     eor     z0\.d, z1\.d, z2\.d
  ** |
-**     movprfx z0, z2
-**     xar     z0\.d, z0\.d, z1\.d, #64
+**     eor     z0\.d, z2\.d, z1\.d
  ** )
  **     ret
  */
diff --git a/gcc/testsuite/gcc.target/aarch64/sve2/acle/asm/xar_u8.c b/gcc/testsuite/gcc.target/aarch64/sve2/acle/asm/xar_u8.c

index 3b6161729cbc5372b57f5133c65280ad8ad3602e..5ae5323a08a34e287d6a90f4b7a99bd50b987ee5 100644 (file)
--- a/gcc/testsuite/gcc.target/aarch64/sve2/acle/asm/xar_u8.c
+++ b/gcc/testsuite/gcc.target/aarch64/sve2/acle/asm/xar_u8.c
@@ -70,7 +70,11 @@ TEST_UNIFORM_Z (xar_2_u8_untied, svuint8_t,
  
  /*
  ** xar_8_u8_tied1:
-**     xar     z0\.b, z0\.b, z1\.b, #8
+** (
+**     eor     z0\.d, z1\.d, z0\.d
+** |
+**     eor     z0\.d, z0\.d, z1\.d
+** )
  **     ret
  */
  TEST_UNIFORM_Z (xar_8_u8_tied1, svuint8_t,
@@ -79,7 +83,11 @@ TEST_UNIFORM_Z (xar_8_u8_tied1, svuint8_t,
  
  /*
  ** xar_8_u8_tied2:
-**     xar     z0\.b, z0\.b, z1\.b, #8
+** (
+**     eor     z0\.d, z1\.d, z0\.d
+** |
+**     eor     z0\.d, z0\.d, z1\.d
+** )
  **     ret
  */
  TEST_UNIFORM_Z (xar_8_u8_tied2, svuint8_t,
@@ -89,11 +97,9 @@ TEST_UNIFORM_Z (xar_8_u8_tied2, svuint8_t,
  /*
  ** xar_8_u8_untied:
  ** (
-**     movprfx z0, z1
-**     xar     z0\.b, z0\.b, z2\.b, #8
+**     eor     z0\.d, z1\.d, z2\.d
  ** |
-**     movprfx z0, z2
-**     xar     z0\.b, z0\.b, z1\.b, #8
+**     eor     z0\.d, z2\.d, z1\.d
  ** )
  **     ret
  */
diff --git a/gcc/testsuite/gcc.target/aarch64/xar_neon_modes.c b/gcc/testsuite/gcc.target/aarch64/xar_neon_modes.c

new file mode 100644 (file)

index 0000000..750fbcf
--- /dev/null
+++ b/gcc/testsuite/gcc.target/aarch64/xar_neon_modes.c
@@ -0,0 +1,39 @@
+/* { dg-do compile } */
+/* { dg-options "-O2" } */
+
+#pragma GCC target "+sve2+nosha3"
+
+typedef char __attribute__ ((vector_size (16))) v16qi;
+typedef unsigned short __attribute__ ((vector_size (16))) v8hi;
+typedef unsigned int __attribute__ ((vector_size (16))) v4si;
+typedef unsigned long long __attribute__ ((vector_size (16))) v2di;
+
+v16qi
+xar_v16qi (v16qi a, v16qi b) {
+  v16qi c = a ^ b;
+  return (c << 2) ^ (c >> 6);
+}
+/* { dg-final { scan-assembler {\txar\tz0.b, z[0-9]+.b, z[0-9]+.b, #6} } } */
+
+v8hi
+xar_v8hi (v8hi a, v8hi b) {
+  v8hi c = a ^ b;
+  return (c << 13) ^ (c >> 3);
+}
+/* { dg-final { scan-assembler {\txar\tz0.h, z[0-9]+.h, z[0-9]+.h, #3} } } */
+
+v4si
+xar_v4si (v4si a, v4si b) {
+  v4si c = a ^ b;
+  return (c << 9) ^ (c >> 23);
+}
+/* { dg-final { scan-assembler {\txar\tz0.s, z[0-9]+.s, z[0-9]+.s, #23} } } */
+
+/* When +sha3 for Advanced SIMD is not available we should still use the
+   SVE2 form of XAR.  */
+v2di
+xar_v2di (v2di a, v2di b) {
+  v2di c = a ^ b;
+  return (c << 22) ^ (c >> 42);
+}
+/* { dg-final { scan-assembler {\txar\tz0.d, z[0-9]+.d, z[0-9]+.d, #42} } } */
diff --git a/gcc/testsuite/gcc.target/aarch64/xar_v2di_nonsve.c b/gcc/testsuite/gcc.target/aarch64/xar_v2di_nonsve.c

new file mode 100644 (file)

index 0000000..b0f1a97
--- /dev/null
+++ b/gcc/testsuite/gcc.target/aarch64/xar_v2di_nonsve.c
@@ -0,0 +1,16 @@
+/* { dg-do compile } */
+/* { dg-options "-O2" } */
+
+#pragma GCC target "+sve2+sha3"
+
+typedef unsigned long long __attribute__ ((vector_size (16))) v2di;
+
+/* Both +sve2 and +sha3 have V2DImode XAR instructions, but we should
+   prefer the Advanced SIMD one when both are available.  */
+v2di
+xar_v2di (v2di a, v2di b) {
+  v2di c = a ^ b;
+  return (c << 22) ^ (c >> 42);
+}
+/* { dg-final { scan-assembler {\txar\tv0.2d, v[0-9]+.2d, v[0-9]+.2d, 42} } } */
+
author	Kyrylo Tkachov <ktkachov@nvidia.com>
	Tue, 22 Oct 2024 10:27:47 +0000 (03:27 -0700)
committer	Kyrylo Tkachov <ktkachov@nvidia.com>
	Mon, 4 Nov 2024 08:41:09 +0000 (09:41 +0100)
gcc/config/aarch64/aarch64-sve-builtins-sve2.cc		patch \| blob \| blame \| history
gcc/config/aarch64/aarch64-sve2.md		patch \| blob \| blame \| history
gcc/config/aarch64/iterators.md		patch \| blob \| blame \| history
gcc/testsuite/gcc.target/aarch64/sve2/acle/asm/xar_s16.c		patch \| blob \| blame \| history
gcc/testsuite/gcc.target/aarch64/sve2/acle/asm/xar_s32.c		patch \| blob \| blame \| history
gcc/testsuite/gcc.target/aarch64/sve2/acle/asm/xar_s64.c		patch \| blob \| blame \| history
gcc/testsuite/gcc.target/aarch64/sve2/acle/asm/xar_s8.c		patch \| blob \| blame \| history
gcc/testsuite/gcc.target/aarch64/sve2/acle/asm/xar_u16.c		patch \| blob \| blame \| history
gcc/testsuite/gcc.target/aarch64/sve2/acle/asm/xar_u32.c		patch \| blob \| blame \| history
gcc/testsuite/gcc.target/aarch64/sve2/acle/asm/xar_u64.c		patch \| blob \| blame \| history
gcc/testsuite/gcc.target/aarch64/sve2/acle/asm/xar_u8.c		patch \| blob \| blame \| history
gcc/testsuite/gcc.target/aarch64/xar_neon_modes.c	[new file with mode: 0644]	patch \| blob
gcc/testsuite/gcc.target/aarch64/xar_v2di_nonsve.c	[new file with mode: 0644]	patch \| blob