[arm] Implement usadv16qi and ssadv16qi standard names

author Przemyslaw Wirkus <przemyslaw.wirkus@arm.com>

Wed, 12 Jun 2019 08:27:59 +0000 (08:27 +0000)

committer Kyrylo Tkachov <ktkachov@gcc.gnu.org>

Wed, 12 Jun 2019 08:27:59 +0000 (08:27 +0000)
author Przemyslaw Wirkus <przemyslaw.wirkus@arm.com>
Wed, 12 Jun 2019 08:27:59 +0000 (08:27 +0000)
committer Kyrylo Tkachov <ktkachov@gcc.gnu.org>
Wed, 12 Jun 2019 08:27:59 +0000 (08:27 +0000)
diff --git a/gcc/ChangeLog b/gcc/ChangeLog

index c1d58a13aa3a3de6f209d0f8ac8a9fb8cb2940d4..eb297484547add0bcbff427972dfbc95af775970 100644 (file)
--- a/gcc/ChangeLog
+++ b/gcc/ChangeLog
@@ -1,3 +1,10 @@
+2019-06-12  Przemyslaw Wirkus  <przemyslaw.wirkus@arm.com>
+
+        * config/arm/iterators.md (VABAL): New int iterator.
+        * config/arm/neon.md (<sup>sadv16qi): New define_expand.
+        * config/arm/unspecs.md ("unspec"): Define UNSPEC_VABAL_S, UNSPEC_VABAL_U
+        values.
+
  2019-06-12  Martin Liska  <mliska@suse.cz>
  
         * value-prof.c (stream_out_histogram_value): Only first value
diff --git a/gcc/config/arm/iterators.md b/gcc/config/arm/iterators.md

index eb07c5b90c1b1905d35d7b480bdbe7d7a45ab7ba..2462b8c87ea7dbe60ba50d22b1e494bb4fe905c2 100644 (file)
--- a/gcc/config/arm/iterators.md
+++ b/gcc/config/arm/iterators.md
@@ -341,6 +341,8 @@
  
  (define_int_iterator VSUBHN [UNSPEC_VSUBHN UNSPEC_VRSUBHN])
  
+(define_int_iterator VABAL [UNSPEC_VABAL_S UNSPEC_VABAL_U])
+
  (define_int_iterator VABD [UNSPEC_VABD_S UNSPEC_VABD_U])
  
  (define_int_iterator VABDL [UNSPEC_VABDL_S UNSPEC_VABDL_U])
@@ -834,6 +836,7 @@
    (UNSPEC_VSUBW_S "s") (UNSPEC_VSUBW_U "u")
    (UNSPEC_VHSUB_S "s") (UNSPEC_VHSUB_U "u")
    (UNSPEC_VQSUB_S "s") (UNSPEC_VQSUB_U "u")
+  (UNSPEC_VABAL_S "s") (UNSPEC_VABAL_U "u")
    (UNSPEC_VABD_S "s") (UNSPEC_VABD_U "u")
    (UNSPEC_VABDL_S "s") (UNSPEC_VABDL_U "u")
    (UNSPEC_VMAX "s") (UNSPEC_VMAX_U "u")
diff --git a/gcc/config/arm/neon.md b/gcc/config/arm/neon.md

index 726b7281a11be92d0b7a91fa7b8ba9efd1b68ac9..bcf838f23e35b15a5417b68ed16fa902df507d63 100644 (file)
--- a/gcc/config/arm/neon.md
+++ b/gcc/config/arm/neon.md
@@ -3256,6 +3256,32 @@
    [(set_attr "type" "neon_arith_acc<q>")]
  )
  
+(define_expand "<sup>sadv16qi"
+  [(use (match_operand:V4SI 0 "register_operand"))
+   (unspec:V16QI [(use (match_operand:V16QI 1 "register_operand"))
+                  (use (match_operand:V16QI 2 "register_operand"))] VABAL)
+   (use (match_operand:V4SI 3 "register_operand"))]
+  "TARGET_NEON"
+  {
+    rtx reduc = gen_reg_rtx (V8HImode);
+    rtx op1_highpart = gen_reg_rtx (V8QImode);
+    rtx op2_highpart = gen_reg_rtx (V8QImode);
+
+    emit_insn (gen_neon_vabdl<sup>v8qi (reduc,
+                                        gen_lowpart (V8QImode, operands[1]),
+                                        gen_lowpart (V8QImode, operands[2])));
+
+    emit_insn (gen_neon_vget_highv16qi (op1_highpart, operands[1]));
+    emit_insn (gen_neon_vget_highv16qi (op2_highpart, operands[2]));
+    emit_insn (gen_neon_vabal<sup>v8qi (reduc, reduc,
+                                        op1_highpart, op2_highpart));
+    emit_insn (gen_neon_vpadal<sup>v8hi (operands[3], operands[3], reduc));
+
+    emit_move_insn (operands[0], operands[3]);
+    DONE;
+  }
+)
+
  (define_insn "neon_v<maxmin><sup><mode>"
    [(set (match_operand:VDQIW 0 "s_register_operand" "=w")
          (unspec:VDQIW [(match_operand:VDQIW 1 "s_register_operand" "w")
diff --git a/gcc/config/arm/unspecs.md b/gcc/config/arm/unspecs.md

index 174bcc5e3d5e1123cb1c1a595f5003884840aea8..41068bac90aa0ce6fef531789a38e5f7b3b27dff 100644 (file)
--- a/gcc/config/arm/unspecs.md
+++ b/gcc/config/arm/unspecs.md
@@ -200,6 +200,8 @@
    UNSPEC_SHA256SU1
    UNSPEC_VMULLP64
    UNSPEC_LOAD_COUNT
+  UNSPEC_VABAL_S
+  UNSPEC_VABAL_U
    UNSPEC_VABD_F
    UNSPEC_VABD_S
    UNSPEC_VABD_U
diff --git a/gcc/testsuite/ChangeLog b/gcc/testsuite/ChangeLog

index 27535710633f64cae1f9840cd0b473b74223939e..b6cba15451430fc6eb6a2a0b80417bb12fb023b7 100644 (file)
--- a/gcc/testsuite/ChangeLog
+++ b/gcc/testsuite/ChangeLog
@@ -1,3 +1,8 @@
+2019-06-12  Przemyslaw Wirkus  <przemyslaw.wirkus@arm.com>
+
+        * gcc.target/arm/ssadv16qi.c: New test.
+        * gcc.target/arm/usadv16qi.c: Likewise.
+
  2019-06-12  Jakub Jelinek  <jakub@redhat.com>
  
         PR c/90760
diff --git a/gcc/testsuite/gcc.target/arm/ssadv16qi.c b/gcc/testsuite/gcc.target/arm/ssadv16qi.c

new file mode 100644 (file)

index 0000000..dba5ef4
--- /dev/null
+++ b/gcc/testsuite/gcc.target/arm/ssadv16qi.c
@@ -0,0 +1,29 @@
+/* { dg-do compile } */
+/* { dg-additional-options "-O3 --save-temps" } */
+/* { dg-require-effective-target arm_fp_ok } */
+/* { dg-require-effective-target arm_neon_ok } */
+/* { dg-add-options arm_neon } */
+
+#define N 1024
+
+signed char pix1[N], pix2[N];
+
+int
+foo (void)
+{
+  int i_sum = 0;
+  int i;
+
+  for (i = 0; i < N; i++)
+    i_sum += __builtin_abs (pix1[i] - pix2[i]);
+
+  return i_sum;
+}
+
+/* { dg-final { scan-assembler {\tvabdl\.s8\t} } } */
+/* { dg-final { scan-assembler {\tvabal\.s8\t} } } */
+/* { dg-final { scan-assembler {\tvpadal\.s16\t} } } */
+
+/* { dg-final { scan-assembler-not {\tvmovl} } } */
+/* { dg-final { scan-assembler-not {\tvsub} } } */
+/* { dg-final { scan-assembler-not {\tvabs} } } */
diff --git a/gcc/testsuite/gcc.target/arm/usadv16qi.c b/gcc/testsuite/gcc.target/arm/usadv16qi.c

new file mode 100644 (file)

index 0000000..d744bcb
--- /dev/null
+++ b/gcc/testsuite/gcc.target/arm/usadv16qi.c
@@ -0,0 +1,29 @@
+/* { dg-do compile } */
+/* { dg-additional-options "-O3 --save-temps" } */
+/* { dg-require-effective-target arm_fp_ok } */
+/* { dg-require-effective-target arm_neon_ok } */
+/* { dg-add-options arm_neon } */
+
+#define N 1024
+
+unsigned char pix1[N], pix2[N];
+
+int
+foo (void)
+{
+  int i_sum = 0;
+  int i;
+
+  for (i = 0; i < N; i++)
+    i_sum += __builtin_abs (pix1[i] - pix2[i]);
+
+  return i_sum;
+}
+
+/* { dg-final { scan-assembler {\tvabdl\.u8\t} } } */
+/* { dg-final { scan-assembler {\tvabal\.u8\t} } } */
+/* { dg-final { scan-assembler {\tvpadal\.u16\t} } } */
+
+/* { dg-final { scan-assembler-not {\tvmovl} } } */
+/* { dg-final { scan-assembler-not {\tvsub} } } */
+/* { dg-final { scan-assembler-not {\tvabs} } } */
author	Przemyslaw Wirkus <przemyslaw.wirkus@arm.com>
	Wed, 12 Jun 2019 08:27:59 +0000 (08:27 +0000)
committer	Kyrylo Tkachov <ktkachov@gcc.gnu.org>
	Wed, 12 Jun 2019 08:27:59 +0000 (08:27 +0000)
gcc/ChangeLog		patch \| blob \| blame \| history
gcc/config/arm/iterators.md		patch \| blob \| blame \| history
gcc/config/arm/neon.md		patch \| blob \| blame \| history
gcc/config/arm/unspecs.md		patch \| blob \| blame \| history
gcc/testsuite/ChangeLog		patch \| blob \| blame \| history
gcc/testsuite/gcc.target/arm/ssadv16qi.c	[new file with mode: 0644]	patch \| blob
gcc/testsuite/gcc.target/arm/usadv16qi.c	[new file with mode: 0644]	patch \| blob