i386: Improve V[48]QI shifts on AVX512/SSE4.1

author Roger Sayle <roger@nextmovesoftware.com>

Fri, 10 May 2024 19:26:40 +0000 (20:26 +0100)

committer Roger Sayle <roger@nextmovesoftware.com>

Fri, 10 May 2024 19:26:40 +0000 (20:26 +0100)
author Roger Sayle <roger@nextmovesoftware.com>
Fri, 10 May 2024 19:26:40 +0000 (20:26 +0100)
committer Roger Sayle <roger@nextmovesoftware.com>
Fri, 10 May 2024 19:26:40 +0000 (20:26 +0100)
diff --git a/gcc/config/i386/i386-expand.cc b/gcc/config/i386/i386-expand.cc

index 2f27bfb484c2a2cd9bca5825eaaa5daa0adef981..1ab22fe7973624479277669fadb39b47689e60bd 100644 (file)
--- a/gcc/config/i386/i386-expand.cc
+++ b/gcc/config/i386/i386-expand.cc
@@ -24283,6 +24283,9 @@ ix86_expand_vecop_qihi_partial (enum rtx_code code, rtx dest, rtx op1, rtx op2)
  
    if (CONST_INT_P (op2)
        && (code == ASHIFT || code == LSHIFTRT || code == ASHIFTRT)
+      /* With AVX512 it's cheaper to do vpmovsxbw/op/vpmovwb.
+         Even with SSE4.1 the alternative is better.  */
+      && !TARGET_SSE4_1
        && ix86_expand_vec_shift_qihi_constant (code, qdest, qop1, qop2))
      {
        emit_move_insn (dest, gen_lowpart (qimode, qdest));
diff --git a/gcc/testsuite/gcc.target/i386/vect-shiftv4qi-2.c b/gcc/testsuite/gcc.target/i386/vect-shiftv4qi-2.c

new file mode 100644 (file)

index 0000000..abc1a27
--- /dev/null
+++ b/gcc/testsuite/gcc.target/i386/vect-shiftv4qi-2.c
@@ -0,0 +1,43 @@
+/* { dg-do compile } */
+/* { dg-options "-O2 -march=cascadelake" } */
+
+#define N 4
+
+typedef unsigned char __vu __attribute__ ((__vector_size__ (N)));
+typedef signed char __vi __attribute__ ((__vector_size__ (N)));
+
+__vu sll (__vu a, int n)
+{
+  return a << n;
+}
+
+__vu sll_c (__vu a)
+{
+  return a << 5;
+}
+
+/* { dg-final { scan-assembler-times "vpsllw" 2 } } */
+
+__vu srl (__vu a, int n)
+{
+  return a >> n;
+}
+
+__vu srl_c (__vu a)
+{
+  return a >> 5;
+}
+
+/* { dg-final { scan-assembler-times "vpsrlw" 2 } } */
+
+__vi sra (__vi a, int n)
+{
+  return a >> n;
+}
+
+__vi sra_c (__vi a)
+{
+  return a >> 5;
+}
+
+/* { dg-final { scan-assembler-times "vpsraw" 2 } } */
diff --git a/gcc/testsuite/gcc.target/i386/vect-shiftv4qi.c b/gcc/testsuite/gcc.target/i386/vect-shiftv4qi.c

index b7e45c2e8799294e223f4febc57ddf4fdc2946a5..9b52582d01f87feddc835cbb872af55a418e352f 100644 (file)
--- a/gcc/testsuite/gcc.target/i386/vect-shiftv4qi.c
+++ b/gcc/testsuite/gcc.target/i386/vect-shiftv4qi.c
@@ -1,5 +1,5 @@
  /* { dg-do compile } */
-/* { dg-options "-O2 -msse2" } */
+/* { dg-options "-O2 -msse2 -mno-avx2 -mno-avx512vl" } */
  
  #define N 4
  
diff --git a/gcc/testsuite/gcc.target/i386/vect-shiftv8qi-2.c b/gcc/testsuite/gcc.target/i386/vect-shiftv8qi-2.c

new file mode 100644 (file)

index 0000000..52760f5
--- /dev/null
+++ b/gcc/testsuite/gcc.target/i386/vect-shiftv8qi-2.c
@@ -0,0 +1,43 @@
+/* { dg-do compile { target { ! ia32 } } } */
+/* { dg-options "-O2 -march=cascadelake" } */
+
+#define N 8
+
+typedef unsigned char __vu __attribute__ ((__vector_size__ (N)));
+typedef signed char __vi __attribute__ ((__vector_size__ (N)));
+
+__vu sll (__vu a, int n)
+{
+  return a << n;
+}
+
+__vu sll_c (__vu a)
+{
+  return a << 5;
+}
+
+/* { dg-final { scan-assembler-times "vpsllw" 2 } } */
+
+__vu srl (__vu a, int n)
+{
+  return a >> n;
+}
+
+__vu srl_c (__vu a)
+{
+  return a >> 5;
+}
+
+/* { dg-final { scan-assembler-times "vpsrlw" 2 } } */
+
+__vi sra (__vi a, int n)
+{
+  return a >> n;
+}
+
+__vi sra_c (__vi a)
+{
+  return a >> 5;
+}
+
+/* { dg-final { scan-assembler-times "vpsraw" 2 } } */
diff --git a/gcc/testsuite/gcc.target/i386/vect-shiftv8qi.c b/gcc/testsuite/gcc.target/i386/vect-shiftv8qi.c

index 2471e6ed17d811181c9e0dd5b151271bdc08fce1..3dfcfd28a733aa9e14d08b9e3c71f75a58576dc9 100644 (file)
--- a/gcc/testsuite/gcc.target/i386/vect-shiftv8qi.c
+++ b/gcc/testsuite/gcc.target/i386/vect-shiftv8qi.c
@@ -1,5 +1,5 @@
  /* { dg-do compile { target { ! ia32 } } } */
-/* { dg-options "-O2 -msse2" } */
+/* { dg-options "-O2 -msse2 -mno-avx2 -mno-avx512vl" } */
  
  #define N 8
author	Roger Sayle <roger@nextmovesoftware.com>
	Fri, 10 May 2024 19:26:40 +0000 (20:26 +0100)
committer	Roger Sayle <roger@nextmovesoftware.com>
	Fri, 10 May 2024 19:26:40 +0000 (20:26 +0100)
gcc/config/i386/i386-expand.cc		patch \| blob \| blame \| history
gcc/testsuite/gcc.target/i386/vect-shiftv4qi-2.c	[new file with mode: 0644]	patch \| blob
gcc/testsuite/gcc.target/i386/vect-shiftv4qi.c		patch \| blob \| blame \| history
gcc/testsuite/gcc.target/i386/vect-shiftv8qi-2.c	[new file with mode: 0644]	patch \| blob
gcc/testsuite/gcc.target/i386/vect-shiftv8qi.c		patch \| blob \| blame \| history