]> git.ipfire.org Git - thirdparty/gcc.git/commitdiff
Properly convert GTU to GT for V4SI and V2DI
authorH.J. Lu <hongjiu.lu@intel.com>
Thu, 7 Jan 2010 19:58:16 +0000 (19:58 +0000)
committerH.J. Lu <hjl@gcc.gnu.org>
Thu, 7 Jan 2010 19:58:16 +0000 (11:58 -0800)
gcc/

2010-01-07  H.J. Lu  <hongjiu.lu@intel.com>

Backport from mainline
2010-01-05  Paolo Bonzini  <bonzinI@gnu.rg>
    H.J. Lu  <hongjiu.lu@intel.com>

PR target/42542
* config/i386/i386.c (ix86_expand_int_vcond): Convert GTU to GT
for V4SI and V2DI by subtracting (-(INT MAX) - 1) from both
operands to make them signed.

gcc/testsuite/

2010-01-07  H.J. Lu  <hongjiu.lu@intel.com>

Backport from mainline
2010-01-05  H.J. Lu  <hongjiu.lu@intel.com>

PR target/42542
* gcc.target/i386/pr42542-1.c: New.
* gcc.target/i386/pr42542-1a.c: Likewise.
* gcc.target/i386/pr42542-1b.c: Likewise.
* gcc.target/i386/pr42542-2.c: Likewise.
* gcc.target/i386/pr42542-2a.c: Likewise.
* gcc.target/i386/pr42542-2b.c: Likewise.
* gcc.target/i386/pr42542-3.c: Likewise.
* gcc.target/i386/pr42542-3a.c: Likewise.

From-SVN: r155709

gcc/ChangeLog
gcc/config/i386/i386.c
gcc/testsuite/ChangeLog
gcc/testsuite/gcc.target/i386/pr42542-1.c [new file with mode: 0644]
gcc/testsuite/gcc.target/i386/pr42542-1a.c [new file with mode: 0644]
gcc/testsuite/gcc.target/i386/pr42542-1b.c [new file with mode: 0644]
gcc/testsuite/gcc.target/i386/pr42542-2.c [new file with mode: 0644]
gcc/testsuite/gcc.target/i386/pr42542-2a.c [new file with mode: 0644]
gcc/testsuite/gcc.target/i386/pr42542-2b.c [new file with mode: 0644]
gcc/testsuite/gcc.target/i386/pr42542-3.c [new file with mode: 0644]
gcc/testsuite/gcc.target/i386/pr42542-3a.c [new file with mode: 0644]

index c6a3ffcad0a02e68c49970e195eb7ebb5d3ff3f7..4abef6c208dff4af7dc3584ce756c8b61769ef76 100644 (file)
@@ -1,3 +1,14 @@
+2010-01-07  H.J. Lu  <hongjiu.lu@intel.com>
+
+       Backport from mainline
+       2010-01-05  Paolo Bonzini  <bonzinI@gnu.rg>
+                   H.J. Lu  <hongjiu.lu@intel.com>
+
+       PR target/42542
+       * config/i386/i386.c (ix86_expand_int_vcond): Convert GTU to GT
+       for V4SI and V2DI by subtracting (-(INT MAX) - 1) from both
+       operands to make them signed.
+
 2010-01-07  Uros Bizjak  <ubizjak@gmail.com>
 
        * ifcvt.c (if_convert): Output slim multiple dumps with TDF_SLIM.
index d9f9b8cd3e440c549601123da37b3bfc0cd1ac4a..25336d95c90100dc1616e28319649075fa5ff9c1 100644 (file)
@@ -13418,28 +13418,22 @@ ix86_expand_int_vcond (rtx operands[])
        case V2DImode:
          {
            rtx t1, t2, mask;
+           rtx (*gen_sub3) (rtx, rtx, rtx);
 
-           /* Perform a parallel modulo subtraction.  */
-           t1 = gen_reg_rtx (mode);
-           emit_insn ((mode == V4SImode
-                       ? gen_subv4si3
-                       : gen_subv2di3) (t1, cop0, cop1));
-
-           /* Extract the original sign bit of op0.  */
+           /* Subtract (-(INT MAX) - 1) from both operands to make
+              them signed.  */
            mask = ix86_build_signbit_mask (GET_MODE_INNER (mode),
                                            true, false);
-           t2 = gen_reg_rtx (mode);
-           emit_insn ((mode == V4SImode
-                       ? gen_andv4si3
-                       : gen_andv2di3) (t2, cop0, mask));
+           gen_sub3 = (mode == V4SImode
+                       ? gen_subv4si3 : gen_subv2di3);
+           t1 = gen_reg_rtx (mode);
+           emit_insn (gen_sub3 (t1, cop0, mask));
 
-           /* XOR it back into the result of the subtraction.  This results
-              in the sign bit set iff we saw unsigned underflow.  */
-           x = gen_reg_rtx (mode);
-           emit_insn ((mode == V4SImode
-                       ? gen_xorv4si3
-                       : gen_xorv2di3) (x, t1, t2));
+           t2 = gen_reg_rtx (mode);
+           emit_insn (gen_sub3 (t2, cop1, mask));
 
+           cop0 = t1;
+           cop1 = t2;
            code = GT;
          }
          break;
@@ -13451,6 +13445,8 @@ ix86_expand_int_vcond (rtx operands[])
          emit_insn (gen_rtx_SET (VOIDmode, x,
                                  gen_rtx_US_MINUS (mode, cop0, cop1)));
 
+         cop0 = x;
+         cop1 = CONST0_RTX (mode);
          code = EQ;
          negate = !negate;
          break;
@@ -13458,9 +13454,6 @@ ix86_expand_int_vcond (rtx operands[])
        default:
          gcc_unreachable ();
        }
-
-      cop0 = x;
-      cop1 = CONST0_RTX (mode);
     }
 
   x = ix86_expand_sse_cmp (operands[0], code, cop0, cop1,
index 6bf2e72493af07d43ff16e0b3008d1bba24b40a8..f0b1891a8930edcd1b69209649df746388ca2da4 100644 (file)
@@ -1,3 +1,18 @@
+2010-01-07  H.J. Lu  <hongjiu.lu@intel.com>
+
+       Backport from mainline
+       2010-01-05  H.J. Lu  <hongjiu.lu@intel.com>
+
+       PR target/42542
+       * gcc.target/i386/pr42542-1.c: New.
+       * gcc.target/i386/pr42542-1a.c: Likewise.
+       * gcc.target/i386/pr42542-1b.c: Likewise.
+       * gcc.target/i386/pr42542-2.c: Likewise.
+       * gcc.target/i386/pr42542-2a.c: Likewise.
+       * gcc.target/i386/pr42542-2b.c: Likewise.
+       * gcc.target/i386/pr42542-3.c: Likewise.
+       * gcc.target/i386/pr42542-3a.c: Likewise.
+
 2010-01-05  Eric Botcazou  <ebotcazou@adacore.com>
 
        * gcc.dg/tls/opt-15.c: New test.
diff --git a/gcc/testsuite/gcc.target/i386/pr42542-1.c b/gcc/testsuite/gcc.target/i386/pr42542-1.c
new file mode 100644 (file)
index 0000000..60da8ee
--- /dev/null
@@ -0,0 +1,77 @@
+/* { dg-do run } */
+/* { dg-options "-O1 -msse2 -ftree-vectorize" } */
+
+#ifndef CHECK_H
+#define CHECK_H "sse2-check.h"
+#endif
+
+#ifndef TEST
+#define TEST sse2_test
+#endif
+
+#include CHECK_H
+
+unsigned int v1[] __attribute__ ((aligned(16))) =
+{
+  0x80000000, 1, 0xa0000000, 2,
+  3, 0xd0000000, 0xf0000000, 0xe0000000
+};
+unsigned int v2[] __attribute__ ((aligned(16))) =
+{
+  4, 0xb0000000, 5, 0xc0000000,
+  0xd0000000, 6, 7, 8
+};
+
+unsigned int max[] =
+{
+  0x80000000, 0xb0000000, 0xa0000000, 0xc0000000,
+  0xd0000000, 0xd0000000, 0xf0000000, 0xe0000000
+};
+
+unsigned int min[] =
+{
+  4, 1, 5, 2,
+  3, 6, 7, 8
+};
+
+unsigned int res[8] __attribute__ ((aligned(16)));
+
+extern void abort (void);
+
+void
+find_max (void)
+{
+  int i;
+
+  for (i = 0; i < 8; i++)
+    res[i] = v1[i] < v2[i] ? v2[i] : v1[i];
+}
+
+void
+find_min (void)
+{
+  int i;
+
+  for (i = 0; i < 8; i++)
+    res[i] = v1[i] > v2[i] ? v2[i] : v1[i];
+}
+
+static void
+TEST (void)
+{
+  int i;
+  int err = 0;
+
+  find_max ();
+  for (i = 0; i < 8; i++)
+    if (res[i] != max[i])
+      err++;
+
+  find_min ();
+  for (i = 0; i < 8; i++)
+    if (res[i] != min[i])
+      err++;
+
+  if (err)
+    abort ();
+}
diff --git a/gcc/testsuite/gcc.target/i386/pr42542-1a.c b/gcc/testsuite/gcc.target/i386/pr42542-1a.c
new file mode 100644 (file)
index 0000000..cd77175
--- /dev/null
@@ -0,0 +1,8 @@
+/* { dg-do run } */
+/* { dg-require-effective-target sse4 } */
+/* { dg-options "-O1 -msse4.1 -ftree-vectorize" } */
+
+#define CHECK_H "sse4_1-check.h"
+#define TEST sse4_1_test
+
+#include "pr42542-1.c"
diff --git a/gcc/testsuite/gcc.target/i386/pr42542-1b.c b/gcc/testsuite/gcc.target/i386/pr42542-1b.c
new file mode 100644 (file)
index 0000000..7651f07
--- /dev/null
@@ -0,0 +1,10 @@
+/* { dg-do compile } */
+/* { dg-options "-O1 -msse4.1 -ftree-vectorize" } */
+
+#define CHECK_H "sse4_1-check.h"
+#define TEST sse4_1_test
+
+#include "pr42542-1.c"
+
+/* { dg-final { scan-assembler "pmaxud" } } */
+/* { dg-final { scan-assembler "pminud" } } */
diff --git a/gcc/testsuite/gcc.target/i386/pr42542-2.c b/gcc/testsuite/gcc.target/i386/pr42542-2.c
new file mode 100644 (file)
index 0000000..fc59534
--- /dev/null
@@ -0,0 +1,77 @@
+/* { dg-do run } */
+/* { dg-options "-O1 -msse2 -ftree-vectorize" } */
+
+#ifndef CHECK_H
+#define CHECK_H "sse2-check.h"
+#endif
+
+#ifndef TEST
+#define TEST sse2_test
+#endif
+
+#include CHECK_H
+
+unsigned short v1[] __attribute__ ((aligned(16))) =
+{
+  0x8000, 0x9000, 1, 10, 0xa000, 0xb000, 2, 20,
+  3, 30, 0xd000, 0xe000, 0xf000, 0xe000, 25, 30
+};
+unsigned short v2[] __attribute__ ((aligned(16))) =
+{
+  4, 40, 0xb000, 0x8000, 5, 50, 0xc000, 0xf000,
+  0xd000, 0xa000, 6, 65, 7, 75, 0xe000, 0xc000
+};
+
+unsigned short max[] =
+{
+  0x8000, 0x9000, 0xb000, 0x8000, 0xa000, 0xb000, 0xc000, 0xf000,
+  0xd000, 0xa000, 0xd000, 0xe000, 0xf000, 0xe000, 0xe000, 0xc000
+};
+
+unsigned short min[] =
+{
+  4, 40, 1, 10, 5, 50, 2, 20,
+  3, 30, 6, 65, 7, 75, 25, 30
+};
+
+unsigned short res[16] __attribute__ ((aligned(16)));
+
+extern void abort (void);
+
+void
+find_max (void)
+{
+  int i;
+
+  for (i = 0; i < 16; i++)
+    res[i] = v1[i] < v2[i] ? v2[i] : v1[i];
+}
+
+void
+find_min (void)
+{
+  int i;
+
+  for (i = 0; i < 16; i++)
+    res[i] = v1[i] > v2[i] ? v2[i] : v1[i];
+}
+
+static void
+TEST (void)
+{
+  int i;
+  int err = 0;
+
+  find_max ();
+  for (i = 0; i < 16; i++)
+    if (res[i] != max[i])
+      err++;
+
+  find_min ();
+  for (i = 0; i < 16; i++)
+    if (res[i] != min[i])
+      err++;
+
+  if (err)
+    abort ();
+}
diff --git a/gcc/testsuite/gcc.target/i386/pr42542-2a.c b/gcc/testsuite/gcc.target/i386/pr42542-2a.c
new file mode 100644 (file)
index 0000000..bcefa9c
--- /dev/null
@@ -0,0 +1,8 @@
+/* { dg-do run } */
+/* { dg-require-effective-target sse4 } */
+/* { dg-options "-O1 -msse4.1 -ftree-vectorize" } */
+
+#define CHECK_H "sse4_1-check.h"
+#define TEST sse4_1_test
+
+#include "pr42542-2.c"
diff --git a/gcc/testsuite/gcc.target/i386/pr42542-2b.c b/gcc/testsuite/gcc.target/i386/pr42542-2b.c
new file mode 100644 (file)
index 0000000..ddb539b
--- /dev/null
@@ -0,0 +1,10 @@
+/* { dg-do compile } */
+/* { dg-options "-O1 -msse4.1 -ftree-vectorize" } */
+
+#define CHECK_H "sse4_1-check.h"
+#define TEST sse4_1_test
+
+#include "pr42542-2.c"
+
+/* { dg-final { scan-assembler "pmaxuw" } } */
+/* { dg-final { scan-assembler "pminuw" } } */
diff --git a/gcc/testsuite/gcc.target/i386/pr42542-3.c b/gcc/testsuite/gcc.target/i386/pr42542-3.c
new file mode 100644 (file)
index 0000000..028d2f8
--- /dev/null
@@ -0,0 +1,85 @@
+/* { dg-do run } */
+/* { dg-options "-O1 -msse2 -ftree-vectorize" } */
+
+#ifndef CHECK_H
+#define CHECK_H "sse2-check.h"
+#endif
+
+#ifndef TEST
+#define TEST sse2_test
+#endif
+
+#include CHECK_H
+
+unsigned char v1[] __attribute__ ((aligned(16))) =
+{
+  0x80, 0xd0, 0x90, 0xa0, 1, 15, 10, 15,
+  0xa0, 0xc0, 0xb0, 0xf0, 2, 25, 20, 35,
+  3, 34, 30, 36, 0xd0, 0x80, 0xe0, 0xb0,
+  0xf0, 0xe0, 0xe0, 0x80, 25, 34, 30, 40
+};
+unsigned char v2[] __attribute__ ((aligned(16))) =
+{
+  4, 44, 40, 48, 0xb0, 0x80, 0x80, 0x90,
+  5, 55, 50, 51, 0xc0, 0xb0, 0xf0, 0xd0,
+  0xd0, 0x80, 0xa0, 0xf0, 6, 61, 65, 68,
+  7, 76, 75, 81, 0xe0, 0xf0, 0xc0, 0x90
+};
+
+unsigned char max[] =
+{
+  0x80, 0xd0, 0x90, 0xa0, 0xb0, 0x80, 0x80, 0x90,
+  0xa0, 0xc0, 0xb0, 0xf0, 0xc0, 0xb0, 0xf0, 0xd0,
+  0xd0, 0x80, 0xa0, 0xf0, 0xd0, 0x80, 0xe0, 0xb0,
+  0xf0, 0xe0, 0xe0, 0x80, 0xe0, 0xf0, 0xc0, 0x90
+};
+
+unsigned char min[] =
+{
+  4, 44, 40, 48, 1, 15, 10, 15,
+  5, 55, 50, 51, 2, 25, 20, 35,
+  3, 34, 30, 36, 6, 61, 65, 68,
+  7, 76, 75, 81, 25, 34, 30, 40
+};
+
+unsigned char res[32] __attribute__ ((aligned(16)));
+
+extern void abort (void);
+
+void
+find_max (void)
+{
+  int i;
+
+  for (i = 0; i < 32; i++)
+    res[i] = v1[i] < v2[i] ? v2[i] : v1[i];
+}
+
+void
+find_min (void)
+{
+  int i;
+
+  for (i = 0; i < 32; i++)
+    res[i] = v1[i] > v2[i] ? v2[i] : v1[i];
+}
+
+static void
+TEST (void)
+{
+  int i;
+  int err = 0;
+
+  find_max ();
+  for (i = 0; i < 32; i++)
+    if (res[i] != max[i])
+      err++;
+
+  find_min ();
+  for (i = 0; i < 32; i++)
+    if (res[i] != min[i])
+      err++;
+
+  if (err)
+    abort ();
+}
diff --git a/gcc/testsuite/gcc.target/i386/pr42542-3a.c b/gcc/testsuite/gcc.target/i386/pr42542-3a.c
new file mode 100644 (file)
index 0000000..754e59e
--- /dev/null
@@ -0,0 +1,7 @@
+/* { dg-do compile } */
+/* { dg-options "-O1 -msse2 -ftree-vectorize" } */
+
+#include "pr42542-3.c"
+
+/* { dg-final { scan-assembler "pmaxub" } } */
+/* { dg-final { scan-assembler "pminub" } } */