i386.c (ix86_expand_adjust_ufix_to_sfix_si): Add XORP argument.

author Jakub Jelinek <jakub@redhat.com>

Fri, 4 Nov 2011 10:37:04 +0000 (11:37 +0100)

committer Jakub Jelinek <jakub@gcc.gnu.org>

Fri, 4 Nov 2011 10:37:04 +0000 (11:37 +0100)
author Jakub Jelinek <jakub@redhat.com>
Fri, 4 Nov 2011 10:37:04 +0000 (11:37 +0100)
committer Jakub Jelinek <jakub@gcc.gnu.org>
Fri, 4 Nov 2011 10:37:04 +0000 (11:37 +0100)
diff --git a/gcc/ChangeLog b/gcc/ChangeLog

index 111efb1a080621c80970102e5ef187e10dc8387a..07f286c0dd5c6f6ab88a411e1ee5a08bc0ada76c 100644 (file)
--- a/gcc/ChangeLog
+++ b/gcc/ChangeLog
@@ -1,5 +1,17 @@
  2011-11-04  Jakub Jelinek  <jakub@redhat.com>
  
+       * config/i386/i386.c (ix86_expand_adjust_ufix_to_sfix_si): Add
+       XORP argument.  Subtract 0x1p31 instead of 0x1p32.  Use normal
+       signalling comparison instead of non-signalling.  Store into
+       *XORP pseudo holding 0x80000000 integers if 0x1p31 has been
+       subtracted and 0 otherwise.
+       * config/i386/i386-protos.h (ix86_expand_adjust_ufix_to_sfix_si):
+       Adjust prototype.
+       * config/i386/sse.md (fixuns_trunc<mode><sseintvecmodelower>2): Enable
+       already for TARGET_SSE2.  Xor in vector initialized by
+       ix86_expand_adjust_ufix_to_sfix_si at the end.
+       (vec_pack_ufix_trunc_<mode>): Likewise.
+
         * tree-vect-stmts.c (vectorizable_conversion): Rewritten to handle
         not just FLOAT_EXPR and FIX_TRUNC_EXPR, but also CONVERT_EXPR_CODE_P,
         WIDEN_MULT_EXPR and WIDEN_LSHIFT_EXPR to handle what
diff --git a/gcc/config/i386/i386-protos.h b/gcc/config/i386/i386-protos.h

index 5486e618dc85079a2548e8ae5ea3e47f3b8e2248..ec4becef8fef65815dc6a89ece93f181f5944510 100644 (file)
--- a/gcc/config/i386/i386-protos.h
+++ b/gcc/config/i386/i386-protos.h
@@ -109,7 +109,7 @@ extern void ix86_expand_convert_uns_sixf_sse (rtx, rtx);
  extern void ix86_expand_convert_uns_sidf_sse (rtx, rtx);
  extern void ix86_expand_convert_uns_sisf_sse (rtx, rtx);
  extern void ix86_expand_convert_sign_didf_sse (rtx, rtx);
-extern rtx ix86_expand_adjust_ufix_to_sfix_si (rtx);
+extern rtx ix86_expand_adjust_ufix_to_sfix_si (rtx, rtx *);
  extern enum ix86_fpcmp_strategy ix86_fp_comparison_strategy (enum rtx_code);
  extern void ix86_expand_fp_absneg_operator (enum rtx_code, enum machine_mode,
                                             rtx[]);
diff --git a/gcc/config/i386/i386.c b/gcc/config/i386/i386.c

index 01f4fbea9e018b76db938ef87a7e3d8e3747550b..d1730ed9b74e612ca50bad170da7b16ac53d91e5 100644 (file)
--- a/gcc/config/i386/i386.c
+++ b/gcc/config/i386/i386.c
@@ -17018,16 +17018,17 @@ ix86_expand_convert_uns_sisf_sse (rtx target, rtx input)
  
  /* Adjust a V*SFmode/V*DFmode value VAL so that *sfix_trunc* resp. fix_trunc*
     pattern can be used on it instead of *ufix_trunc* resp. fixuns_trunc*.
-   This is done by subtracting 0x1p32 from VAL if VAL is greater or equal
-   (non-signalling) than 0x1p31.  */
+   This is done by doing just signed conversion if < 0x1p31, and otherwise by
+   subtracting 0x1p31 first and xoring in 0x80000000 from *XORP afterwards.  */
  
  rtx
-ix86_expand_adjust_ufix_to_sfix_si (rtx val)
+ix86_expand_adjust_ufix_to_sfix_si (rtx val, rtx *xorp)
  {
-  REAL_VALUE_TYPE MTWO32r, TWO31r;
-  rtx two31r, mtwo32r, tmp[3];
+  REAL_VALUE_TYPE TWO31r;
+  rtx two31r, tmp[4];
    enum machine_mode mode = GET_MODE (val);
    enum machine_mode scalarmode = GET_MODE_INNER (mode);
+  enum machine_mode intmode = GET_MODE_SIZE (mode) == 32 ? V8SImode : V4SImode;
    rtx (*cmp) (rtx, rtx, rtx, rtx);
    int i;
  
@@ -17037,22 +17038,33 @@ ix86_expand_adjust_ufix_to_sfix_si (rtx val)
    two31r = const_double_from_real_value (TWO31r, scalarmode);
    two31r = ix86_build_const_vector (mode, 1, two31r);
    two31r = force_reg (mode, two31r);
-  real_ldexp (&MTWO32r, &dconstm1, 32);
-  mtwo32r = const_double_from_real_value (MTWO32r, scalarmode);
-  mtwo32r = ix86_build_const_vector (mode, 1, mtwo32r);
-  mtwo32r = force_reg (mode, mtwo32r);
    switch (mode)
      {
-    case V8SFmode: cmp = gen_avx_cmpv8sf3; break;
-    case V4SFmode: cmp = gen_avx_cmpv4sf3; break;
-    case V4DFmode: cmp = gen_avx_cmpv4df3; break;
-    case V2DFmode: cmp = gen_avx_cmpv2df3; break;
+    case V8SFmode: cmp = gen_avx_maskcmpv8sf3; break;
+    case V4SFmode: cmp = gen_sse_maskcmpv4sf3; break;
+    case V4DFmode: cmp = gen_avx_maskcmpv4df3; break;
+    case V2DFmode: cmp = gen_sse2_maskcmpv2df3; break;
      default: gcc_unreachable ();
      }
-  emit_insn (cmp (tmp[0], val, two31r, GEN_INT (29)));
-  tmp[1] = expand_simple_binop (mode, AND, tmp[0], mtwo32r, tmp[1],
+  tmp[3] = gen_rtx_LE (mode, two31r, val);
+  emit_insn (cmp (tmp[0], two31r, val, tmp[3]));
+  tmp[1] = expand_simple_binop (mode, AND, tmp[0], two31r, tmp[1],
                                 0, OPTAB_DIRECT);
-  return expand_simple_binop (mode, PLUS, val, tmp[1], tmp[2],
+  if (intmode == V4SImode || TARGET_AVX2)
+    *xorp = expand_simple_binop (intmode, ASHIFT,
+                                gen_lowpart (intmode, tmp[0]),
+                                GEN_INT (31), NULL_RTX, 0,
+                                OPTAB_DIRECT);
+  else
+    {
+      rtx two31 = GEN_INT ((unsigned HOST_WIDE_INT) 1 << 31);
+      two31 = ix86_build_const_vector (intmode, 1, two31);
+      *xorp = expand_simple_binop (intmode, AND,
+                                  gen_lowpart (intmode, tmp[0]),
+                                  two31, NULL_RTX, 0,
+                                  OPTAB_DIRECT);
+    }
+  return expand_simple_binop (mode, MINUS, val, tmp[1], tmp[2],
                               0, OPTAB_DIRECT);
  }
  
diff --git a/gcc/config/i386/sse.md b/gcc/config/i386/sse.md

index 33c2e94b3693b9156192caf13ab27b8a82bafe07..535f6f9fed31f4782a255a5d18a3f815e10219ca 100644 (file)
--- a/gcc/config/i386/sse.md
+++ b/gcc/config/i386/sse.md
@@ -2325,10 +2325,13 @@
  (define_expand "fixuns_trunc<mode><sseintvecmodelower>2"
    [(match_operand:<sseintvecmode> 0 "register_operand" "")
     (match_operand:VF1 1 "register_operand" "")]
-  "TARGET_AVX"
+  "TARGET_SSE2"
  {
-  rtx tmp = ix86_expand_adjust_ufix_to_sfix_si (operands[1]);
-  emit_insn (gen_fix_trunc<mode><sseintvecmodelower>2 (operands[0], tmp));
+  rtx tmp[3];
+  tmp[0] = ix86_expand_adjust_ufix_to_sfix_si (operands[1], &tmp[2]);
+  tmp[1] = gen_reg_rtx (<sseintvecmode>mode);
+  emit_insn (gen_fix_trunc<mode><sseintvecmodelower>2 (tmp[1], tmp[0]));
+  emit_insn (gen_xor<sseintvecmodelower>3 (operands[0], tmp[1], tmp[2]));
    DONE;
  })
  
@@ -3115,12 +3118,29 @@
    [(match_operand:<ssepackfltmode> 0 "register_operand" "")
     (match_operand:VF2 1 "register_operand" "")
     (match_operand:VF2 2 "register_operand" "")]
-  "TARGET_AVX"
+  "TARGET_SSE2"
  {
-  rtx tmp[2];
-  tmp[0] = ix86_expand_adjust_ufix_to_sfix_si (operands[1]);
-  tmp[1] = ix86_expand_adjust_ufix_to_sfix_si (operands[2]);
-  emit_insn (gen_vec_pack_sfix_trunc_<mode> (operands[0], tmp[0], tmp[1]));
+  rtx tmp[7];
+  tmp[0] = ix86_expand_adjust_ufix_to_sfix_si (operands[1], &tmp[2]);
+  tmp[1] = ix86_expand_adjust_ufix_to_sfix_si (operands[2], &tmp[3]);
+  tmp[4] = gen_reg_rtx (<ssepackfltmode>mode);
+  emit_insn (gen_vec_pack_sfix_trunc_<mode> (tmp[4], tmp[0], tmp[1]));
+  if (<ssepackfltmode>mode == V4SImode || TARGET_AVX2)
+    {
+      tmp[5] = gen_reg_rtx (<ssepackfltmode>mode);
+      ix86_expand_vec_extract_even_odd (tmp[5], tmp[2], tmp[3], 0);
+    }
+  else
+    {
+      tmp[5] = gen_reg_rtx (V8SFmode);
+      ix86_expand_vec_extract_even_odd (tmp[5], gen_lowpart (V8SFmode, tmp[2]),
+                                       gen_lowpart (V8SFmode, tmp[3]), 0);
+      tmp[5] = gen_lowpart (V8SImode, tmp[5]);
+    }
+  tmp[6] = expand_simple_binop (<ssepackfltmode>mode, XOR, tmp[4], tmp[5],
+                               operands[0], 0, OPTAB_DIRECT);
+  if (tmp[6] != operands[0])
+    emit_move_insn (operands[0], tmp[6]);
    DONE;
  })
  
diff --git a/gcc/testsuite/ChangeLog b/gcc/testsuite/ChangeLog

index 7192d526e9cc953ba2986e99874a86da38d84261..8a7f4e2809c8dd0b8d2f04fbd562894110569c95 100644 (file)
--- a/gcc/testsuite/ChangeLog
+++ b/gcc/testsuite/ChangeLog
@@ -1,5 +1,7 @@
  2011-11-04  Jakub Jelinek  <jakub@redhat.com>
  
+       * gcc.dg/torture/vec-cvt-1.c: Enable flttointtestui test.
+
         * gcc.dg/torture/vec-cvt-1.c: New test.
  
  2011-11-04  Eric Botcazou  <ebotcazou@adacore.com>
diff --git a/gcc/testsuite/gcc.dg/torture/vec-cvt-1.c b/gcc/testsuite/gcc.dg/torture/vec-cvt-1.c

index a6d111fd9be25a8f405827bf0f078973a94bcad0..f9a5514f0c561411d51658a6e9d369d050aea704 100644 (file)
--- a/gcc/testsuite/gcc.dg/torture/vec-cvt-1.c
+++ b/gcc/testsuite/gcc.dg/torture/vec-cvt-1.c
@@ -197,7 +197,7 @@ main ()
    flttointtestsl ();
    flttointtestuc ();
    flttointtestus ();
-//  flttointtestui ();
+  flttointtestui ();
    flttointtestul ();
    inttoflttestsc ();
    inttoflttestss ();
author	Jakub Jelinek <jakub@redhat.com>
	Fri, 4 Nov 2011 10:37:04 +0000 (11:37 +0100)
committer	Jakub Jelinek <jakub@gcc.gnu.org>
	Fri, 4 Nov 2011 10:37:04 +0000 (11:37 +0100)
gcc/ChangeLog		patch \| blob \| blame \| history
gcc/config/i386/i386-protos.h		patch \| blob \| blame \| history
gcc/config/i386/i386.c		patch \| blob \| blame \| history
gcc/config/i386/sse.md		patch \| blob \| blame \| history
gcc/testsuite/ChangeLog		patch \| blob \| blame \| history
gcc/testsuite/gcc.dg/torture/vec-cvt-1.c		patch \| blob \| blame \| history