i386: Improved TImode (128-bit) integer constants on x86_64.

author Roger Sayle <roger@nextmovesoftware.com>

Tue, 19 Dec 2023 11:24:36 +0000 (11:24 +0000)

committer Roger Sayle <roger@nextmovesoftware.com>

Tue, 19 Dec 2023 11:24:36 +0000 (11:24 +0000)
author Roger Sayle <roger@nextmovesoftware.com>
Tue, 19 Dec 2023 11:24:36 +0000 (11:24 +0000)
committer Roger Sayle <roger@nextmovesoftware.com>
Tue, 19 Dec 2023 11:24:36 +0000 (11:24 +0000)
diff --git a/gcc/config/i386/i386-expand.cc b/gcc/config/i386/i386-expand.cc

index fad4f34f90554dd8acfbfbba560562d0910820c2..57a108ae4a76741f0f0290694fb989a828d4141b 100644 (file)
--- a/gcc/config/i386/i386-expand.cc
+++ b/gcc/config/i386/i386-expand.cc
@@ -289,7 +289,7 @@ ix86_broadcast (HOST_WIDE_INT v, unsigned int width,
  
  /* Convert the CONST_WIDE_INT operand OP to broadcast in MODE.  */
  
-static rtx
+rtx
  ix86_convert_const_wide_int_to_broadcast (machine_mode mode, rtx op)
  {
    /* Don't use integer vector broadcast if we can't move from GPR to SSE
@@ -541,14 +541,6 @@ ix86_expand_move (machine_mode mode, rtx operands[])
                   return;
                 }
             }
-         else if (CONST_WIDE_INT_P (op1)
-                  && GET_MODE_SIZE (mode) >= 16)
-           {
-             rtx tmp = ix86_convert_const_wide_int_to_broadcast
-               (GET_MODE (op0), op1);
-             if (tmp != nullptr)
-               op1 = tmp;
-           }
         }
      }
  
@@ -6323,18 +6315,15 @@ ix86_split_long_move (rtx operands[])
         }
      }
  
-  /* If optimizing for size, attempt to locally unCSE nonzero constants.  */
-  if (optimize_insn_for_size_p ())
-    {
-      for (j = 0; j < nparts - 1; j++)
-       if (CONST_INT_P (operands[6 + j])
-           && operands[6 + j] != const0_rtx
-           && REG_P (operands[2 + j]))
-         for (i = j; i < nparts - 1; i++)
-           if (CONST_INT_P (operands[7 + i])
-               && INTVAL (operands[7 + i]) == INTVAL (operands[6 + j]))
-             operands[7 + i] = operands[2 + j];
-    }
+  /* Attempt to locally unCSE nonzero constants.  */
+  for (j = 0; j < nparts - 1; j++)
+    if (CONST_INT_P (operands[6 + j])
+       && operands[6 + j] != const0_rtx
+       && REG_P (operands[2 + j]))
+      for (i = j; i < nparts - 1; i++)
+       if (CONST_INT_P (operands[7 + i])
+           && INTVAL (operands[7 + i]) == INTVAL (operands[6 + j]))
+         operands[7 + i] = operands[2 + j];
  
    for (i = 0; i < nparts; i++)
      emit_move_insn (operands[2 + i], operands[6 + i]);
diff --git a/gcc/config/i386/i386-expand.h b/gcc/config/i386/i386-expand.h

index 997cb7db0592f9fdd09bc4c9f0fdd080f9da9799..e9e94bf92ae9554e9208a922bee1321f4185aeaa 100644 (file)
--- a/gcc/config/i386/i386-expand.h
+++ b/gcc/config/i386/i386-expand.h
@@ -57,5 +57,6 @@ bool ix86_notrack_prefixed_insn_p (rtx_insn *);
  machine_mode ix86_split_reduction (machine_mode mode);
  void ix86_expand_divmod_libfunc (rtx libfunc, machine_mode mode, rtx op0,
                                  rtx op1, rtx *quot_p, rtx *rem_p);
+rtx ix86_convert_const_wide_int_to_broadcast (machine_mode mode, rtx op);
  
  #endif  /* GCC_I386_EXPAND_H */
diff --git a/gcc/config/i386/i386-features.cc b/gcc/config/i386/i386-features.cc

index e6fc135f32f097a8cc1bc2e256e238dda1c9e3f0..3fcbb81254cf09f22d139757756976ea9a9e62db 100644 (file)
--- a/gcc/config/i386/i386-features.cc
+++ b/gcc/config/i386/i386-features.cc
@@ -90,6 +90,7 @@ along with GCC; see the file COPYING3.  If not see
  #include "dwarf2out.h"
  #include "i386-builtins.h"
  #include "i386-features.h"
+#include "i386-expand.h"
  
  const char * const xlogue_layout::STUB_BASE_NAMES[XLOGUE_STUB_COUNT] = {
    "savms64",
@@ -1853,14 +1854,25 @@ timode_scalar_chain::convert_insn (rtx_insn *insn)
         {
           /* Since there are no instructions to store 128-bit constant,
              temporary register usage is required.  */
+         bool use_move;
           start_sequence ();
-         src = gen_rtx_CONST_VECTOR (V1TImode, gen_rtvec (1, src));
-         src = validize_mem (force_const_mem (V1TImode, src));
+         tmp = ix86_convert_const_wide_int_to_broadcast (TImode, src);
+         if (tmp)
+           {
+             src = lowpart_subreg (V1TImode, tmp, TImode);
+             use_move = true;
+           }
+         else
+           {
+             src = gen_rtx_CONST_VECTOR (V1TImode, gen_rtvec (1, src));
+             src = validize_mem (force_const_mem (V1TImode, src));
+             use_move = MEM_P (dst);
+           }
           rtx_insn *seq = get_insns ();
           end_sequence ();
           if (seq)
             emit_insn_before (seq, insn);
-         if (MEM_P (dst))
+         if (use_move)
             {
               tmp = gen_reg_rtx (V1TImode);
               emit_insn_before (gen_rtx_SET (tmp, src), insn);
diff --git a/gcc/testsuite/gcc.target/i386/movti-2.c b/gcc/testsuite/gcc.target/i386/movti-2.c

new file mode 100644 (file)

index 0000000..73f69d2
--- /dev/null
+++ b/gcc/testsuite/gcc.target/i386/movti-2.c
@@ -0,0 +1,12 @@
+/* { dg-do compile { target int128 } } */
+/* { dg-options "-O2 -mavx" } */
+__int128 m;
+
+void foo()
+{
+    m &= ((__int128)0x0123456789abcdefULL<<64) | 0x0123456789abcdefULL;
+}
+
+/* { dg-final { scan-assembler-times "movabsq" 1 } } */
+/* { dg-final { scan-assembler-not "vmovq" } } */
+/* { dg-final { scan-assembler-not "vpunpcklqdq" } } */
diff --git a/gcc/testsuite/gcc.target/i386/movti-3.c b/gcc/testsuite/gcc.target/i386/movti-3.c

new file mode 100644 (file)

index 0000000..535e5dc
--- /dev/null
+++ b/gcc/testsuite/gcc.target/i386/movti-3.c
@@ -0,0 +1,12 @@
+/* { dg-do compile { target int128 } } */
+/* { dg-options "-O2 -mavx" } */
+
+__int128 m;
+
+void bar()
+{
+    m = ((__int128)0x0123456789abcdefULL<<64) | 0x0123456789abcdefULL;
+}
+
+/* { dg-final { scan-assembler "vmovdqa" } } */
+/* { dg-final { scan-assembler-not "vpextrq" } } */
author	Roger Sayle <roger@nextmovesoftware.com>
	Tue, 19 Dec 2023 11:24:36 +0000 (11:24 +0000)
committer	Roger Sayle <roger@nextmovesoftware.com>
	Tue, 19 Dec 2023 11:24:36 +0000 (11:24 +0000)
gcc/config/i386/i386-expand.cc		patch \| blob \| blame \| history
gcc/config/i386/i386-expand.h		patch \| blob \| blame \| history
gcc/config/i386/i386-features.cc		patch \| blob \| blame \| history
gcc/testsuite/gcc.target/i386/movti-2.c	[new file with mode: 0644]	patch \| blob
gcc/testsuite/gcc.target/i386/movti-3.c	[new file with mode: 0644]	patch \| blob