LoongArch: Optimize LSX vector shuffle on floating-point vector

author Xi Ruoyao <xry111@xry111.site>

Sat, 18 Nov 2023 22:12:22 +0000 (06:12 +0800)

committer Xi Ruoyao <xry111@xry111.site>

Wed, 22 Nov 2023 09:06:06 +0000 (17:06 +0800)
author Xi Ruoyao <xry111@xry111.site>
Sat, 18 Nov 2023 22:12:22 +0000 (06:12 +0800)
committer Xi Ruoyao <xry111@xry111.site>
Wed, 22 Nov 2023 09:06:06 +0000 (17:06 +0800)
diff --git a/gcc/config/loongarch/loongarch.cc b/gcc/config/loongarch/loongarch.cc

index ce601a331f75f9a3cb35870529597cc73766eb68..33357c670e1087507e14736f1f9d519b4a3c5d16 100644 (file)
--- a/gcc/config/loongarch/loongarch.cc
+++ b/gcc/config/loongarch/loongarch.cc
@@ -8607,8 +8607,9 @@ void
  loongarch_expand_vec_perm (rtx target, rtx op0, rtx op1, rtx sel)
  {
    machine_mode vmode = GET_MODE (target);
+  machine_mode vimode = GET_MODE (sel);
    auto nelt = GET_MODE_NUNITS (vmode);
-  auto round_reg = gen_reg_rtx (vmode);
+  auto round_reg = gen_reg_rtx (vimode);
    rtx round_data[MAX_VECT_LEN];
  
    for (int i = 0; i < nelt; i += 1)
@@ -8616,9 +8617,16 @@ loongarch_expand_vec_perm (rtx target, rtx op0, rtx op1, rtx sel)
        round_data[i] = GEN_INT (0x1f);
      }
  
-  rtx round_data_rtx = gen_rtx_CONST_VECTOR (vmode, gen_rtvec_v (nelt, round_data));
+  rtx round_data_rtx = gen_rtx_CONST_VECTOR (vimode, gen_rtvec_v (nelt, round_data));
    emit_move_insn (round_reg, round_data_rtx);
  
+  if (vmode != vimode)
+    {
+      target = lowpart_subreg (vimode, target, vmode);
+      op0 = lowpart_subreg (vimode, op0, vmode);
+      op1 = lowpart_subreg (vimode, op1, vmode);
+    }
+
    switch (vmode)
      {
      case E_V16QImode:
@@ -8626,17 +8634,11 @@ loongarch_expand_vec_perm (rtx target, rtx op0, rtx op1, rtx sel)
        emit_insn (gen_lsx_vshuf_b (target, op1, op0, sel));
        break;
      case E_V2DFmode:
-      emit_insn (gen_andv2di3 (sel, sel, round_reg));
-      emit_insn (gen_lsx_vshuf_d_f (target, sel, op1, op0));
-      break;
      case E_V2DImode:
        emit_insn (gen_andv2di3 (sel, sel, round_reg));
        emit_insn (gen_lsx_vshuf_d (target, sel, op1, op0));
        break;
      case E_V4SFmode:
-      emit_insn (gen_andv4si3 (sel, sel, round_reg));
-      emit_insn (gen_lsx_vshuf_w_f (target, sel, op1, op0));
-      break;
      case E_V4SImode:
        emit_insn (gen_andv4si3 (sel, sel, round_reg));
        emit_insn (gen_lsx_vshuf_w (target, sel, op1, op0));
diff --git a/gcc/config/loongarch/lsx.md b/gcc/config/loongarch/lsx.md

index 8ea41c85b018fdac7df716472e6a7fa6a45ee66f..5e8d8d74b43b19ec3a78be9e3848e16bb0e808f7 100644 (file)
--- a/gcc/config/loongarch/lsx.md
+++ b/gcc/config/loongarch/lsx.md
@@ -837,7 +837,7 @@
   [(match_operand:LSX 0 "register_operand")
    (match_operand:LSX 1 "register_operand")
    (match_operand:LSX 2 "register_operand")
-  (match_operand:LSX 3 "register_operand")]
+  (match_operand:<VIMODE> 3 "register_operand")]
    "ISA_HAS_LSX"
  {
    loongarch_expand_vec_perm (operands[0], operands[1],
diff --git a/gcc/testsuite/gcc.target/loongarch/vect-shuf-fp.c b/gcc/testsuite/gcc.target/loongarch/vect-shuf-fp.c

new file mode 100644 (file)

index 0000000..7acc211
--- /dev/null
+++ b/gcc/testsuite/gcc.target/loongarch/vect-shuf-fp.c
@@ -0,0 +1,16 @@
+/* { dg-do compile } */
+/* { dg-options "-mlasx -O3" } */
+/* { dg-final { scan-assembler "vshuf\.w" } } */
+
+#define V __attribute__ ((vector_size (16)))
+
+int a V;
+float b V;
+float c V;
+float d V;
+
+void
+test (void)
+{
+  d = __builtin_shuffle (b, c, a);
+}
author	Xi Ruoyao <xry111@xry111.site>
	Sat, 18 Nov 2023 22:12:22 +0000 (06:12 +0800)
committer	Xi Ruoyao <xry111@xry111.site>
	Wed, 22 Nov 2023 09:06:06 +0000 (17:06 +0800)
gcc/config/loongarch/loongarch.cc		patch \| blob \| blame \| history
gcc/config/loongarch/lsx.md		patch \| blob \| blame \| history
gcc/testsuite/gcc.target/loongarch/vect-shuf-fp.c	[new file with mode: 0644]	patch \| blob