]> git.ipfire.org Git - thirdparty/gcc.git/commitdiff
amdgcn: vec_extract no-op insns
authorAndrew Stubbs <ams@codesourcery.com>
Wed, 1 Mar 2023 15:32:50 +0000 (15:32 +0000)
committerAndrew Stubbs <ams@codesourcery.com>
Fri, 17 Mar 2023 13:03:00 +0000 (13:03 +0000)
Just using move insn for no-op conversions triggers special move handling in
IRA which declares that subreg of vectors aren't valid and routes everything
through memory.  These patterns make the vec_select explicit and all is well.

gcc/ChangeLog:

* config/gcn/gcn-protos.h (gcn_stepped_zero_int_parallel_p): New.
* config/gcn/gcn-valu.md (V_1REG_ALT): New.
(V_2REG_ALT): New.
(vec_extract<V_1REG:mode><V_1REG_ALT:mode>_nop): New.
(vec_extract<V_2REG:mode><V_2REG_ALT:mode>_nop): New.
(vec_extract<V_ALL:mode><V_ALL_ALT:mode>): Use new patterns.
* config/gcn/gcn.cc (gcn_stepped_zero_int_parallel_p): New.
* config/gcn/predicates.md (ascending_zero_int_parallel): New.

gcc/ChangeLog.omp
gcc/config/gcn/gcn-protos.h
gcc/config/gcn/gcn-valu.md
gcc/config/gcn/gcn.cc
gcc/config/gcn/predicates.md

index 832679887d08082471ac23bd5b7b510f6fbfe650..6d88f486fa7ce5d7ab2c6b7d0e01aaedcc58d1ce 100644 (file)
@@ -1,3 +1,14 @@
+2023-03-17  Andrew Stubbs  <ams@codesourcery.com>
+
+       * config/gcn/gcn-protos.h (gcn_stepped_zero_int_parallel_p): New.
+       * config/gcn/gcn-valu.md (V_1REG_ALT): New.
+       (V_2REG_ALT): New.
+       (vec_extract<V_1REG:mode><V_1REG_ALT:mode>_nop): New.
+       (vec_extract<V_2REG:mode><V_2REG_ALT:mode>_nop): New.
+       (vec_extract<V_ALL:mode><V_ALL_ALT:mode>): Use new patterns.
+       * config/gcn/gcn.cc (gcn_stepped_zero_int_parallel_p): New.
+       * config/gcn/predicates.md (ascending_zero_int_parallel): New.
+
 2023-03-06  Paul-Antoine Arras <pa@codesourcery.com>
 
        Backported from master:
index f9a1fc00b4f0c1561c5b7e6ddd31282f4f849e68..3625a58b6e97ecf9943b525cc0245e68af45ea79 100644 (file)
@@ -70,6 +70,7 @@ extern reg_class gcn_regno_reg_class (int regno);
 extern bool gcn_scalar_flat_address_p (rtx);
 extern bool gcn_scalar_flat_mem_p (rtx);
 extern bool gcn_sgpr_move_p (rtx, rtx);
+extern bool gcn_stepped_zero_int_parallel_p (rtx op, int step);
 extern bool gcn_valid_move_p (machine_mode, rtx, rtx);
 extern rtx gcn_vec_constant (machine_mode, int);
 extern rtx gcn_vec_constant (machine_mode, rtx);
index 35c108755ccffe1c654219cff69f1461d83781b7..1bfd358cf1040982ef71f3debedfa699277aadbb 100644 (file)
                       V16QI V16HI V16SI V16HF V16SF
                       V32QI V32HI V32SI V32HF V32SF
                       V64QI V64HI V64SI V64HF V64SF])
+(define_mode_iterator V_1REG_ALT
+                     [V2QI V2HI V2SI V2HF V2SF
+                      V4QI V4HI V4SI V4HF V4SF
+                      V8QI V8HI V8SI V8HF V8SF
+                      V16QI V16HI V16SI V16HF V16SF
+                      V32QI V32HI V32SI V32HF V32SF
+                      V64QI V64HI V64SI V64HF V64SF])
 
 (define_mode_iterator V_INT_1REG
                      [V2QI V2HI V2SI
                       V16DI V16DF
                       V32DI V32DF
                       V64DI V64DF])
+(define_mode_iterator V_2REG_ALT
+                     [V2DI V2DF
+                      V4DI V4DF
+                      V8DI V8DF
+                      V16DI V16DF
+                      V32DI V32DF
+                      V64DI V64DF])
 
 ; Vector modes with native support
 (define_mode_iterator V_noQI
    (set_attr "exec" "none")
    (set_attr "laneselect" "yes")])
 
+(define_insn "vec_extract<V_1REG:mode><V_1REG_ALT:mode>_nop"
+  [(set (match_operand:V_1REG_ALT 0 "register_operand" "=v,v")
+       (vec_select:V_1REG_ALT
+         (match_operand:V_1REG 1 "register_operand"   " 0,v")
+         (match_operand 2 "ascending_zero_int_parallel" "")))]
+  "MODE_VF (<V_1REG_ALT:MODE>mode) < MODE_VF (<V_1REG:MODE>mode)
+   && <V_1REG_ALT:SCALAR_MODE>mode == <V_1REG:SCALAR_MODE>mode"
+  "@
+  ; in-place extract %0
+  v_mov_b32\t%L0, %L1"
+  [(set_attr "type" "vmult")
+   (set_attr "length" "0,8")])
+  
+(define_insn "vec_extract<V_2REG:mode><V_2REG_ALT:mode>_nop"
+  [(set (match_operand:V_2REG_ALT 0 "register_operand" "=v,v")
+       (vec_select:V_2REG_ALT
+         (match_operand:V_2REG 1 "register_operand"   " 0,v")
+         (match_operand 2 "ascending_zero_int_parallel" "")))]
+  "MODE_VF (<V_2REG_ALT:MODE>mode) < MODE_VF (<V_2REG:MODE>mode)
+   && <V_2REG_ALT:SCALAR_MODE>mode == <V_2REG:SCALAR_MODE>mode"
+  "@
+  ; in-place extract %0
+  v_mov_b32\t%L0, %L1\;v_mov_b32\t%H0, %H1"
+  [(set_attr "type" "vmult")
+   (set_attr "length" "0,8")])
+  
 (define_expand "vec_extract<V_ALL:mode><V_ALL_ALT:mode>"
-  [(set (match_operand:V_ALL_ALT 0 "register_operand")
-       (vec_select:V_ALL_ALT
-         (match_operand:V_ALL 1 "register_operand")
-         (parallel [(match_operand 2 "immediate_operand")])))]
+  [(match_operand:V_ALL_ALT 0 "register_operand")
+   (match_operand:V_ALL 1 "register_operand")
+   (match_operand 2 "immediate_operand")]
   "MODE_VF (<V_ALL_ALT:MODE>mode) < MODE_VF (<V_ALL:MODE>mode)
    && <V_ALL_ALT:SCALAR_MODE>mode == <V_ALL:SCALAR_MODE>mode"
   {
 
     if (firstlane == 0)
       {
-       /* A plain move will do.  */
-       tmp = operands[1];
+       rtx parallel = gen_rtx_PARALLEL (<V_ALL:MODE>mode,
+                                         rtvec_alloc (numlanes));
+       for (int i = 0; i < numlanes; i++)
+         XVECEXP (parallel, 0, i) = GEN_INT (i);
+       emit_insn (gen_vec_extract<V_ALL:mode><V_ALL_ALT:mode>_nop
+                  (operands[0], operands[1], parallel));
       } else {
         /* FIXME: optimize this by using DPP where available.  */
 
        tmp = gen_reg_rtx (<V_ALL:MODE>mode);
        emit_insn (gen_ds_bpermute<V_ALL:mode> (tmp, permutation, operands[1],
                                                get_exec (<V_ALL:MODE>mode)));
-      }
 
-    emit_move_insn (operands[0],
-                   gen_rtx_SUBREG (<V_ALL_ALT:MODE>mode, tmp, 0));
+       emit_move_insn (operands[0],
+                       gen_rtx_SUBREG (<V_ALL_ALT:MODE>mode, tmp, 0));
+      }
     DONE;
   })
 
index a0c55fb4d759db1bf4aacf5e66a0395d8ed97f68..7403dfebcea0c12ffe6941faedd50f56b60b190d 100644 (file)
@@ -1433,6 +1433,24 @@ CODE_FOR_OP (reload_out)
 #undef CODE_FOR_OP
 #undef CODE_FOR
 
+/* Return true if OP is a PARALLEL of CONST_INTs that form a linear
+   series with step STEP.  */
+
+bool
+gcn_stepped_zero_int_parallel_p (rtx op, int step)
+{
+  if (GET_CODE (op) != PARALLEL || !CONST_INT_P (XVECEXP (op, 0, 0)))
+    return false;
+
+  unsigned HOST_WIDE_INT base = 0;
+  for (int i = 0; i < XVECLEN (op, 0); ++i)
+    if (!CONST_INT_P (XVECEXP (op, 0, i))
+       || UINTVAL (XVECEXP (op, 0, i)) != base + i * step)
+      return false;
+
+  return true;
+}
+
 /* }}}  */
 /* {{{ Addresses, pointers and moves.  */
 
index 030c2806298ec23a91e46ea49e8b65d00cf215e6..e567fed5ede9bae682df29196647dc49a3e2c1a7 100644 (file)
        (ior (match_operand 0 "gcn_ds_memory_operand")
            (and (match_code "unspec")
               (match_test "XINT (op, 1) == UNSPEC_VECTOR")))))
+
+(define_predicate "ascending_zero_int_parallel"
+  (match_code "parallel")
+{
+  return gcn_stepped_zero_int_parallel_p (op, 1);
+})
+