]> git.ipfire.org Git - thirdparty/gcc.git/commitdiff
x86: Fix ix86_expand_vector_init for V*TImode [PR100887]
authorJakub Jelinek <jakub@redhat.com>
Fri, 4 Jun 2021 09:20:02 +0000 (11:20 +0200)
committerJakub Jelinek <jakub@redhat.com>
Thu, 17 Jun 2021 05:58:24 +0000 (07:58 +0200)
We have vec_initv4tiv2ti and vec_initv2titi patterns which call
ix86_expand_vector_init and assume it works for those modes.  For the
case of construction from two half-sized vectors, the code assumes it
will always succeed, but we have only insn patterns with SImode and DImode
element types.  QImode and HImode element types are already handled
by performing it with same sized vectors with SImode elements and the
following patch extends that to V*TImode vectors.

2021-06-04  Jakub Jelinek  <jakub@redhat.com>

PR target/100887
* config/i386/i386-expand.c (ix86_expand_vector_init): Handle
concatenation from half-sized modes with TImode elements.

(cherry picked from commit b7dd2e4eeb44bc8678ecde8a6c7401de85e63561)

gcc/config/i386/i386-expand.c

index c16811013f17dcaee1e053d3b4c482488d62b8ff..f5c8b115c40055e34efe8c8ae68767d88b525524 100644 (file)
@@ -14513,11 +14513,15 @@ ix86_expand_vector_init (bool mmx_ok, rtx target, rtx vals)
       if (GET_MODE_NUNITS (GET_MODE (x)) * 2 == n_elts)
        {
          rtx ops[2] = { XVECEXP (vals, 0, 0), XVECEXP (vals, 0, 1) };
-         if (inner_mode == QImode || inner_mode == HImode)
+         if (inner_mode == QImode
+             || inner_mode == HImode
+             || inner_mode == TImode)
            {
              unsigned int n_bits = n_elts * GET_MODE_SIZE (inner_mode);
-             mode = mode_for_vector (SImode, n_bits / 4).require ();
-             inner_mode = mode_for_vector (SImode, n_bits / 8).require ();
+             scalar_mode elt_mode = inner_mode == TImode ? DImode : SImode;
+             n_bits /= GET_MODE_SIZE (elt_mode);
+             mode = mode_for_vector (elt_mode, n_bits).require ();
+             inner_mode = mode_for_vector (elt_mode, n_bits / 2).require ();
              ops[0] = gen_lowpart (inner_mode, ops[0]);
              ops[1] = gen_lowpart (inner_mode, ops[1]);
              subtarget = gen_reg_rtx (mode);