i386: Correct mask width for bf8->fp16 intrin on 256/512 bit

author Haochen Jiang <haochen.jiang@intel.com>

Wed, 5 Mar 2025 02:35:11 +0000 (10:35 +0800)

committer Haochen Jiang <haochen.jiang@intel.com>

Fri, 7 Mar 2025 03:33:48 +0000 (11:33 +0800)
author Haochen Jiang <haochen.jiang@intel.com>
Wed, 5 Mar 2025 02:35:11 +0000 (10:35 +0800)
committer Haochen Jiang <haochen.jiang@intel.com>
Fri, 7 Mar 2025 03:33:48 +0000 (11:33 +0800)
diff --git a/gcc/config/i386/avx10_2-512convertintrin.h b/gcc/config/i386/avx10_2-512convertintrin.h

index 1079e0a2bda80b5611b2ee4fb93182ce79148c34..a44481e0b4e9372369c9037bac0381254ebc3cb3 100644 (file)
--- a/gcc/config/i386/avx10_2-512convertintrin.h
+++ b/gcc/config/i386/avx10_2-512convertintrin.h
@@ -550,7 +550,7 @@ _mm512_cvtbf8_ph (__m256i __A)
  
  extern __inline __m512h
  __attribute__ ((__gnu_inline__, __always_inline__, __artificial__))
-_mm512_mask_cvtbf8_ph (__m512h __S, __mmask16 __U, __m256i __A)
+_mm512_mask_cvtbf8_ph (__m512h __S, __mmask32 __U, __m256i __A)
  {
    return (__m512h) _mm512_castsi512_ph ((__m512i) _mm512_mask_slli_epi16 (
          (__m512i) __S, __U, (__m512i) _mm512_cvtepi8_epi16 (__A), 8));
@@ -558,7 +558,7 @@ _mm512_mask_cvtbf8_ph (__m512h __S, __mmask16 __U, __m256i __A)
  
  extern __inline __m512h
  __attribute__ ((__gnu_inline__, __always_inline__, __artificial__))
-_mm512_maskz_cvtbf8_ph (__mmask16 __U, __m256i __A)
+_mm512_maskz_cvtbf8_ph (__mmask32 __U, __m256i __A)
  {
    return (__m512h) _mm512_castsi512_ph ((__m512i) _mm512_slli_epi16 (
          (__m512i) _mm512_maskz_cvtepi8_epi16 (__U, __A), 8));
diff --git a/gcc/config/i386/avx10_2convertintrin.h b/gcc/config/i386/avx10_2convertintrin.h

index 3fc51b17435d30864d46156799b56900f594010b..7c9c238a3b43b446d8f6d5f4c796bfd34e4a9450 100644 (file)
--- a/gcc/config/i386/avx10_2convertintrin.h
+++ b/gcc/config/i386/avx10_2convertintrin.h
@@ -1004,7 +1004,7 @@ _mm256_cvtbf8_ph (__m128i __A)
  
  extern __inline __m256h
  __attribute__ ((__gnu_inline__, __always_inline__, __artificial__))
-_mm256_mask_cvtbf8_ph (__m256h __S, __mmask8 __U, __m128i __A)
+_mm256_mask_cvtbf8_ph (__m256h __S, __mmask16 __U, __m128i __A)
  {
    return (__m256h) _mm256_castsi256_ph ((__m256i) _mm256_mask_slli_epi16 (
          (__m256i) __S, __U, (__m256i) _mm256_cvtepi8_epi16 (__A), 8));
@@ -1012,7 +1012,7 @@ _mm256_mask_cvtbf8_ph (__m256h __S, __mmask8 __U, __m128i __A)
  
  extern __inline __m256h
  __attribute__ ((__gnu_inline__, __always_inline__, __artificial__))
-_mm256_maskz_cvtbf8_ph (__mmask8 __U, __m128i __A)
+_mm256_maskz_cvtbf8_ph (__mmask16 __U, __m128i __A)
  {
    return (__m256h) _mm256_castsi256_ph ((__m256i) _mm256_slli_epi16 (
          (__m256i) _mm256_maskz_cvtepi8_epi16 (__U, __A), 8));
diff --git a/gcc/testsuite/gcc.target/i386/avx10_2-512-convert-1.c b/gcc/testsuite/gcc.target/i386/avx10_2-512-convert-1.c

index bda74b5776b3b2b68ed55e3a844f2cce509909ec..c1e44efdb2f93ce89aefb89eb442149ee7da8db6 100644 (file)
--- a/gcc/testsuite/gcc.target/i386/avx10_2-512-convert-1.c
+++ b/gcc/testsuite/gcc.target/i386/avx10_2-512-convert-1.c
@@ -183,6 +183,6 @@ void extern
  avx10_2_512_cvtbf8_fp16_test (void)
  {
    y = _mm512_cvtbf8_ph (z1);
-  y = _mm512_mask_cvtbf8_ph (z, m16, z1);
-  y = _mm512_maskz_cvtbf8_ph (m16, z1);
+  y = _mm512_mask_cvtbf8_ph (z, m32, z1);
+  y = _mm512_maskz_cvtbf8_ph (m32, z1);
  }
diff --git a/gcc/testsuite/gcc.target/i386/avx10_2-convert-1.c b/gcc/testsuite/gcc.target/i386/avx10_2-convert-1.c

index 57b5fce7fb67da8834693175f756993fdf22cf09..729496f7173086341918989a226d2858d1718c1c 100644 (file)
--- a/gcc/testsuite/gcc.target/i386/avx10_2-convert-1.c
+++ b/gcc/testsuite/gcc.target/i386/avx10_2-convert-1.c
@@ -289,6 +289,6 @@ avx10_2_cvtbf8_fp16_test (void)
    y = _mm_maskz_cvtbf8_ph (m8, z3);
  
    y2 = _mm256_cvtbf8_ph (z3);
-  y2 = _mm256_mask_cvtbf8_ph (z2, m8, z3);
-  y2 = _mm256_maskz_cvtbf8_ph (m8, z3);
+  y2 = _mm256_mask_cvtbf8_ph (z2, m16, z3);
+  y2 = _mm256_maskz_cvtbf8_ph (m16, z3);
  }
author	Haochen Jiang <haochen.jiang@intel.com>
	Wed, 5 Mar 2025 02:35:11 +0000 (10:35 +0800)
committer	Haochen Jiang <haochen.jiang@intel.com>
	Fri, 7 Mar 2025 03:33:48 +0000 (11:33 +0800)
gcc/config/i386/avx10_2-512convertintrin.h		patch \| blob \| blame \| history
gcc/config/i386/avx10_2convertintrin.h		patch \| blob \| blame \| history
gcc/testsuite/gcc.target/i386/avx10_2-512-convert-1.c		patch \| blob \| blame \| history
gcc/testsuite/gcc.target/i386/avx10_2-convert-1.c		patch \| blob \| blame \| history