]> git.ipfire.org Git - thirdparty/gcc.git/commitdiff
i386: Fix incorrect avx512f-mask-type.h include
authorHaochen Jiang <haochen.jiang@intel.com>
Tue, 3 Sep 2024 05:38:36 +0000 (13:38 +0800)
committerHaochen Jiang <haochen.jiang@intel.com>
Thu, 12 Sep 2024 01:53:48 +0000 (09:53 +0800)
In avx512f-mask-type.h, we need SIZE being defined to get
MASK_TYPE defined correctly. Fix those testcases where
SIZE are not defined before the include for avv512f-mask-type.h.

gcc/testsuite/ChangeLog:

* gcc.target/i386/avx10-helper.h: Do not include
avx512f-mask-type.h.
* gcc.target/i386/avx10_2-512-vaddnepbf16-2.c:
Define SIZE and include avx512f-mask-type.h.
* gcc.target/i386/avx10_2-512-vcmppbf16-2.c: Ditto.
* gcc.target/i386/avx10_2-512-vcvtnebf162ibs-2.c: Ditto.
* gcc.target/i386/avx10_2-512-vcvtnebf162iubs-2.c: Ditto.
* gcc.target/i386/avx10_2-512-vcvtph2ibs-2.c: Ditto.
* gcc.target/i386/avx10_2-512-vcvtph2iubs-2.c: Ditto.
* gcc.target/i386/avx10_2-512-vcvtps2ibs-2.c: Ditto.
* gcc.target/i386/avx10_2-512-vcvtps2iubs-2.c: Ditto.
* gcc.target/i386/avx10_2-512-vcvttnebf162ibs-2.c: Ditto.
* gcc.target/i386/avx10_2-512-vcvttnebf162iubs-2.c: Ditto.
* gcc.target/i386/avx10_2-512-vcvttpd2dqs-2.c: Ditto.
* gcc.target/i386/avx10_2-512-vcvttpd2qqs-2.c: Ditto.
* gcc.target/i386/avx10_2-512-vcvttpd2udqs-2.c: Ditto.
* gcc.target/i386/avx10_2-512-vcvttpd2uqqs-2.c: Ditto.
* gcc.target/i386/avx10_2-512-vcvttph2ibs-2.c: Ditto.
* gcc.target/i386/avx10_2-512-vcvttph2iubs-2.c: Ditto.
* gcc.target/i386/avx10_2-512-vcvttps2dqs-2.c: Ditto.
* gcc.target/i386/avx10_2-512-vcvttps2ibs-2.c: Ditto.
* gcc.target/i386/avx10_2-512-vcvttps2iubs-2.c: Ditto.
* gcc.target/i386/avx10_2-512-vcvttps2qqs-2.c: Ditto.
* gcc.target/i386/avx10_2-512-vcvttps2udqs-2.c: Ditto.
* gcc.target/i386/avx10_2-512-vcvttps2uqqs-2.c: Ditto.
* gcc.target/i386/avx10_2-512-vdivnepbf16-2.c: Ditto.
* gcc.target/i386/avx10_2-512-vdpphps-2.c: Ditto.
* gcc.target/i386/avx10_2-512-vfmaddXXXnepbf16-2.c: Ditto.
* gcc.target/i386/avx10_2-512-vfmsubXXXnepbf16-2.c: Ditto.
* gcc.target/i386/avx10_2-512-vfnmaddXXXnepbf16-2.c: Ditto.
* gcc.target/i386/avx10_2-512-vfnmsubXXXnepbf16-2.c: Ditto.
* gcc.target/i386/avx10_2-512-vfpclasspbf16-2.c: Ditto.
* gcc.target/i386/avx10_2-512-vgetexppbf16-2.c: Ditto.
* gcc.target/i386/avx10_2-512-vgetmantpbf16-2.c: Ditto.
* gcc.target/i386/avx10_2-512-vmaxpbf16-2.c: Ditto.
* gcc.target/i386/avx10_2-512-vminmaxnepbf16-2.c: Ditto.
* gcc.target/i386/avx10_2-512-vminmaxpd-2.c: Ditto.
* gcc.target/i386/avx10_2-512-vminmaxph-2.c: Ditto.
* gcc.target/i386/avx10_2-512-vminmaxps-2.c: Ditto.
* gcc.target/i386/avx10_2-512-vminpbf16-2.c: Ditto.
* gcc.target/i386/avx10_2-512-vmpsadbw-2.c: Ditto.
* gcc.target/i386/avx10_2-512-vmulnepbf16-2.c: Ditto.
* gcc.target/i386/avx10_2-512-vpdpbssd-2.c: Ditto.
* gcc.target/i386/avx10_2-512-vpdpbssds-2.c: Ditto.
* gcc.target/i386/avx10_2-512-vpdpbsud-2.c: Ditto.
* gcc.target/i386/avx10_2-512-vpdpbsuds-2.c: Ditto.
* gcc.target/i386/avx10_2-512-vpdpbuud-2.c: Ditto.
* gcc.target/i386/avx10_2-512-vpdpbuuds-2.c: Ditto.
* gcc.target/i386/avx10_2-512-vpdpwsud-2.c: Ditto.
* gcc.target/i386/avx10_2-512-vpdpwsuds-2.c: Ditto.
* gcc.target/i386/avx10_2-512-vpdpwusd-2.c: Ditto.
* gcc.target/i386/avx10_2-512-vpdpwusds-2.c: Ditto.
* gcc.target/i386/avx10_2-512-vpdpwuud-2.c: Ditto.
* gcc.target/i386/avx10_2-512-vpdpwuuds-2.c: Ditto.
* gcc.target/i386/avx10_2-512-vrcppbf16-2.c: Ditto.
* gcc.target/i386/avx10_2-512-vreducenepbf16-2.c: Ditto.
* gcc.target/i386/avx10_2-512-vrndscalenepbf16-2.c: Ditto.
* gcc.target/i386/avx10_2-512-vrsqrtpbf16-2.c: Ditto.
* gcc.target/i386/avx10_2-512-vscalefpbf16-2.c: Ditto.
* gcc.target/i386/avx10_2-512-vsqrtnepbf16-2.c: Ditto.
* gcc.target/i386/avx10_2-512-vsubnepbf16-2.c: Ditto.
* gcc.target/i386/avx512fp16-vfpclassph-1b.c: Ditto.

60 files changed:
gcc/testsuite/gcc.target/i386/avx10-helper.h
gcc/testsuite/gcc.target/i386/avx10_2-512-vaddnepbf16-2.c
gcc/testsuite/gcc.target/i386/avx10_2-512-vcmppbf16-2.c
gcc/testsuite/gcc.target/i386/avx10_2-512-vcvtnebf162ibs-2.c
gcc/testsuite/gcc.target/i386/avx10_2-512-vcvtnebf162iubs-2.c
gcc/testsuite/gcc.target/i386/avx10_2-512-vcvtph2ibs-2.c
gcc/testsuite/gcc.target/i386/avx10_2-512-vcvtph2iubs-2.c
gcc/testsuite/gcc.target/i386/avx10_2-512-vcvtps2ibs-2.c
gcc/testsuite/gcc.target/i386/avx10_2-512-vcvtps2iubs-2.c
gcc/testsuite/gcc.target/i386/avx10_2-512-vcvttnebf162ibs-2.c
gcc/testsuite/gcc.target/i386/avx10_2-512-vcvttnebf162iubs-2.c
gcc/testsuite/gcc.target/i386/avx10_2-512-vcvttpd2dqs-2.c
gcc/testsuite/gcc.target/i386/avx10_2-512-vcvttpd2qqs-2.c
gcc/testsuite/gcc.target/i386/avx10_2-512-vcvttpd2udqs-2.c
gcc/testsuite/gcc.target/i386/avx10_2-512-vcvttpd2uqqs-2.c
gcc/testsuite/gcc.target/i386/avx10_2-512-vcvttph2ibs-2.c
gcc/testsuite/gcc.target/i386/avx10_2-512-vcvttph2iubs-2.c
gcc/testsuite/gcc.target/i386/avx10_2-512-vcvttps2dqs-2.c
gcc/testsuite/gcc.target/i386/avx10_2-512-vcvttps2ibs-2.c
gcc/testsuite/gcc.target/i386/avx10_2-512-vcvttps2iubs-2.c
gcc/testsuite/gcc.target/i386/avx10_2-512-vcvttps2qqs-2.c
gcc/testsuite/gcc.target/i386/avx10_2-512-vcvttps2udqs-2.c
gcc/testsuite/gcc.target/i386/avx10_2-512-vcvttps2uqqs-2.c
gcc/testsuite/gcc.target/i386/avx10_2-512-vdivnepbf16-2.c
gcc/testsuite/gcc.target/i386/avx10_2-512-vdpphps-2.c
gcc/testsuite/gcc.target/i386/avx10_2-512-vfmaddXXXnepbf16-2.c
gcc/testsuite/gcc.target/i386/avx10_2-512-vfmsubXXXnepbf16-2.c
gcc/testsuite/gcc.target/i386/avx10_2-512-vfnmaddXXXnepbf16-2.c
gcc/testsuite/gcc.target/i386/avx10_2-512-vfnmsubXXXnepbf16-2.c
gcc/testsuite/gcc.target/i386/avx10_2-512-vfpclasspbf16-2.c
gcc/testsuite/gcc.target/i386/avx10_2-512-vgetexppbf16-2.c
gcc/testsuite/gcc.target/i386/avx10_2-512-vgetmantpbf16-2.c
gcc/testsuite/gcc.target/i386/avx10_2-512-vmaxpbf16-2.c
gcc/testsuite/gcc.target/i386/avx10_2-512-vminmaxnepbf16-2.c
gcc/testsuite/gcc.target/i386/avx10_2-512-vminmaxpd-2.c
gcc/testsuite/gcc.target/i386/avx10_2-512-vminmaxph-2.c
gcc/testsuite/gcc.target/i386/avx10_2-512-vminmaxps-2.c
gcc/testsuite/gcc.target/i386/avx10_2-512-vminpbf16-2.c
gcc/testsuite/gcc.target/i386/avx10_2-512-vmpsadbw-2.c
gcc/testsuite/gcc.target/i386/avx10_2-512-vmulnepbf16-2.c
gcc/testsuite/gcc.target/i386/avx10_2-512-vpdpbssd-2.c
gcc/testsuite/gcc.target/i386/avx10_2-512-vpdpbssds-2.c
gcc/testsuite/gcc.target/i386/avx10_2-512-vpdpbsud-2.c
gcc/testsuite/gcc.target/i386/avx10_2-512-vpdpbsuds-2.c
gcc/testsuite/gcc.target/i386/avx10_2-512-vpdpbuud-2.c
gcc/testsuite/gcc.target/i386/avx10_2-512-vpdpbuuds-2.c
gcc/testsuite/gcc.target/i386/avx10_2-512-vpdpwsud-2.c
gcc/testsuite/gcc.target/i386/avx10_2-512-vpdpwsuds-2.c
gcc/testsuite/gcc.target/i386/avx10_2-512-vpdpwusd-2.c
gcc/testsuite/gcc.target/i386/avx10_2-512-vpdpwusds-2.c
gcc/testsuite/gcc.target/i386/avx10_2-512-vpdpwuud-2.c
gcc/testsuite/gcc.target/i386/avx10_2-512-vpdpwuuds-2.c
gcc/testsuite/gcc.target/i386/avx10_2-512-vrcppbf16-2.c
gcc/testsuite/gcc.target/i386/avx10_2-512-vreducenepbf16-2.c
gcc/testsuite/gcc.target/i386/avx10_2-512-vrndscalenepbf16-2.c
gcc/testsuite/gcc.target/i386/avx10_2-512-vrsqrtpbf16-2.c
gcc/testsuite/gcc.target/i386/avx10_2-512-vscalefpbf16-2.c
gcc/testsuite/gcc.target/i386/avx10_2-512-vsqrtnepbf16-2.c
gcc/testsuite/gcc.target/i386/avx10_2-512-vsubnepbf16-2.c
gcc/testsuite/gcc.target/i386/avx512fp16-vfpclassph-1b.c

index 4d092e27447b2f30e347ca969615c281b67b2507..ee5fd43de18fdf93228ee866c4f64fe7bf5ccfcd 100644 (file)
@@ -5,7 +5,6 @@
 #define AVX512FP16
 #define AVX512BF16
 #include "avx512f-helper.h"
-#include "avx512f-mask-type.h"
 #include <stdint.h>
 
 #define NOINLINE __attribute__((noinline,noclone))
index 3b7d16353358d5fbe27e93a3e607429235a87f6a..702adeb16adc8a0aeec651b4e4560d5f1b012367 100644 (file)
@@ -8,7 +8,8 @@
 #define AVX10_512BIT
 #endif
 #include "avx10-helper.h"
-#define SIZE_RES (AVX512F_LEN / 16)
+#define SIZE (AVX512F_LEN / 16)
+#include "avx512f-mask-type.h"
 
 void
 TEST (void)
@@ -16,9 +17,9 @@ TEST (void)
   int i;
   UNION_TYPE (AVX512F_LEN, bf16_uw) res1, res2, res3, src1, src2;
   MASK_TYPE mask = MASK_VALUE;
-  unsigned short res_ref[SIZE_RES], res_ref2[SIZE_RES];
+  unsigned short res_ref[SIZE], res_ref2[SIZE];
   
-  for (i = 0; i < SIZE_RES; i++)
+  for (i = 0; i < SIZE; i++)
     {
       res1.a[i] = 0;
       res2.a[i] = DEFAULT_VALUE;
@@ -39,11 +40,11 @@ TEST (void)
   if (UNION_CHECK (AVX512F_LEN, bf16_uw) (res1, res_ref))
     abort ();
   
-  MASK_MERGE (bf16_uw) (res_ref2, mask, SIZE_RES);
+  MASK_MERGE (bf16_uw) (res_ref2, mask, SIZE);
   if (UNION_CHECK (AVX512F_LEN, bf16_uw) (res2, res_ref2))
     abort ();
 
-  MASK_ZERO (bf16_uw) (res_ref2, mask, SIZE_RES);
+  MASK_ZERO (bf16_uw) (res_ref2, mask, SIZE);
   if (UNION_CHECK (AVX512F_LEN, bf16_uw) (res3, res_ref2))
     abort ();
 }
index a352890e9bc7a6bcf22d1aa59ff384a37adb4cbf..e0d68a182246145a7a712c1f8f6eec41fcfeff57 100644 (file)
@@ -8,7 +8,8 @@
 #define AVX10_512BIT
 #endif
 #include "avx10-helper.h"
-#define SIZE_RES (AVX512F_LEN / 16)
+#define SIZE (AVX512F_LEN / 16)
+#include "avx512f-mask-type.h"
 
 void
 TEST (void)
@@ -18,7 +19,7 @@ TEST (void)
   UNION_TYPE (AVX512F_LEN, bf16_uw) src1, src2;
   MASK_TYPE mask = MASK_VALUE;
   
-  for (i = 0; i < SIZE_RES; i++)
+  for (i = 0; i < SIZE; i++)
     {
       float x = 0.5;
       float y = 0.25;
index 489927ee065c99fb5dd04284a7b964bad08791c2..db9b31e6bb6f1ad4160b6fdf94f0f47aee24276e 100644 (file)
@@ -11,8 +11,8 @@
 #include <math.h>
 #include <limits.h>
 
-#define SRC_SIZE ((AVX512F_LEN) / 16)
-#define DST_SIZE ((AVX512F_LEN) / 16)
+#define SIZE (AVX512F_LEN / 16)
+#include "avx512f-mask-type.h"
 
 static void
 CALC (__bf16 *s, short *r)
@@ -20,7 +20,7 @@ CALC (__bf16 *s, short *r)
   int i;
   unsigned char tmp;
 
-  for (i = 0; i < SRC_SIZE; i++)
+  for (i = 0; i < SIZE; i++)
     {
       if (s[i] > SCHAR_MAX)
        tmp = SCHAR_MAX;
@@ -38,16 +38,16 @@ TEST (void)
   UNION_TYPE (AVX512F_LEN, bf16_bf) s;
   UNION_TYPE (AVX512F_LEN, i_w) res1, res2, res3;
   MASK_TYPE mask = MASK_VALUE;
-  short res_ref[DST_SIZE] = { 0 };
+  short res_ref[SIZE] = { 0 };
   int i, sign = 1;
 
-  for (i = 0; i < SRC_SIZE; i++)
+  for (i = 0; i < SIZE; i++)
     {
       s.a[i] = 1.23 * (i + 2) * sign;
       sign = -sign;
     }
 
-  for (i = 0; i < DST_SIZE; i++)
+  for (i = 0; i < SIZE; i++)
     res2.a[i] = DEFAULT_VALUE;
 
   res1.x = INTRINSIC (_ipcvtnebf16_epi16) (s.x);
@@ -59,11 +59,11 @@ TEST (void)
   if (UNION_CHECK (AVX512F_LEN, i_w) (res1, res_ref))
     abort ();
 
-  MASK_MERGE (i_w) (res_ref, mask, SRC_SIZE);
+  MASK_MERGE (i_w) (res_ref, mask, SIZE);
   if (UNION_CHECK (AVX512F_LEN, i_w) (res2, res_ref))
     abort ();
 
-  MASK_ZERO (i_w) (res_ref, mask, SRC_SIZE);
+  MASK_ZERO (i_w) (res_ref, mask, SIZE);
   if (UNION_CHECK (AVX512F_LEN, i_w) (res3, res_ref))
     abort ();
 }
index f901f41ea8bafdbef9c633b49e56207fb9c31a90..b2a27a00a24fbf9f26b6d8376ad506c8fc10468d 100644 (file)
@@ -11,8 +11,8 @@
 #include <math.h>
 #include <limits.h>
 
-#define SRC_SIZE ((AVX512F_LEN) / 16)
-#define DST_SIZE ((AVX512F_LEN) / 16)
+#define SIZE (AVX512F_LEN / 16)
+#include "avx512f-mask-type.h"
 
 static void
 CALC (__bf16 *s, unsigned short *r)
@@ -20,7 +20,7 @@ CALC (__bf16 *s, unsigned short *r)
   int i;
   unsigned char tmp;
 
-  for (i = 0; i < SRC_SIZE; i++)
+  for (i = 0; i < SIZE; i++)
     {
       if (s[i] > UCHAR_MAX)
        tmp = UCHAR_MAX;
@@ -38,16 +38,16 @@ TEST (void)
   UNION_TYPE (AVX512F_LEN, bf16_bf) s;
   UNION_TYPE (AVX512F_LEN, i_uw) res1, res2, res3;
   MASK_TYPE mask = MASK_VALUE;
-  unsigned short res_ref[DST_SIZE] = { 0 };
+  unsigned short res_ref[SIZE] = { 0 };
   int i, sign = 1;
 
-  for (i = 0; i < SRC_SIZE; i++)
+  for (i = 0; i < SIZE; i++)
     {
       s.a[i] = 1.23 * (i + 2) * sign;
       sign = -sign;
     }
 
-  for (i = 0; i < DST_SIZE; i++)
+  for (i = 0; i < SIZE; i++)
     res2.a[i] = DEFAULT_VALUE;
 
   res1.x = INTRINSIC (_ipcvtnebf16_epu16) (s.x);
@@ -59,11 +59,11 @@ TEST (void)
   if (UNION_CHECK (AVX512F_LEN, i_uw) (res1, res_ref))
     abort ();
 
-  MASK_MERGE (i_uw) (res_ref, mask, SRC_SIZE);
+  MASK_MERGE (i_uw) (res_ref, mask, SIZE);
   if (UNION_CHECK (AVX512F_LEN, i_uw) (res2, res_ref))
     abort ();
 
-  MASK_ZERO (i_uw) (res_ref, mask, SRC_SIZE);
+  MASK_ZERO (i_uw) (res_ref, mask, SIZE);
   if (UNION_CHECK (AVX512F_LEN, i_uw) (res3, res_ref))
     abort ();
 }
index 4ce8dd06bdca579c4e79cd1220322500ab383389..ea96bc9af9f09a3d2b418b05e18c416c115b6b82 100644 (file)
@@ -10,8 +10,8 @@
 #include "avx10-helper.h"
 #include <limits.h>
 
-#define SRC_SIZE ((AVX512F_LEN) / 16)
-#define DST_SIZE ((AVX512F_LEN) / 16)
+#define SIZE (AVX512F_LEN / 16)
+#include "avx512f-mask-type.h"
 
 static void
 CALC (_Float16 *s, short *r)
@@ -19,7 +19,7 @@ CALC (_Float16 *s, short *r)
   int i;
   unsigned char tmp;
 
-  for (i = 0; i < SRC_SIZE; i++)
+  for (i = 0; i < SIZE; i++)
     {
       if (s[i] > SCHAR_MAX)
        tmp = SCHAR_MAX;
@@ -37,16 +37,16 @@ TEST (void)
   UNION_TYPE (AVX512F_LEN, h) s;
   UNION_TYPE (AVX512F_LEN, i_w) res1, res2, res3;
   MASK_TYPE mask = MASK_VALUE;
-  short res_ref[DST_SIZE] = { 0 };
+  short res_ref[SIZE] = { 0 };
   int i, sign = 1;
 
-  for (i = 0; i < SRC_SIZE; i++)
+  for (i = 0; i < SIZE; i++)
     {
       s.a[i] = 1.23 * (i + 2) * sign;
       sign = -sign;
     }
 
-  for (i = 0; i < DST_SIZE; i++)
+  for (i = 0; i < SIZE; i++)
     res2.a[i] = DEFAULT_VALUE;
 
 #if AVX512F_LEN == 128
@@ -64,11 +64,11 @@ TEST (void)
   if (UNION_CHECK (AVX512F_LEN, i_w) (res1, res_ref))
     abort ();
 
-  MASK_MERGE (i_w) (res_ref, mask, SRC_SIZE);
+  MASK_MERGE (i_w) (res_ref, mask, SIZE);
   if (UNION_CHECK (AVX512F_LEN, i_w) (res2, res_ref))
     abort ();
 
-  MASK_ZERO (i_w) (res_ref, mask, SRC_SIZE);
+  MASK_ZERO (i_w) (res_ref, mask, SIZE);
   if (UNION_CHECK (AVX512F_LEN, i_w) (res3, res_ref))
     abort ();
 }
index f78d6c7ee9e75f4313192a5e2c86b7fc00a58330..4eea319a20e7b05952d5df15f8063f4748f33540 100644 (file)
@@ -10,8 +10,8 @@
 #include "avx10-helper.h"
 #include <limits.h>
 
-#define SRC_SIZE ((AVX512F_LEN) / 16)
-#define DST_SIZE ((AVX512F_LEN) / 16)
+#define SIZE (AVX512F_LEN / 16)
+#include "avx512f-mask-type.h"
 
 static void
 CALC (_Float16 *s, short *r)
@@ -19,7 +19,7 @@ CALC (_Float16 *s, short *r)
   int i;
   unsigned char tmp;
 
-  for (i = 0; i < SRC_SIZE; i++)
+  for (i = 0; i < SIZE; i++)
     {
       if (s[i] > UCHAR_MAX)
        tmp = UCHAR_MAX;
@@ -37,16 +37,16 @@ TEST (void)
   UNION_TYPE (AVX512F_LEN, h) s;
   UNION_TYPE (AVX512F_LEN, i_w) res1, res2, res3;
   MASK_TYPE mask = MASK_VALUE;
-  short res_ref[DST_SIZE] = { 0 };
+  short res_ref[SIZE] = { 0 };
   int i, sign = 1;
 
-  for (i = 0; i < SRC_SIZE; i++)
+  for (i = 0; i < SIZE; i++)
     {
       s.a[i] = 1.23 * (i + 2) * sign;
       sign = -sign;
     }
 
-  for (i = 0; i < DST_SIZE; i++)
+  for (i = 0; i < SIZE; i++)
     res2.a[i] = DEFAULT_VALUE;
 
 #if AVX512F_LEN == 128
@@ -64,11 +64,11 @@ TEST (void)
   if (UNION_CHECK (AVX512F_LEN, i_w) (res1, res_ref))
     abort ();
 
-  MASK_MERGE (i_w) (res_ref, mask, SRC_SIZE);
+  MASK_MERGE (i_w) (res_ref, mask, SIZE);
   if (UNION_CHECK (AVX512F_LEN, i_w) (res2, res_ref))
     abort ();
 
-  MASK_ZERO (i_w) (res_ref, mask, SRC_SIZE);
+  MASK_ZERO (i_w) (res_ref, mask, SIZE);
   if (UNION_CHECK (AVX512F_LEN, i_w) (res3, res_ref))
     abort ();
 }
index 4852a8bd6ddf70624abd37bc189b7c89690dee92..420e5de0c2470e3a126b9c0ce500adebb369855b 100644 (file)
@@ -11,8 +11,8 @@
 #include <limits.h>
 #include <math.h>
 
-#define SRC_SIZE ((AVX512F_LEN) / 32)
-#define DST_SIZE ((AVX512F_LEN) / 32)
+#define SIZE (AVX512F_LEN / 32)
+#include "avx512f-mask-type.h"
 
 static void
 CALC (float *s, int *r)
@@ -20,7 +20,7 @@ CALC (float *s, int *r)
   int i;
   unsigned char tmp;
 
-  for (i = 0; i < SRC_SIZE; i++)
+  for (i = 0; i < SIZE; i++)
     {
       if (s[i] > SCHAR_MAX)
        tmp = SCHAR_MAX;
@@ -38,16 +38,16 @@ TEST (void)
   UNION_TYPE (AVX512F_LEN, ) s;
   UNION_TYPE (AVX512F_LEN, i_d) res1, res2, res3;
   MASK_TYPE mask = MASK_VALUE;
-  int res_ref[DST_SIZE] = { 0 };
+  int res_ref[SIZE] = { 0 };
   int i, sign = 1;
 
-  for (i = 0; i < SRC_SIZE; i++)
+  for (i = 0; i < SIZE; i++)
     {
       s.a[i] = 1.23 * (i + 2) * sign;
       sign = -sign;
     }
 
-  for (i = 0; i < DST_SIZE; i++)
+  for (i = 0; i < SIZE; i++)
     res2.a[i] = DEFAULT_VALUE;
 
 #if AVX512F_LEN == 128
@@ -65,11 +65,11 @@ TEST (void)
   if (UNION_CHECK (AVX512F_LEN, i_d) (res1, res_ref))
     abort ();
 
-  MASK_MERGE (i_d) (res_ref, mask, SRC_SIZE);
+  MASK_MERGE (i_d) (res_ref, mask, SIZE);
   if (UNION_CHECK (AVX512F_LEN, i_d) (res2, res_ref))
     abort ();
 
-  MASK_ZERO (i_d) (res_ref, mask, SRC_SIZE);
+  MASK_ZERO (i_d) (res_ref, mask, SIZE);
   if (UNION_CHECK (AVX512F_LEN, i_d) (res3, res_ref))
     abort ();
 }
index 6e0ad7d150ced149f080c5b37aa37556d00412ee..f5dffe267e78d65b9afdc0714d6639ae81390037 100644 (file)
 #include <limits.h>
 #include <math.h>
 
-#define SRC_SIZE ((AVX512F_LEN) / 32)
-#define DST_SIZE ((AVX512F_LEN) / 32)
+#define SIZE (AVX512F_LEN / 32)
+#include "avx512f-mask-type.h"
 
 static void
 CALC (float *s, int *r)
 {
   int i;
 
-  for (i = 0; i < SRC_SIZE; i++)
+  for (i = 0; i < SIZE; i++)
     {
       if (s[i] > UCHAR_MAX)
        r[i] = UCHAR_MAX;
@@ -36,16 +36,16 @@ TEST (void)
   UNION_TYPE (AVX512F_LEN, ) s;
   UNION_TYPE (AVX512F_LEN, i_d) res1, res2, res3;
   MASK_TYPE mask = MASK_VALUE;
-  int res_ref[DST_SIZE] = { 0 };
+  int res_ref[SIZE] = { 0 };
   int i, sign = 1;
 
-  for (i = 0; i < SRC_SIZE; i++)
+  for (i = 0; i < SIZE; i++)
     {
       s.a[i] = 1.23 * (i + 2) * sign;
       sign = -sign;
     }
 
-  for (i = 0; i < DST_SIZE; i++)
+  for (i = 0; i < SIZE; i++)
     res2.a[i] = DEFAULT_VALUE;
 
 #if AVX512F_LEN == 128
@@ -63,11 +63,11 @@ TEST (void)
   if (UNION_CHECK (AVX512F_LEN, i_d) (res1, res_ref))
     abort ();
 
-  MASK_MERGE (i_d) (res_ref, mask, SRC_SIZE);
+  MASK_MERGE (i_d) (res_ref, mask, SIZE);
   if (UNION_CHECK (AVX512F_LEN, i_d) (res2, res_ref))
     abort ();
 
-  MASK_ZERO (i_d) (res_ref, mask, SRC_SIZE);
+  MASK_ZERO (i_d) (res_ref, mask, SIZE);
   if (UNION_CHECK (AVX512F_LEN, i_d) (res3, res_ref))
     abort ();
 }
index 23de8234aa680b37e0729c538b99828092a0178d..e810b56e17713d92e6226ba3958ed635b0ede9de 100644 (file)
@@ -11,8 +11,8 @@
 #include <math.h>
 #include <limits.h>
 
-#define SRC_SIZE ((AVX512F_LEN) / 16)
-#define DST_SIZE ((AVX512F_LEN) / 16)
+#define SIZE (AVX512F_LEN / 16)
+#include "avx512f-mask-type.h"
 
 static void
 CALC (__bf16 *s, short *r)
@@ -20,7 +20,7 @@ CALC (__bf16 *s, short *r)
   int i;
   unsigned char tmp;
 
-  for (i = 0; i < SRC_SIZE; i++)
+  for (i = 0; i < SIZE; i++)
     {
       if (s[i] > SCHAR_MAX)
        tmp = SCHAR_MAX;
@@ -38,16 +38,16 @@ TEST (void)
   UNION_TYPE (AVX512F_LEN, bf16_bf) s;
   UNION_TYPE (AVX512F_LEN, i_w) res1, res2, res3;
   MASK_TYPE mask = MASK_VALUE;
-  short res_ref[DST_SIZE] = { 0 };
+  short res_ref[SIZE] = { 0 };
   int i, sign = 1;
 
-  for (i = 0; i < SRC_SIZE; i++)
+  for (i = 0; i < SIZE; i++)
     {
       s.a[i] = 1.23 * (i + 2) * sign;
       sign = -sign;
     }
 
-  for (i = 0; i < DST_SIZE; i++)
+  for (i = 0; i < SIZE; i++)
     res2.a[i] = DEFAULT_VALUE;
 
   res1.x = INTRINSIC (_ipcvttnebf16_epi16) (s.x);
@@ -59,11 +59,11 @@ TEST (void)
   if (UNION_CHECK (AVX512F_LEN, i_w) (res1, res_ref))
     abort ();
 
-  MASK_MERGE (i_w) (res_ref, mask, SRC_SIZE);
+  MASK_MERGE (i_w) (res_ref, mask, SIZE);
   if (UNION_CHECK (AVX512F_LEN, i_w) (res2, res_ref))
     abort ();
 
-  MASK_ZERO (i_w) (res_ref, mask, SRC_SIZE);
+  MASK_ZERO (i_w) (res_ref, mask, SIZE);
   if (UNION_CHECK (AVX512F_LEN, i_w) (res3, res_ref))
     abort ();
 }
index 858d8e73a007150191ee65a0d9b230458b8e4b5f..032f83667d76da5e5178818ae7098bdde8dc9503 100644 (file)
@@ -11,8 +11,8 @@
 #include <math.h>
 #include <limits.h>
 
-#define SRC_SIZE ((AVX512F_LEN) / 16)
-#define DST_SIZE ((AVX512F_LEN) / 16)
+#define SIZE (AVX512F_LEN / 16)
+#include "avx512f-mask-type.h"
 
 static void
 CALC (__bf16 *s, short *r)
@@ -20,7 +20,7 @@ CALC (__bf16 *s, short *r)
   int i;
   unsigned char tmp;
 
-  for (i = 0; i < SRC_SIZE; i++)
+  for (i = 0; i < SIZE; i++)
     {
       if (s[i] > UCHAR_MAX)
        tmp = UCHAR_MAX;
@@ -38,16 +38,16 @@ TEST (void)
   UNION_TYPE (AVX512F_LEN, bf16_bf) s;
   UNION_TYPE (AVX512F_LEN, i_uw) res1, res2, res3;
   MASK_TYPE mask = MASK_VALUE;
-  unsigned short res_ref[DST_SIZE] = { 0 };
+  unsigned short res_ref[SIZE] = { 0 };
   int i, sign = 1;
 
-  for (i = 0; i < SRC_SIZE; i++)
+  for (i = 0; i < SIZE; i++)
     {
       s.a[i] = 1.23 * (i + 2) * sign;
       sign = -sign;
     }
 
-  for (i = 0; i < DST_SIZE; i++)
+  for (i = 0; i < SIZE; i++)
     res2.a[i] = DEFAULT_VALUE;
 
   res1.x = INTRINSIC (_ipcvttnebf16_epu16) (s.x);
@@ -59,11 +59,11 @@ TEST (void)
   if (UNION_CHECK (AVX512F_LEN, i_uw) (res1, res_ref))
     abort ();
 
-  MASK_MERGE (i_uw) (res_ref, mask, SRC_SIZE);
+  MASK_MERGE (i_uw) (res_ref, mask, SIZE);
   if (UNION_CHECK (AVX512F_LEN, i_uw) (res2, res_ref))
     abort ();
 
-  MASK_ZERO (i_uw) (res_ref, mask, SRC_SIZE);
+  MASK_ZERO (i_uw) (res_ref, mask, SIZE);
   if (UNION_CHECK (AVX512F_LEN, i_uw) (res3, res_ref))
     abort ();
 }
index dd7ea88cb82db95e167456cb658a381b8b2fcfbe..a0ec1639c2741a68108910d2530a0c136649d8b7 100644 (file)
@@ -10,8 +10,9 @@
 #include "avx10-helper.h"
 #include <limits.h>
 
-#define SRC_SIZE ((AVX512F_LEN) / 64)
-#define DST_SIZE ((AVX512F_LEN_HALF) / 32)
+#define SRC_SIZE (AVX512F_LEN / 64)
+#define SIZE (AVX512F_LEN_HALF / 32)
+#include "avx512f-mask-type.h"
 
 static void
 CALC (double *s, int *r)
@@ -35,7 +36,7 @@ TEST (void)
   UNION_TYPE (AVX512F_LEN, d) s;
   UNION_TYPE (AVX512F_LEN_HALF, i_d) res1, res2, res3;
   MASK_TYPE mask = MASK_VALUE;
-  int res_ref[DST_SIZE] = { 0 };
+  int res_ref[SIZE] = { 0 };
   int i, sign = 1;
 
   for (i = 0; i < SRC_SIZE; i++)
@@ -44,7 +45,7 @@ TEST (void)
       sign = -sign;
     }
 
-  for (i = 0; i < DST_SIZE; i++)
+  for (i = 0; i < SIZE; i++)
     res2.a[i] = DEFAULT_VALUE;
 
 #if AVX512F_LEN == 128
index a28643152ae8b2937af45a22579e922ed5c097d0..e83c1dbfe275f734b25d358056997fe2042c02bb 100644 (file)
 #include "avx10-helper.h"
 #include <limits.h>
 
-#define SRC_SIZE ((AVX512F_LEN) / 64)
-#define DST_SIZE ((AVX512F_LEN) / 64)
+#define SIZE (AVX512F_LEN / 64)
+#include "avx512f-mask-type.h"
 
 static void
 CALC (double *s, long long *r)
 {
   int i;
 
-  for (i = 0; i < SRC_SIZE; i++)
+  for (i = 0; i < SIZE; i++)
     {
       if (s[i] > LLONG_MAX)
        r[i] = LLONG_MAX;
@@ -35,16 +35,16 @@ TEST (void)
   UNION_TYPE (AVX512F_LEN, d) s;
   UNION_TYPE (AVX512F_LEN, i_q) res1, res2, res3;
   MASK_TYPE mask = MASK_VALUE;
-  long long res_ref[DST_SIZE] = { 0 };
+  long long res_ref[SIZE] = { 0 };
   int i, sign = 1;
 
-  for (i = 0; i < SRC_SIZE; i++)
+  for (i = 0; i < SIZE; i++)
     {
       s.a[i] = 1.23 * (i + 2) * sign;
       sign = -sign;
     }
 
-  for (i = 0; i < DST_SIZE; i++)
+  for (i = 0; i < SIZE; i++)
     res2.a[i] = DEFAULT_VALUE;
 
 #if AVX512F_LEN == 128
@@ -62,11 +62,11 @@ TEST (void)
   if (UNION_CHECK (AVX512F_LEN, i_q) (res1, res_ref))
     abort ();
 
-  MASK_MERGE (i_q) (res_ref, mask, SRC_SIZE);
+  MASK_MERGE (i_q) (res_ref, mask, SIZE);
   if (UNION_CHECK (AVX512F_LEN, i_q) (res2, res_ref))
     abort ();
 
-  MASK_ZERO (i_q) (res_ref, mask, SRC_SIZE);
+  MASK_ZERO (i_q) (res_ref, mask, SIZE);
   if (UNION_CHECK (AVX512F_LEN, i_q) (res3, res_ref))
     abort ();
 }
index 768567747a485adc508e6ca69d61415b496196e0..7ade9093cc7968ce18df2d44acd80e2bfeffa113 100644 (file)
@@ -10,8 +10,9 @@
 #include "avx10-helper.h"
 #include <limits.h>
 
-#define SRC_SIZE ((AVX512F_LEN) / 64)
-#define DST_SIZE ((AVX512F_LEN_HALF) / 32)
+#define SRC_SIZE (AVX512F_LEN / 64)
+#define SIZE (AVX512F_LEN_HALF / 32)
+#include "avx512f-mask-type.h"
 
 static void
 CALC (double *s, unsigned int *r)
@@ -35,7 +36,7 @@ TEST (void)
   UNION_TYPE (AVX512F_LEN, d) s;
   UNION_TYPE (AVX512F_LEN_HALF, i_ud) res1, res2, res3;
   MASK_TYPE mask = MASK_VALUE;
-  unsigned int res_ref[DST_SIZE] = { 0 };
+  unsigned int res_ref[SIZE] = { 0 };
   int i, sign = 1;
 
   for (i = 0; i < SRC_SIZE; i++)
@@ -44,7 +45,7 @@ TEST (void)
       sign = -sign;
     }
 
-  for (i = 0; i < DST_SIZE; i++)
+  for (i = 0; i < SIZE; i++)
     res2.a[i] = DEFAULT_VALUE;
 
 #if AVX512F_LEN == 128
index dbdd8114241ddec9a460633e998fe8f170c59aba..c137548b707a98b72afd3e8c640065e0f93405ed 100644 (file)
 #include "avx10-helper.h"
 #include <limits.h>
 
-#define SRC_SIZE ((AVX512F_LEN) / 64)
-#define DST_SIZE ((AVX512F_LEN) / 64)
+#define SIZE (AVX512F_LEN / 64)
+#include "avx512f-mask-type.h"
 
 static void
 CALC (double *s, unsigned long long *r)
 {
   int i;
 
-  for (i = 0; i < SRC_SIZE; i++)
+  for (i = 0; i < SIZE; i++)
     {
       if (s[i] > ULONG_MAX)
        r[i] = ULONG_MAX;
@@ -35,16 +35,16 @@ TEST (void)
   UNION_TYPE (AVX512F_LEN, d) s;
   UNION_TYPE (AVX512F_LEN, i_uq) res1, res2, res3;
   MASK_TYPE mask = MASK_VALUE;
-  unsigned long long res_ref[DST_SIZE] = { 0 };
+  unsigned long long res_ref[SIZE] = { 0 };
   int i, sign = 1;
 
-  for (i = 0; i < SRC_SIZE; i++)
+  for (i = 0; i < SIZE; i++)
     {
       s.a[i] = 1.23 * (i + 2) * sign;
       sign = -sign;
     }
 
-  for (i = 0; i < DST_SIZE; i++)
+  for (i = 0; i < SIZE; i++)
     res2.a[i] = DEFAULT_VALUE;
 
 #if AVX512F_LEN == 128
@@ -62,11 +62,11 @@ TEST (void)
   if (UNION_CHECK (AVX512F_LEN, i_uq) (res1, res_ref))
     abort ();
 
-  MASK_MERGE (i_uq) (res_ref, mask, SRC_SIZE);
+  MASK_MERGE (i_uq) (res_ref, mask, SIZE);
   if (UNION_CHECK (AVX512F_LEN, i_uq) (res2, res_ref))
     abort ();
 
-  MASK_ZERO (i_uq) (res_ref, mask, SRC_SIZE);
+  MASK_ZERO (i_uq) (res_ref, mask, SIZE);
   if (UNION_CHECK (AVX512F_LEN, i_uq) (res3, res_ref))
     abort ();
 }
index e2624fb64b263ed7d924e9996fe994b1aa902e20..b154c54fe490261b3bf3743269103e6f8807a82d 100644 (file)
@@ -10,8 +10,8 @@
 #include "avx10-helper.h"
 #include <limits.h>
 
-#define SRC_SIZE ((AVX512F_LEN) / 16)
-#define DST_SIZE ((AVX512F_LEN) / 16)
+#define SIZE (AVX512F_LEN / 16)
+#include "avx512f-mask-type.h"
 
 static void
 CALC (_Float16 *s, short *r)
@@ -19,7 +19,7 @@ CALC (_Float16 *s, short *r)
   int i;
   char tmp;
 
-  for (i = 0; i < SRC_SIZE; i++)
+  for (i = 0; i < SIZE; i++)
     {
       if (s[i] > SCHAR_MAX)
        tmp = SCHAR_MAX;
@@ -37,16 +37,16 @@ TEST (void)
   UNION_TYPE (AVX512F_LEN, h) s;
   UNION_TYPE (AVX512F_LEN, i_w) res1, res2, res3;
   MASK_TYPE mask = MASK_VALUE;
-  short res_ref[DST_SIZE] = { 0 };
+  short res_ref[SIZE] = { 0 };
   int i, sign = 1;
 
-  for (i = 0; i < SRC_SIZE; i++)
+  for (i = 0; i < SIZE; i++)
     {
       s.a[i] = 1.23 * (i + 2) * sign;
       sign = -sign;
     }
 
-  for (i = 0; i < DST_SIZE; i++)
+  for (i = 0; i < SIZE; i++)
     res2.a[i] = DEFAULT_VALUE;
 
 #if AVX512F_LEN == 128
@@ -64,11 +64,11 @@ TEST (void)
   if (UNION_CHECK (AVX512F_LEN, i_w) (res1, res_ref))
     abort ();
 
-  MASK_MERGE (i_w) (res_ref, mask, SRC_SIZE);
+  MASK_MERGE (i_w) (res_ref, mask, SIZE);
   if (UNION_CHECK (AVX512F_LEN, i_w) (res2, res_ref))
     abort ();
 
-  MASK_ZERO (i_w) (res_ref, mask, SRC_SIZE);
+  MASK_ZERO (i_w) (res_ref, mask, SIZE);
   if (UNION_CHECK (AVX512F_LEN, i_w) (res3, res_ref))
     abort ();
 }
index d98a462c4b38f2b3babb74b8d885f6e0f4338c1f..4e36ad75ce7ab428ec0842752eba9f3551eb0e80 100644 (file)
@@ -10,8 +10,8 @@
 #include "avx10-helper.h"
 #include <limits.h>
 
-#define SRC_SIZE ((AVX512F_LEN) / 16)
-#define DST_SIZE ((AVX512F_LEN) / 16)
+#define SIZE (AVX512F_LEN / 16)
+#include "avx512f-mask-type.h"
 
 static void
 CALC (_Float16 *s, short *r)
@@ -19,7 +19,7 @@ CALC (_Float16 *s, short *r)
   int i;
   unsigned char tmp;
 
-  for (i = 0; i < SRC_SIZE; i++)
+  for (i = 0; i < SIZE; i++)
     {
       if (s[i] > UCHAR_MAX)
        tmp = UCHAR_MAX;
@@ -37,16 +37,16 @@ TEST (void)
   UNION_TYPE (AVX512F_LEN, h) s;
   UNION_TYPE (AVX512F_LEN, i_w) res1, res2, res3;
   MASK_TYPE mask = MASK_VALUE;
-  short res_ref[DST_SIZE] = { 0 };
+  short res_ref[SIZE] = { 0 };
   int i, sign = 1;
 
-  for (i = 0; i < SRC_SIZE; i++)
+  for (i = 0; i < SIZE; i++)
     {
       s.a[i] = 1.23 * (i + 2) * sign;
       sign = -sign;
     }
 
-  for (i = 0; i < DST_SIZE; i++)
+  for (i = 0; i < SIZE; i++)
     res2.a[i] = DEFAULT_VALUE;
 
 #if AVX512F_LEN == 128
@@ -64,11 +64,11 @@ TEST (void)
   if (UNION_CHECK (AVX512F_LEN, i_w) (res1, res_ref))
     abort ();
 
-  MASK_MERGE (i_w) (res_ref, mask, SRC_SIZE);
+  MASK_MERGE (i_w) (res_ref, mask, SIZE);
   if (UNION_CHECK (AVX512F_LEN, i_w) (res2, res_ref))
     abort ();
 
-  MASK_ZERO (i_w) (res_ref, mask, SRC_SIZE);
+  MASK_ZERO (i_w) (res_ref, mask, SIZE);
   if (UNION_CHECK (AVX512F_LEN, i_w) (res3, res_ref))
     abort ();
 }
index 7a9b6e31e406875b0cc4456275789650cda1a15f..086d841b6eda5d78ce654ae891e9a4fee03823b6 100644 (file)
 #include "avx10-helper.h"
 #include <limits.h>
 
-#define SRC_SIZE ((AVX512F_LEN) / 32)
-#define DST_SIZE ((AVX512F_LEN) / 32)
+#define SIZE (AVX512F_LEN / 32)
+#include "avx512f-mask-type.h"
 
 static void
 CALC (float *s, int *r)
 {
   int i;
 
-  for (i = 0; i < SRC_SIZE; i++)
+  for (i = 0; i < SIZE; i++)
     {
       if (s[i] > INT_MAX)
        r[i] = INT_MAX;
@@ -35,16 +35,16 @@ TEST (void)
   UNION_TYPE (AVX512F_LEN, ) s;
   UNION_TYPE (AVX512F_LEN, i_d) res1, res2, res3;
   MASK_TYPE mask = MASK_VALUE;
-  int res_ref[DST_SIZE] = { 0 };
+  int res_ref[SIZE] = { 0 };
   int i, sign = 1;
 
-  for (i = 0; i < SRC_SIZE; i++)
+  for (i = 0; i < SIZE; i++)
     {
       s.a[i] = 1.23 * (i + 2) * sign;
       sign = -sign;
     }
 
-  for (i = 0; i < DST_SIZE; i++)
+  for (i = 0; i < SIZE; i++)
     res2.a[i] = DEFAULT_VALUE;
 
 #if AVX512F_LEN == 128
@@ -62,11 +62,11 @@ TEST (void)
   if (UNION_CHECK (AVX512F_LEN, i_d) (res1, res_ref))
     abort ();
 
-  MASK_MERGE (i_d) (res_ref, mask, SRC_SIZE);
+  MASK_MERGE (i_d) (res_ref, mask, SIZE);
   if (UNION_CHECK (AVX512F_LEN, i_d) (res2, res_ref))
     abort ();
 
-  MASK_ZERO (i_d) (res_ref, mask, SRC_SIZE);
+  MASK_ZERO (i_d) (res_ref, mask, SIZE);
   if (UNION_CHECK (AVX512F_LEN, i_d) (res3, res_ref))
     abort ();
 }
index 47136108a6bd6d50111b45865b4b2a3e104977bb..d5cff6fbaf4c9d5f1b33c371de6be17970641c1e 100644 (file)
@@ -11,8 +11,8 @@
 #include <limits.h>
 #include <math.h>
 
-#define SRC_SIZE ((AVX512F_LEN) / 32)
-#define DST_SIZE ((AVX512F_LEN) / 32)
+#define SIZE (AVX512F_LEN / 32)
+#include "avx512f-mask-type.h"
 
 static void
 CALC (float *s, int *r)
@@ -20,7 +20,7 @@ CALC (float *s, int *r)
   int i;
   unsigned char tmp;
 
-  for (i = 0; i < SRC_SIZE; i++)
+  for (i = 0; i < SIZE; i++)
     {
       if (s[i] > SCHAR_MAX)
        tmp = SCHAR_MAX;
@@ -38,16 +38,16 @@ TEST (void)
   UNION_TYPE (AVX512F_LEN, ) s;
   UNION_TYPE (AVX512F_LEN, i_d) res1, res2, res3;
   MASK_TYPE mask = MASK_VALUE;
-  int res_ref[DST_SIZE] = { 0 };
+  int res_ref[SIZE] = { 0 };
   int i, sign = 1;
 
-  for (i = 0; i < SRC_SIZE; i++)
+  for (i = 0; i < SIZE; i++)
     {
       s.a[i] = 1.23 * (i + 2) * sign;
       sign = -sign;
     }
 
-  for (i = 0; i < DST_SIZE; i++)
+  for (i = 0; i < SIZE; i++)
     res2.a[i] = DEFAULT_VALUE;
 
 #if AVX512F_LEN == 128
@@ -65,11 +65,11 @@ TEST (void)
   if (UNION_CHECK (AVX512F_LEN, i_d) (res1, res_ref))
     abort ();
 
-  MASK_MERGE (i_d) (res_ref, mask, SRC_SIZE);
+  MASK_MERGE (i_d) (res_ref, mask, SIZE);
   if (UNION_CHECK (AVX512F_LEN, i_d) (res2, res_ref))
     abort ();
 
-  MASK_ZERO (i_d) (res_ref, mask, SRC_SIZE);
+  MASK_ZERO (i_d) (res_ref, mask, SIZE);
   if (UNION_CHECK (AVX512F_LEN, i_d) (res3, res_ref))
     abort ();
 }
index f753dd5a70751249b018cfc5dac893d5dc2f79af..a13c7a362fe34a965781da67fcfdacd18820c71a 100644 (file)
 #include <limits.h>
 #include <math.h>
 
-#define SRC_SIZE ((AVX512F_LEN) / 32)
-#define DST_SIZE ((AVX512F_LEN) / 32)
+#define SIZE (AVX512F_LEN / 32)
+#include "avx512f-mask-type.h"
 
 static void
 CALC (float *s, int *r)
 {
   int i;
 
-  for (i = 0; i < SRC_SIZE; i++)
+  for (i = 0; i < SIZE; i++)
     {
       if (s[i] > UCHAR_MAX)
        r[i] = UCHAR_MAX;
@@ -36,16 +36,16 @@ TEST (void)
   UNION_TYPE (AVX512F_LEN, ) s;
   UNION_TYPE (AVX512F_LEN, i_d) res1, res2, res3;
   MASK_TYPE mask = MASK_VALUE;
-  int res_ref[DST_SIZE] = { 0 };
+  int res_ref[SIZE] = { 0 };
   int i, sign = 1;
 
-  for (i = 0; i < SRC_SIZE; i++)
+  for (i = 0; i < SIZE; i++)
     {
       s.a[i] = 1.23 * (i + 2) * sign;
       sign = -sign;
     }
 
-  for (i = 0; i < DST_SIZE; i++)
+  for (i = 0; i < SIZE; i++)
     res2.a[i] = DEFAULT_VALUE;
 
 #if AVX512F_LEN == 128
@@ -63,11 +63,11 @@ TEST (void)
   if (UNION_CHECK (AVX512F_LEN, i_d) (res1, res_ref))
     abort ();
 
-  MASK_MERGE (i_d) (res_ref, mask, SRC_SIZE);
+  MASK_MERGE (i_d) (res_ref, mask, SIZE);
   if (UNION_CHECK (AVX512F_LEN, i_d) (res2, res_ref))
     abort ();
 
-  MASK_ZERO (i_d) (res_ref, mask, SRC_SIZE);
+  MASK_ZERO (i_d) (res_ref, mask, SIZE);
   if (UNION_CHECK (AVX512F_LEN, i_d) (res3, res_ref))
     abort ();
 }
index ed19c5e329dbee7baceebbf9ee3ebc4f12330d2a..d298595d200af9d73e3277cdcbf61c930377f819 100644 (file)
 #include "avx10-helper.h"
 #include <limits.h>
 
-#define SRC_SIZE ((AVX512F_LEN_HALF) / 32)
-#define DST_SIZE ((AVX512F_LEN) / 64)
+#define SRC_SIZE (AVX512F_LEN_HALF / 32)
+#define SIZE (AVX512F_LEN / 64)
+#include "avx512f-mask-type.h"
 
 static void
 CALC (float *s, long long *r)
 {
   int i;
 
-  for (i = 0; i < DST_SIZE; i++)
+  for (i = 0; i < SIZE; i++)
     {
       if (s[i] > LLONG_MAX)
        r[i] = LLONG_MAX;
@@ -35,7 +36,7 @@ TEST (void)
   UNION_TYPE (AVX512F_LEN_HALF, ) s;
   UNION_TYPE (AVX512F_LEN, i_q) res1, res2, res3;
   MASK_TYPE mask = MASK_VALUE;
-  long long res_ref[DST_SIZE] = { 0 };
+  long long res_ref[SIZE] = { 0 };
   int i, sign = 1;
 
   for (i = 0; i < SRC_SIZE; i++)
@@ -44,7 +45,7 @@ TEST (void)
       sign = -sign;
     }
 
-  for (i = 0; i < DST_SIZE; i++)
+  for (i = 0; i < SIZE; i++)
     res2.a[i] = DEFAULT_VALUE;
 
 #if AVX512F_LEN == 128
@@ -63,11 +64,11 @@ TEST (void)
   if (UNION_CHECK (AVX512F_LEN, i_q) (res1, res_ref))
     abort ();
 
-  MASK_MERGE (i_q) (res_ref, mask, DST_SIZE);
+  MASK_MERGE (i_q) (res_ref, mask, SIZE);
   if (UNION_CHECK (AVX512F_LEN, i_q) (res2, res_ref))
     abort ();
 
-  MASK_ZERO (i_q) (res_ref, mask, DST_SIZE);
+  MASK_ZERO (i_q) (res_ref, mask, SIZE);
   if (UNION_CHECK (AVX512F_LEN, i_q) (res3, res_ref))
     abort ();
 }
index b279af2932684b37d20a0aa5d0e543476ca84528..af26bacd9f9ed1f827a60a4c8ce1e121d3f4a5b6 100644 (file)
 #include "avx10-helper.h"
 #include <limits.h>
 
-#define SRC_SIZE ((AVX512F_LEN) / 32)
-#define DST_SIZE ((AVX512F_LEN) / 32)
+#define SIZE (AVX512F_LEN / 32)
+#include "avx512f-mask-type.h"
 
 static void
 CALC (float *s, unsigned int *r)
 {
   int i;
 
-  for (i = 0; i < SRC_SIZE; i++)
+  for (i = 0; i < SIZE; i++)
     {
       if (s[i] > UINT_MAX)
        r[i] = UINT_MAX;
@@ -35,16 +35,16 @@ TEST (void)
   UNION_TYPE (AVX512F_LEN, ) s;
   UNION_TYPE (AVX512F_LEN, i_ud) res1, res2, res3;
   MASK_TYPE mask = MASK_VALUE;
-  unsigned int res_ref[DST_SIZE] = { 0 };
+  unsigned int res_ref[SIZE] = { 0 };
   int i, sign = 1;
 
-  for (i = 0; i < SRC_SIZE; i++)
+  for (i = 0; i < SIZE; i++)
     {
       s.a[i] = 1.23 * (i + 2) * sign;
       sign = -sign;
     }
 
-  for (i = 0; i < DST_SIZE; i++)
+  for (i = 0; i < SIZE; i++)
     res2.a[i] = DEFAULT_VALUE;
 
 #if AVX512F_LEN == 128
@@ -62,11 +62,11 @@ TEST (void)
   if (UNION_CHECK (AVX512F_LEN, i_ud) (res1, res_ref))
     abort ();
 
-  MASK_MERGE (i_ud) (res_ref, mask, SRC_SIZE);
+  MASK_MERGE (i_ud) (res_ref, mask, SIZE);
   if (UNION_CHECK (AVX512F_LEN, i_ud) (res2, res_ref))
     abort ();
 
-  MASK_ZERO (i_ud) (res_ref, mask, SRC_SIZE);
+  MASK_ZERO (i_ud) (res_ref, mask, SIZE);
   if (UNION_CHECK (AVX512F_LEN, i_ud) (res3, res_ref))
     abort ();
 }
index 7151d079b799deb5eb949b10ab138ea055d67c56..f94bcf753ef28edf59b13ee826d0aeb1a1fc0c06 100644 (file)
@@ -10,8 +10,9 @@
 #include "avx10-helper.h"
 #include <limits.h>
 
-#define SRC_SIZE ((AVX512F_LEN_HALF) / 32)
-#define DST_SIZE ((AVX512F_LEN) / 64)
+#define SRC_SIZE (AVX512F_LEN_HALF / 32)
+#define SIZE (AVX512F_LEN / 64)
+#include "avx512f-mask-type.h"
 
 static void
 CALC (float *s, unsigned long long *r)
@@ -35,7 +36,7 @@ TEST (void)
   UNION_TYPE (AVX512F_LEN_HALF, ) s;
   UNION_TYPE (AVX512F_LEN, i_uq) res1, res2, res3;
   MASK_TYPE mask = MASK_VALUE;
-  unsigned long long res_ref[DST_SIZE] = { 0 };
+  unsigned long long res_ref[SIZE] = { 0 };
   int i, sign = 1;
 
   for (i = 0; i < SRC_SIZE; i++)
@@ -44,7 +45,7 @@ TEST (void)
       sign = -sign;
     }
 
-  for (i = 0; i < DST_SIZE; i++)
+  for (i = 0; i < SIZE; i++)
     res2.a[i] = DEFAULT_VALUE;
 
 #if AVX512F_LEN == 128
index ca9082885e7a6f4b7144a30c5dc84e3b18c3714e..a0cf48a9cb6f369d56be991ce4a15960c4887ac2 100644 (file)
@@ -8,7 +8,8 @@
 #define AVX10_512BIT
 #endif
 #include "avx10-helper.h"
-#define SIZE_RES (AVX512F_LEN / 16)
+#define SIZE (AVX512F_LEN / 16)
+#include "avx512f-mask-type.h"
 
 void
 TEST (void)
@@ -16,9 +17,9 @@ TEST (void)
   int i;
   UNION_TYPE (AVX512F_LEN, bf16_uw) res1, res2, res3, src1, src2;
   MASK_TYPE mask = MASK_VALUE;
-  unsigned short res_ref[SIZE_RES], res_ref2[SIZE_RES];
+  unsigned short res_ref[SIZE], res_ref2[SIZE];
   
-  for (i = 0; i < SIZE_RES; i++)
+  for (i = 0; i < SIZE; i++)
     {
       res1.a[i] = 0;
       res2.a[i] = DEFAULT_VALUE;
@@ -39,11 +40,11 @@ TEST (void)
   if (UNION_CHECK (AVX512F_LEN, bf16_uw) (res1, res_ref))
     abort ();
   
-  MASK_MERGE (bf16_uw) (res_ref2, mask, SIZE_RES);
+  MASK_MERGE (bf16_uw) (res_ref2, mask, SIZE);
   if (UNION_CHECK (AVX512F_LEN, bf16_uw) (res2, res_ref2))
     abort ();
 
-  MASK_ZERO (bf16_uw) (res_ref2, mask, SIZE_RES);
+  MASK_ZERO (bf16_uw) (res_ref2, mask, SIZE);
   if (UNION_CHECK (AVX512F_LEN, bf16_uw) (res3, res_ref2))
     abort ();
 }
index 9b73a298fb90c4eee88c4a50619c161011e5f26b..7a298a7e47083ed30bb53bc58e73775cd6676b8e 100644 (file)
@@ -10,8 +10,9 @@
 
 #include "avx10-helper.h"
 
-#define SRC_SIZE AVX512F_LEN / 16
-#define SIZE AVX512F_LEN / 32
+#define SRC_SIZE (AVX512F_LEN / 16)
+#define SIZE (AVX512F_LEN / 32)
+#include "avx512f-mask-type.h"
 
 static void  
 CALC (float *dest, _Float16 *src1, _Float16 *src2)
index b19c9d437fb105fb21918dc6b2cd73bdf7af262e..d7a9811819771e21933ef9377788145cef49bd18 100644 (file)
@@ -8,7 +8,8 @@
 #define AVX10_512BIT
 #endif
 #include "avx10-helper.h"
-#define SIZE_RES (AVX512F_LEN / 16)
+#define SIZE (AVX512F_LEN / 16)
+#include "avx512f-mask-type.h"
 
 void
 TEST (void)
@@ -16,9 +17,9 @@ TEST (void)
   int i;
   UNION_TYPE (AVX512F_LEN, bf16_uw) res1, res2, src1, src2;
   MASK_TYPE mask = MASK_VALUE;
-  unsigned short res_ref[SIZE_RES], res_ref2[SIZE_RES];
+  unsigned short res_ref[SIZE], res_ref2[SIZE];
 
-  for (i = 0; i < SIZE_RES; i++)
+  for (i = 0; i < SIZE; i++)
     {
       float x = 0.5;
       float y = 2;
@@ -37,16 +38,16 @@ TEST (void)
       res_ref2[i] = convert_fp32_to_bf16 (m2);
     }
 
-  MASK_MERGE (bf16_uw) (res1.a, mask, SIZE_RES);
-  MASK_MERGE (bf16_uw) (res2.a, mask, SIZE_RES);
+  MASK_MERGE (bf16_uw) (res1.a, mask, SIZE);
+  MASK_MERGE (bf16_uw) (res2.a, mask, SIZE);
   res1.x = INTRINSIC (_mask_fmaddne_pbh) (res1.x, mask, src1.x, src2.x);
   res2.x = INTRINSIC (_mask3_fmaddne_pbh) (src1.x, src2.x, res2.x, mask);
   
-  MASK_MERGE (bf16_uw) (res_ref, mask, SIZE_RES);
+  MASK_MERGE (bf16_uw) (res_ref, mask, SIZE);
   if (UNION_CHECK (AVX512F_LEN, bf16_uw) (res1, res_ref))
     abort ();
   
-  MASK_MERGE (bf16_uw) (res_ref2, mask, SIZE_RES);
+  MASK_MERGE (bf16_uw) (res_ref2, mask, SIZE);
   if (UNION_CHECK (AVX512F_LEN, bf16_uw) (res2, res_ref2))
     abort ();
 }
index 86adbc5fba4e0e14e9ddad2bd09a62eafa029765..23ef38fa584f91b648adae0cb9ef12fe858028eb 100644 (file)
@@ -9,7 +9,8 @@
 #endif
 #include "avx10-helper.h"
 
-#define SIZE_RES (AVX512F_LEN / 16)
+#define SIZE (AVX512F_LEN / 16)
+#include "avx512f-mask-type.h"
 
 void
 TEST (void)
@@ -17,9 +18,9 @@ TEST (void)
   int i;
   UNION_TYPE (AVX512F_LEN, bf16_uw) res1, res2, src1, src2;
   MASK_TYPE mask = MASK_VALUE;
-  unsigned short res_ref[SIZE_RES], res_ref2[SIZE_RES];
+  unsigned short res_ref[SIZE], res_ref2[SIZE];
 
-  for (i = 0; i < SIZE_RES; i++)
+  for (i = 0; i < SIZE; i++)
     {
       float x = 0.5;
       float y = 2;
@@ -38,16 +39,16 @@ TEST (void)
       res_ref2[i] = convert_fp32_to_bf16 (m2);
     }
 
-  MASK_MERGE (bf16_uw) (res1.a, mask, SIZE_RES);
-  MASK_MERGE (bf16_uw) (res2.a, mask, SIZE_RES);
+  MASK_MERGE (bf16_uw) (res1.a, mask, SIZE);
+  MASK_MERGE (bf16_uw) (res2.a, mask, SIZE);
   res1.x = INTRINSIC (_mask_fmsubne_pbh) (res1.x, mask, src1.x, src2.x);
   res2.x = INTRINSIC (_mask3_fmsubne_pbh) (src1.x, src2.x, res2.x, mask);
   
-  MASK_MERGE (bf16_uw) (res_ref, mask, SIZE_RES);
+  MASK_MERGE (bf16_uw) (res_ref, mask, SIZE);
   if (UNION_CHECK (AVX512F_LEN, bf16_uw) (res1, res_ref))
     abort ();
   
-  MASK_MERGE (bf16_uw) (res_ref2, mask, SIZE_RES);
+  MASK_MERGE (bf16_uw) (res_ref2, mask, SIZE);
   if (UNION_CHECK (AVX512F_LEN, bf16_uw) (res2, res_ref2))
     abort ();
 }
index 3a7d4cfca48ec52fc4f632e8a961cbe2d06fb596..0bac657d190ae4c454306eeaa175c3e36a22a430 100644 (file)
@@ -9,7 +9,8 @@
 #endif
 #include "avx10-helper.h"
 
-#define SIZE_RES (AVX512F_LEN / 16)
+#define SIZE (AVX512F_LEN / 16)
+#include "avx512f-mask-type.h"
 
 void
 TEST (void)
@@ -17,9 +18,9 @@ TEST (void)
   int i;
   UNION_TYPE (AVX512F_LEN, bf16_uw) res1, res2, src1, src2;
   MASK_TYPE mask = MASK_VALUE;
-  unsigned short res_ref[SIZE_RES], res_ref2[SIZE_RES];
+  unsigned short res_ref[SIZE], res_ref2[SIZE];
 
-  for (i = 0; i < SIZE_RES; i++)
+  for (i = 0; i < SIZE; i++)
     {
       float x = 0.5;
       float y = 2;
@@ -38,16 +39,16 @@ TEST (void)
       res_ref2[i] = convert_fp32_to_bf16 (m2);
     }
 
-  MASK_MERGE (bf16_uw) (res1.a, mask, SIZE_RES);
-  MASK_MERGE (bf16_uw) (res2.a, mask, SIZE_RES);
+  MASK_MERGE (bf16_uw) (res1.a, mask, SIZE);
+  MASK_MERGE (bf16_uw) (res2.a, mask, SIZE);
   res1.x = INTRINSIC (_mask_fnmaddne_pbh) (res1.x, mask, src1.x, src2.x);
   res2.x = INTRINSIC (_mask3_fnmaddne_pbh) (src1.x, src2.x, res2.x, mask);
   
-  MASK_MERGE (bf16_uw) (res_ref, mask, SIZE_RES);
+  MASK_MERGE (bf16_uw) (res_ref, mask, SIZE);
   if (UNION_CHECK (AVX512F_LEN, bf16_uw) (res1, res_ref))
     abort ();
   
-  MASK_MERGE (bf16_uw) (res_ref2, mask, SIZE_RES);
+  MASK_MERGE (bf16_uw) (res_ref2, mask, SIZE);
   if (UNION_CHECK (AVX512F_LEN, bf16_uw) (res2, res_ref2))
     abort ();
 }
index 943146e14f26e8336c2437bdae29f85020499e38..6c5ba4b096a7d9b5438027f7a77f9489d6e3733f 100644 (file)
@@ -9,7 +9,8 @@
 #endif
 #include "avx10-helper.h"
 
-#define SIZE_RES (AVX512F_LEN / 16)
+#define SIZE (AVX512F_LEN / 16)
+#include "avx512f-mask-type.h"
 
 void
 TEST (void)
@@ -17,9 +18,9 @@ TEST (void)
   int i;
   UNION_TYPE (AVX512F_LEN, bf16_uw) res1, res2, src1, src2;
   MASK_TYPE mask = MASK_VALUE;
-  unsigned short res_ref[SIZE_RES], res_ref2[SIZE_RES];
+  unsigned short res_ref[SIZE], res_ref2[SIZE];
 
-  for (i = 0; i < SIZE_RES; i++)
+  for (i = 0; i < SIZE; i++)
     {
       float x = 0.5;
       float y = 2;
@@ -38,16 +39,16 @@ TEST (void)
       res_ref2[i] = convert_fp32_to_bf16 (m2);
     }
 
-  MASK_MERGE (bf16_uw) (res1.a, mask, SIZE_RES);
-  MASK_MERGE (bf16_uw) (res2.a, mask, SIZE_RES);
+  MASK_MERGE (bf16_uw) (res1.a, mask, SIZE);
+  MASK_MERGE (bf16_uw) (res2.a, mask, SIZE);
   res1.x = INTRINSIC (_mask_fnmsubne_pbh) (res1.x, mask, src1.x, src2.x);
   res2.x = INTRINSIC (_mask3_fnmsubne_pbh) (src1.x, src2.x, res2.x, mask);
   
-  MASK_MERGE (bf16_uw) (res_ref, mask, SIZE_RES);
+  MASK_MERGE (bf16_uw) (res_ref, mask, SIZE);
   if (UNION_CHECK (AVX512F_LEN, bf16_uw) (res1, res_ref))
     abort ();
   
-  MASK_MERGE (bf16_uw) (res_ref2, mask, SIZE_RES);
+  MASK_MERGE (bf16_uw) (res_ref2, mask, SIZE);
   if (UNION_CHECK (AVX512F_LEN, bf16_uw) (res2, res_ref2))
     abort ();
 }
index 1b25a070eff1e92eca05be8e39ba431f62709fae..c408c9cabbbc1bf5718faee935243093705ca10b 100644 (file)
@@ -8,7 +8,8 @@
 #define AVX10_512BIT
 #endif
 #include "avx10-helper.h"
-#define SIZE_RES (AVX512F_LEN / 16)
+#define SIZE (AVX512F_LEN / 16)
+#include "avx512f-mask-type.h"
 
 void
 TEST (void)
@@ -20,13 +21,13 @@ TEST (void)
   UNION_TYPE (AVX512F_LEN, ) src2;
   MASK_TYPE mask = MASK_VALUE;
 
-  for (i = 0; i < SIZE_RES / 2; i++)
+  for (i = 0; i < SIZE / 2; i++)
     {
       src1.a[i] = 0;
       src2.a[i] = (uint32_t) (src1.a[i]) << 16;
     }
 
-  for (i = SIZE_RES / 2; i < SIZE_RES; i++)
+  for (i = SIZE / 2; i < SIZE; i++)
     src1.a[i] = 0;
   
   src1.a[0] = 0x7FC0;
index def6d93ccade3dcb5c5374ee4c4736db8c29612b..4c10f1afefacd12f684c839bfd0408c3e50a03ca 100644 (file)
@@ -8,7 +8,8 @@
 #define AVX10_512BIT
 #endif
 #include "avx10-helper.h"
-#define SIZE_RES (AVX512F_LEN / 16)
+#define SIZE (AVX512F_LEN / 16)
+#include "avx512f-mask-type.h"
 
 void
 TEST (void)
@@ -16,9 +17,9 @@ TEST (void)
   int i;
   UNION_TYPE (AVX512F_LEN, bf16_uw) res1, res2, res3, src1;
   MASK_TYPE mask = MASK_VALUE;
-  unsigned short res_ref[SIZE_RES], res_ref2[SIZE_RES];
+  unsigned short res_ref[SIZE], res_ref2[SIZE];
  
-  for (i = 0; i < SIZE_RES; i++)
+  for (i = 0; i < SIZE; i++)
     {
       res1.a[i] = 0;
       res2.a[i] = DEFAULT_VALUE;
@@ -37,11 +38,11 @@ TEST (void)
   if (UNION_CHECK (AVX512F_LEN, bf16_uw) (res1, res_ref))
     abort ();
   
-  MASK_MERGE (bf16_uw) (res_ref2, mask, SIZE_RES);
+  MASK_MERGE (bf16_uw) (res_ref2, mask, SIZE);
   if (UNION_CHECK (AVX512F_LEN, bf16_uw) (res2, res_ref2))
     abort ();
 
-  MASK_ZERO (bf16_uw) (res_ref2, mask, SIZE_RES);
+  MASK_ZERO (bf16_uw) (res_ref2, mask, SIZE);
   if (UNION_CHECK (AVX512F_LEN, bf16_uw) (res3, res_ref2))
     abort ();
 }
index 898cf5ccf38fefcdd52abc771a672fab8c74261c..07eb978fc06fcf6ba73fcc11c16ca60ecf1950d8 100644 (file)
@@ -8,7 +8,8 @@
 #define AVX10_512BIT
 #endif
 #include "avx10-helper.h"
-#define SIZE_RES (AVX512F_LEN / 16)
+#define SIZE (AVX512F_LEN / 16)
+#include "avx512f-mask-type.h"
 
 void
 TEST (void)
@@ -16,9 +17,9 @@ TEST (void)
   int i;
   UNION_TYPE (AVX512F_LEN, bf16_uw) res1, res2, res3, src1;
   MASK_TYPE mask = MASK_VALUE;
-  unsigned short res_ref[SIZE_RES], res_ref2[SIZE_RES];
+  unsigned short res_ref[SIZE], res_ref2[SIZE];
   
-  for (i = 0; i < SIZE_RES; i++)
+  for (i = 0; i < SIZE; i++)
     {
       res1.a[i] = 5.0;
       res2.a[i] = DEFAULT_VALUE;
@@ -40,11 +41,11 @@ TEST (void)
   if (UNION_CHECK (AVX512F_LEN, bf16_uw) (res1, res_ref))
     abort ();
   
-  MASK_MERGE (bf16_uw) (res_ref2, mask, SIZE_RES);
+  MASK_MERGE (bf16_uw) (res_ref2, mask, SIZE);
   if (UNION_CHECK (AVX512F_LEN, bf16_uw) (res2, res_ref2))
     abort ();
 
-  MASK_ZERO (bf16_uw) (res_ref2, mask, SIZE_RES);
+  MASK_ZERO (bf16_uw) (res_ref2, mask, SIZE);
   if (UNION_CHECK (AVX512F_LEN, bf16_uw) (res3, res_ref2))
     abort ();  
 }
index a563b1e933ef5a3a96e2772ae74d3511aa597e68..126d9c00252dbbf21ef062b9b056af6e41a0f4fb 100644 (file)
@@ -8,7 +8,8 @@
 #define AVX10_512BIT
 #endif
 #include "avx10-helper.h"
-#define SIZE_RES (AVX512F_LEN / 16)
+#define SIZE (AVX512F_LEN / 16)
+#include "avx512f-mask-type.h"
 
 void
 TEST (void)
@@ -16,9 +17,9 @@ TEST (void)
   int i;
   UNION_TYPE (AVX512F_LEN, bf16_uw) res1, res2, res3, src1, src2;
   MASK_TYPE mask = MASK_VALUE;
-  unsigned short res_ref[SIZE_RES], res_ref2[SIZE_RES];
+  unsigned short res_ref[SIZE], res_ref2[SIZE];
   
-  for (i = 0; i < SIZE_RES; i++)
+  for (i = 0; i < SIZE; i++)
     {
       res1.a[i] = 0;
       res2.a[i] = DEFAULT_VALUE;
@@ -41,11 +42,11 @@ TEST (void)
   if (UNION_CHECK (AVX512F_LEN, bf16_uw) (res1, res_ref))
     abort ();
   
-  MASK_MERGE (bf16_uw) (res_ref2, mask, SIZE_RES);
+  MASK_MERGE (bf16_uw) (res_ref2, mask, SIZE);
   if (UNION_CHECK (AVX512F_LEN, bf16_uw) (res2, res_ref2))
     abort ();
 
-  MASK_ZERO (bf16_uw) (res_ref2, mask, SIZE_RES);
+  MASK_ZERO (bf16_uw) (res_ref2, mask, SIZE);
   if (UNION_CHECK (AVX512F_LEN, bf16_uw) (res3, res_ref2))
     abort ();
 }
index 491a63d1726cdb8edd5d6455fd3e4ae4dd625566..854950e53607400b70bf0300e43722191df8c10d 100644 (file)
@@ -6,10 +6,11 @@
 #define AVX10_2
 #define AVX10_512BIT
 #endif
-#define SIZE (AVX512F_LEN / 16)
 #include "avx10-helper.h"
+#define SIZE (AVX512F_LEN / 16)
 #include <stdbool.h>
 #include "avx10-minmax-helper.h"
+#include "avx512f-mask-type.h"
 
 void static
 CALC (__bf16 *r, __bf16 *s1, __bf16 *s2, int R)
index fe9bb65e6b1dbfbe4e79a027a42ee14011f540ca..934a4237228efff06f7080de848d294355f694c3 100644 (file)
@@ -6,10 +6,11 @@
 #define AVX10_2
 #define AVX10_512BIT
 #endif
-#define SIZE (AVX512F_LEN / 64)
 #include "avx10-helper.h"
+#define SIZE (AVX512F_LEN / 64)
 #include <stdbool.h>
 #include "avx10-minmax-helper.h"
+#include "avx512f-mask-type.h"
 
 void static
 CALC (double *r, double *s1, double *s2, int R)
index 503bb9f18b407b0f17f82b99614211f1f8b825b1..4c1b94dae9646bd0adf400e4f6e0dbc6bb165ed8 100644 (file)
@@ -6,10 +6,11 @@
 #define AVX10_2
 #define AVX10_512BIT
 #endif
-#define SIZE (AVX512F_LEN / 16)
 #include "avx10-helper.h"
+#define SIZE (AVX512F_LEN / 16)
 #include <stdbool.h>
 #include "avx10-minmax-helper.h"
+#include "avx512f-mask-type.h"
 
 void static
 CALC (_Float16 *r, _Float16 *s1, _Float16 *s2, int R)
index f3ef43ed6290588fad978f2a8bc602a6c378b178..20ccac184732ad571e87fd05c360b5f62f8d8a75 100644 (file)
@@ -6,10 +6,11 @@
 #define AVX10_2
 #define AVX10_512BIT
 #endif
-#define SIZE (AVX512F_LEN / 32)
 #include "avx10-helper.h"
+#define SIZE (AVX512F_LEN / 32)
 #include <stdbool.h>
 #include "avx10-minmax-helper.h"
+#include "avx512f-mask-type.h"
 
 void static
 CALC (float *r, float *s1, float *s2, int R)
index 10f13d4540370d3b070de2e258a58dafccc31489..19f1bae3b0322977a1c3e222822c18778d75aeab 100644 (file)
@@ -8,7 +8,8 @@
 #define AVX10_512BIT
 #endif
 #include "avx10-helper.h"
-#define SIZE_RES (AVX512F_LEN / 16)
+#define SIZE (AVX512F_LEN / 16)
+#include "avx512f-mask-type.h"
 
 void
 TEST (void)
@@ -16,9 +17,9 @@ TEST (void)
   int i;
   UNION_TYPE (AVX512F_LEN, bf16_uw) res1, res2, res3, src1, src2;
   MASK_TYPE mask = MASK_VALUE;
-  unsigned short res_ref[SIZE_RES], res_ref2[SIZE_RES];
+  unsigned short res_ref[SIZE], res_ref2[SIZE];
   
-  for (i = 0; i < SIZE_RES; i++)
+  for (i = 0; i < SIZE; i++)
     {
       res1.a[i] = 0;
       res2.a[i] = DEFAULT_VALUE;
@@ -41,11 +42,11 @@ TEST (void)
   if (UNION_CHECK (AVX512F_LEN, bf16_uw) (res1, res_ref))
     abort ();
   
-  MASK_MERGE (bf16_uw) (res_ref2, mask, SIZE_RES);
+  MASK_MERGE (bf16_uw) (res_ref2, mask, SIZE);
   if (UNION_CHECK (AVX512F_LEN, bf16_uw) (res2, res_ref2))
     abort ();
 
-  MASK_ZERO (bf16_uw) (res_ref2, mask, SIZE_RES);
+  MASK_ZERO (bf16_uw) (res_ref2, mask, SIZE);
   if (UNION_CHECK (AVX512F_LEN, bf16_uw) (res3, res_ref2))
     abort ();
 }
index 3cedab490fa422567c971c5a23761ee9952acc2e..e86b7900d64ce601c6f1525da87dbf10a385df21 100644 (file)
@@ -9,9 +9,9 @@
 #endif
 #include "avx10-helper.h"
 
-#define SIZE (AVX512F_LEN / 8)
-#define SIZE_RES (AVX512F_LEN / 16)
-
+#define SRC_SIZE (AVX512F_LEN / 8)
+#define SIZE (AVX512F_LEN / 16)
+#include "avx512f-mask-type.h"
 
 static void
 CALC (short* dst, char* src1, char* src2, int cont)
@@ -58,15 +58,15 @@ TEST (void)
   UNION_TYPE (AVX512F_LEN, i_b) src1;
   UNION_TYPE (AVX512F_LEN, i_b) src2;
   MASK_TYPE mask = MASK_VALUE;
-  short res_ref[SIZE_RES], res_ref2[SIZE_RES];
+  short res_ref[SIZE], res_ref2[SIZE];
 
-  for (i = 0; i < SIZE; i++)
+  for (i = 0; i < SRC_SIZE; i++)
     {
       src1.a[i] = 10 + 2 * i;
       src2.a[i] = 3 * i;
     }
 
-  for (i = 0; i < SIZE_RES; i++)
+  for (i = 0; i < SIZE; i++)
     {
       res1.a[i] = 0x7FFF;
       res2.a[i] = DEFAULT_VALUE;
@@ -83,11 +83,11 @@ TEST (void)
   if (UNION_CHECK (AVX512F_LEN, i_w) (res1, res_ref))
     abort ();
 
-  MASK_MERGE (i_w) (res_ref2, mask, SIZE_RES);
+  MASK_MERGE (i_w) (res_ref2, mask, SIZE);
   if (UNION_CHECK (AVX512F_LEN, i_w) (res2, res_ref2))
     abort ();
 
-  MASK_ZERO (i_w) (res_ref2, mask, SIZE_RES);
+  MASK_ZERO (i_w) (res_ref2, mask, SIZE);
   if (UNION_CHECK (AVX512F_LEN, i_w) (res3, res_ref2))
     abort ();
 }
index ce168070a93eee7d09a0b395c2ea1d7a82fbb195..747e1e9250037e46298998c03a2772eb277b5522 100644 (file)
@@ -8,7 +8,8 @@
 #define AVX10_512BIT
 #endif
 #include "avx10-helper.h"
-#define SIZE_RES (AVX512F_LEN / 16)
+#define SIZE (AVX512F_LEN / 16)
+#include "avx512f-mask-type.h"
 
 void
 TEST (void)
@@ -16,9 +17,9 @@ TEST (void)
   int i;
   UNION_TYPE (AVX512F_LEN, bf16_uw) res1, res2, res3, src1, src2;
   MASK_TYPE mask = MASK_VALUE;
-  unsigned short res_ref[SIZE_RES], res_ref2[SIZE_RES];
+  unsigned short res_ref[SIZE], res_ref2[SIZE];
   
-  for (i = 0; i < SIZE_RES; i++)
+  for (i = 0; i < SIZE; i++)
     {
       res1.a[i] = 0;
       res2.a[i] = DEFAULT_VALUE;
@@ -39,11 +40,11 @@ TEST (void)
   if (UNION_CHECK (AVX512F_LEN, bf16_uw) (res1, res_ref))
     abort ();
   
-  MASK_MERGE (bf16_uw) (res_ref2, mask, SIZE_RES);
+  MASK_MERGE (bf16_uw) (res_ref2, mask, SIZE);
   if (UNION_CHECK (AVX512F_LEN, bf16_uw) (res2, res_ref2))
     abort ();
 
-  MASK_ZERO (bf16_uw) (res_ref2, mask, SIZE_RES);
+  MASK_ZERO (bf16_uw) (res_ref2, mask, SIZE);
   if (UNION_CHECK (AVX512F_LEN, bf16_uw) (res3, res_ref2))
     abort ();
 }
index 969a5ff844e8c8b07fa226ee5cb48145a19294c2..add9de89351128d580696f67c50b1b43f5ed51c3 100644 (file)
 
 #include "avx10-helper.h"
 
-#define SIZE (AVX512F_LEN / 8)
-#define SIZE_RES (AVX512F_LEN / 32)
+#define SRC_SIZE (AVX512F_LEN / 8)
+#define SIZE (AVX512F_LEN / 32)
 
 static void
 CALC (int *r, int *dst, char *s1, char *s2)
 {
-  short tempres[SIZE];
-  for (int i = 0; i < SIZE; i++)
+  short tempres[SRC_SIZE];
+  for (int i = 0; i < SRC_SIZE; i++)
     tempres[i] = (short) s1[i] * (short) s2[i];
-  for (int i = 0; i < SIZE_RES; i++)
+  for (int i = 0; i < SIZE; i++)
     {
       long long test = (long long) dst[i] + tempres[i * 4] + tempres[i * 4 + 1]
                                      + tempres[i * 4 + 2] + tempres[i * 4 + 3];
@@ -35,16 +35,16 @@ TEST (void)
   UNION_TYPE (AVX512F_LEN, i_b) src1;
   UNION_TYPE (AVX512F_LEN, i_b) src2;
   MASK_TYPE mask = MASK_VALUE;
-  int res_ref[SIZE_RES], res_ref2[SIZE_RES];
+  int res_ref[SIZE], res_ref2[SIZE];
 
-  for (i = 0; i < SIZE; i++)
+  for (i = 0; i < SRC_SIZE; i++)
     {
       int sign = i % 2 ? 1 : -1;
       src1.a[i] = sign * (10 + 3 * i * i);
       src2.a[i] = sign * 10 * i * i;
     }
 
-  for (i = 0; i < SIZE_RES; i++)
+  for (i = 0; i < SIZE; i++)
     {
       res1.a[i] = 0x7FFFFFFF;
       res2.a[i] = DEFAULT_VALUE;
@@ -61,11 +61,11 @@ TEST (void)
   if (UNION_CHECK (AVX512F_LEN, i_d) (res1, res_ref))
     abort ();
 
-  MASK_MERGE (i_d) (res_ref2, mask, SIZE_RES);
+  MASK_MERGE (i_d) (res_ref2, mask, SIZE);
   if (UNION_CHECK (AVX512F_LEN, i_d) (res2, res_ref2))
     abort ();
 
-  MASK_ZERO (i_d) (res_ref2, mask, SIZE_RES);
+  MASK_ZERO (i_d) (res_ref2, mask, SIZE);
   if (UNION_CHECK (AVX512F_LEN, i_d) (res3, res_ref2))
     abort ();
 }
index 1f14700918677c0ad520b7af6d39a0dc5a721cec..b8bc0ecd17afaa3746d6d9ce8df5afab5de05ad8 100644 (file)
 
 #include "avx10-helper.h"
 
-#define SIZE (AVX512F_LEN / 8)
-#define SIZE_RES (AVX512F_LEN / 32)
+#define SRC_SIZE (AVX512F_LEN / 8)
+#define SIZE (AVX512F_LEN / 32)
+#include "avx512f-mask-type.h"
 
 static void
 CALC (int *r, int *dst, char *s1, char *s2)
 {
-  short tempres[SIZE];
-  for (int i = 0; i < SIZE; i++)
+  short tempres[SRC_SIZE];
+  for (int i = 0; i < SRC_SIZE; i++)
     tempres[i] =  (short) s1[i] * (short) s2[i];
-  for (int i = 0; i < SIZE_RES; i++)
+  for (int i = 0; i < SIZE; i++)
     {
       long long test = (long long) dst[i] + tempres[i * 4] + tempres[i * 4 + 1]
                                      + tempres[i * 4 + 2] + tempres[i * 4 + 3];
@@ -38,16 +39,16 @@ TEST (void)
   UNION_TYPE (AVX512F_LEN, i_b) src1;
   UNION_TYPE (AVX512F_LEN, i_b) src2;
   MASK_TYPE mask = MASK_VALUE;
-  int res_ref[SIZE_RES], res_ref2[SIZE_RES];
+  int res_ref[SIZE], res_ref2[SIZE];
 
-  for (i = 0; i < SIZE; i++)
+  for (i = 0; i < SRC_SIZE; i++)
     {
       int sign = i % 2 ? 1 : -1;
       src1.a[i] = sign * (10 + 3 * i * i);
       src2.a[i] = sign * 10 * i * i;
     }
 
-  for (i = 0; i < SIZE_RES; i++)
+  for (i = 0; i < SIZE; i++)
     {
       res1.a[i] = 0x7FFFFFFF;
       res2.a[i] = DEFAULT_VALUE;
@@ -64,11 +65,11 @@ TEST (void)
   if (UNION_CHECK (AVX512F_LEN, i_d) (res1, res_ref))
     abort ();
 
-  MASK_MERGE (i_d) (res_ref2, mask, SIZE_RES);
+  MASK_MERGE (i_d) (res_ref2, mask, SIZE);
   if (UNION_CHECK (AVX512F_LEN, i_d) (res2, res_ref2))
     abort ();
 
-  MASK_ZERO (i_d) (res_ref2, mask, SIZE_RES);
+  MASK_ZERO (i_d) (res_ref2, mask, SIZE);
   if (UNION_CHECK (AVX512F_LEN, i_d) (res3, res_ref2))
     abort ();
 }
index 81653b223c7a9c819250cac04240a6514c333a0d..5bb8efcbf6ea4c2fcb07e19abbd7c1ff0fd32446 100644 (file)
 
 #include "avx10-helper.h"
 
-#define SIZE (AVX512F_LEN / 8)
-#define SIZE_RES (AVX512F_LEN / 32)
+#define SRC_SIZE (AVX512F_LEN / 8)
+#define SIZE (AVX512F_LEN / 32)
+#include "avx512f-mask-type.h"
 
 static void
 CALC (int *r, int *dst, char *s1, unsigned char *s2)
 {
-  short tempres[SIZE];
-  for (int i = 0; i < SIZE; i++)
+  short tempres[SRC_SIZE];
+  for (int i = 0; i < SRC_SIZE; i++)
     tempres[i] = (short) s1[i] * (unsigned short) s2[i];
-  for (int i = 0; i < SIZE_RES; i++)
+  for (int i = 0; i < SIZE; i++)
     {
       long long test = (long long) dst[i] + tempres[i * 4] + tempres[i * 4 + 1]
                                      + tempres[i * 4 + 2] + tempres[i * 4 + 3];
@@ -35,16 +36,16 @@ TEST (void)
   UNION_TYPE (AVX512F_LEN, i_b) src1;
   UNION_TYPE (AVX512F_LEN, i_ub) src2;
   MASK_TYPE mask = MASK_VALUE;
-  int res_ref[SIZE_RES], res_ref2[SIZE_RES];
+  int res_ref[SIZE], res_ref2[SIZE];
 
-  for (i = 0; i < SIZE; i++)
+  for (i = 0; i < SRC_SIZE; i++)
     {
       int sign = i % 2 ? 1 : -1;
       src1.a[i] = sign*10*i*i;
       src2.a[i] = 10 +  3*i*i + sign;
    }
 
-  for (i = 0; i < SIZE_RES; i++)
+  for (i = 0; i < SIZE; i++)
     {
       res1.a[i] = 0x7FFFFFFF;
       res2.a[i] = DEFAULT_VALUE;
@@ -61,11 +62,11 @@ TEST (void)
   if (UNION_CHECK (AVX512F_LEN, i_d) (res1, res_ref))
     abort ();
 
-  MASK_MERGE (i_d) (res_ref2, mask, SIZE_RES);
+  MASK_MERGE (i_d) (res_ref2, mask, SIZE);
   if (UNION_CHECK (AVX512F_LEN, i_d) (res2, res_ref2))
     abort ();
 
-  MASK_ZERO (i_d) (res_ref2, mask, SIZE_RES);
+  MASK_ZERO (i_d) (res_ref2, mask, SIZE);
   if (UNION_CHECK (AVX512F_LEN, i_d) (res3, res_ref2))
     abort ();
 }
index 70a00aa76f227c3104c957df52161df07d9d067b..6bbd578d55f6a926f30c1075e0b08286324102b8 100644 (file)
 
 #include "avx10-helper.h"
 
-#define SIZE (AVX512F_LEN / 8)
-#define SIZE_RES (AVX512F_LEN / 32)
+#define SRC_SIZE (AVX512F_LEN / 8)
+#define SIZE (AVX512F_LEN / 32)
+#include "avx512f-mask-type.h"
 
 static void
 CALC (int *r, int *dst, char *s1, unsigned char *s2)
 {
-  short tempres[SIZE];
-  for (int i = 0; i < SIZE; i++)
+  short tempres[SRC_SIZE];
+  for (int i = 0; i < SRC_SIZE; i++)
     tempres[i] = (short) s1[i] * (unsigned short) s2[i];
-  for (int i = 0; i < SIZE_RES; i++)
+  for (int i = 0; i < SIZE; i++)
     {
       long long test = (long long) dst[i] + tempres[i * 4] + tempres[i * 4 + 1]
                                      + tempres[i * 4 + 2] + tempres[i * 4 + 3];
@@ -38,16 +39,16 @@ TEST (void)
   UNION_TYPE (AVX512F_LEN, i_b) src1;
   UNION_TYPE (AVX512F_LEN, i_ub) src2;
   MASK_TYPE mask = MASK_VALUE;
-  int res_ref[SIZE_RES], res_ref2[SIZE_RES];
+  int res_ref[SIZE], res_ref2[SIZE];
 
-  for (i = 0; i < SIZE; i++)
+  for (i = 0; i < SRC_SIZE; i++)
     {
       int sign = i % 2 ? 1 : -1;
       src1.a[i] = sign * 10 * i * i;
       src2.a[i] = 10 + 3 * i * i + sign;
     }
 
-  for (i = 0; i < SIZE_RES; i++)
+  for (i = 0; i < SIZE; i++)
     {
       res1.a[i] = 0x7FFFFFFF;
       res2.a[i] = DEFAULT_VALUE;
@@ -64,11 +65,11 @@ TEST (void)
   if (UNION_CHECK (AVX512F_LEN, i_d) (res1, res_ref))
     abort ();
 
-  MASK_MERGE (i_d) (res_ref2, mask, SIZE_RES);
+  MASK_MERGE (i_d) (res_ref2, mask, SIZE);
   if (UNION_CHECK (AVX512F_LEN, i_d) (res2, res_ref2))
     abort ();
 
-  MASK_ZERO (i_d) (res_ref2, mask, SIZE_RES);
+  MASK_ZERO (i_d) (res_ref2, mask, SIZE);
   if (UNION_CHECK (AVX512F_LEN, i_d) (res3, res_ref2))
     abort ();
 }
index 84ef32f1b01c14c93b44b32af1ea84c5fc19bfec..978dae8135926cd8e92aa4d2c38f4317d11d8e43 100644 (file)
 
 #include "avx10-helper.h"
 
-#define SIZE (AVX512F_LEN / 8)
-#define SIZE_RES (AVX512F_LEN / 32)
+#define SRC_SIZE (AVX512F_LEN / 8)
+#define SIZE (AVX512F_LEN / 32)
+#include "avx512f-mask-type.h"
 
 static void
 CALC (int *r, int *dst, unsigned char *s1, unsigned char *s2)
 {
-  unsigned short tempres[SIZE];
-  for (int i = 0; i < SIZE; i++)
+  unsigned short tempres[SRC_SIZE];
+  for (int i = 0; i < SRC_SIZE; i++)
     tempres[i] = (unsigned short) s1[i] * (unsigned short) s2[i];
-  for (int i = 0; i < SIZE_RES; i++)
+  for (int i = 0; i < SIZE; i++)
     {
       long long test = (long long) dst[i] + tempres[i * 4] + tempres[i * 4 + 1]
                                      + tempres[i * 4 + 2] + tempres[i * 4 + 3];
@@ -35,15 +36,15 @@ TEST (void)
   UNION_TYPE (AVX512F_LEN, i_ub) src1;
   UNION_TYPE (AVX512F_LEN, i_ub) src2;
   MASK_TYPE mask = MASK_VALUE;
-  int res_ref[SIZE_RES], res_ref2[SIZE_RES];
+  int res_ref[SIZE], res_ref2[SIZE];
 
-  for (i = 0; i < SIZE; i++)
+  for (i = 0; i < SRC_SIZE; i++)
     {
       src1.a[i] = 10 + 3 * i * i;
       src2.a[i] = 10 * i * i;
    }
 
-  for (i = 0; i < SIZE_RES; i++)
+  for (i = 0; i < SIZE; i++)
     {
       res1.a[i] = 0x7FFFFFFF;
       res2.a[i] = DEFAULT_VALUE;
@@ -60,11 +61,11 @@ TEST (void)
   if (UNION_CHECK (AVX512F_LEN, i_d) (res1, res_ref))
     abort ();
 
-  MASK_MERGE (i_d) (res_ref2, mask, SIZE_RES);
+  MASK_MERGE (i_d) (res_ref2, mask, SIZE);
   if (UNION_CHECK (AVX512F_LEN, i_d) (res2, res_ref2))
     abort ();
 
-  MASK_ZERO (i_d) (res_ref2, mask, SIZE_RES);
+  MASK_ZERO (i_d) (res_ref2, mask, SIZE);
   if (UNION_CHECK (AVX512F_LEN, i_d) (res3, res_ref2))
     abort ();
 }
index 98fe36d6b661989204efc8495896adc895aefa0a..23316945959824da9e283636cdf56644bee8bc33 100644 (file)
 
 #include "avx10-helper.h"
 
-#define SIZE (AVX512F_LEN / 8)
-#define SIZE_RES (AVX512F_LEN / 32)
+#define SRC_SIZE (AVX512F_LEN / 8)
+#define SIZE (AVX512F_LEN / 32)
+#include "avx512f-mask-type.h"
 
 static void
 CALC (int *r, int *dst, unsigned char *s1, unsigned char *s2)
 {
-  unsigned short tempres[SIZE];
-  for (int i = 0; i < SIZE; i++)
+  unsigned short tempres[SRC_SIZE];
+  for (int i = 0; i < SRC_SIZE; i++)
     tempres[i] = (unsigned short) s1[i] * (unsigned short) s2[i];
-  for (int i = 0; i < SIZE_RES; i++)
+  for (int i = 0; i < SIZE; i++)
     {
       long long test = (long long) dst[i] + tempres[i * 4] + tempres[i * 4 + 1]
                                      + tempres[i * 4 + 2] + tempres[i * 4 + 3];
@@ -38,15 +39,15 @@ TEST (void)
   UNION_TYPE (AVX512F_LEN, i_ub) src1;
   UNION_TYPE (AVX512F_LEN, i_ub) src2;
   MASK_TYPE mask = MASK_VALUE;
-  int res_ref[SIZE_RES], res_ref2[SIZE_RES];
+  int res_ref[SIZE], res_ref2[SIZE];
 
-  for (i = 0; i < SIZE; i++)
+  for (i = 0; i < SRC_SIZE; i++)
     {
       src1.a[i] = 10 + 3 * i * i;
       src2.a[i] = 10 * i * i;
     }
 
-  for (i = 0; i < SIZE_RES; i++)
+  for (i = 0; i < SIZE; i++)
     {
       res1.a[i] = 0x7FFFFFFF;
       res2.a[i] = DEFAULT_VALUE;
@@ -63,11 +64,11 @@ TEST (void)
   if (UNION_CHECK (AVX512F_LEN, i_d) (res1, res_ref))
     abort ();
 
-  MASK_MERGE (i_d) (res_ref2, mask, SIZE_RES);
+  MASK_MERGE (i_d) (res_ref2, mask, SIZE);
   if (UNION_CHECK (AVX512F_LEN, i_d) (res2, res_ref2))
     abort ();
 
-  MASK_ZERO (i_d) (res_ref2, mask, SIZE_RES);
+  MASK_ZERO (i_d) (res_ref2, mask, SIZE);
   if (UNION_CHECK (AVX512F_LEN, i_d) (res3, res_ref2))
     abort ();
 }
index 1643f6f0803401a64e16b79bc51a6f3570a59516..9fc2ea57422bd1e44fdcff47560f38f4d83f0634 100644 (file)
 
 #include "avx10-helper.h"
 
-#define SIZE (AVX512F_LEN / 16)
-#define SIZE_RES (AVX512F_LEN / 32)
-
+#define SRC_SIZE (AVX512F_LEN / 16)
+#define SIZE (AVX512F_LEN / 32)
+#include "avx512f-mask-type.h"
 
 static void
 CALC (int *r, int *dst, short *s1, unsigned short *s2)
 {
-  int tempres[SIZE];
-  for (int i = 0; i < SIZE; i++)
+  int tempres[SRC_SIZE];
+  for (int i = 0; i < SRC_SIZE; i++)
     tempres[i] = (int) s1[i] * (unsigned int) s2[i];
-  for (int i = 0; i < SIZE_RES; i++)
+  for (int i = 0; i < SIZE; i++)
     {
       long long test = (long long) dst[i] + tempres[i * 2] + tempres[i * 2 + 1];
       r[i] = test;
@@ -35,16 +35,16 @@ TEST (void)
   UNION_TYPE (AVX512F_LEN, i_w) src1;
   UNION_TYPE (AVX512F_LEN, i_uw) src2;
   MASK_TYPE mask = MASK_VALUE;
-  int res_ref[SIZE_RES], res_ref2[SIZE_RES];
+  int res_ref[SIZE], res_ref2[SIZE];
 
-  for (i = 0; i < SIZE; i++)
+  for (i = 0; i < SRC_SIZE; i++)
     {
       int sign = i % 2 ? 1 : -1;
       src1.a[i] = sign * (10 + 3 * i * i);
       src2.a[i] = sign * 10 * i * i;
     }
 
-  for (i = 0; i < SIZE_RES; i++)
+  for (i = 0; i < SIZE; i++)
     {
       res1.a[i] = 0x7FFFFFFF;
       res2.a[i] = DEFAULT_VALUE;
@@ -61,11 +61,11 @@ TEST (void)
   if (UNION_CHECK (AVX512F_LEN, i_d) (res1, res_ref))
     abort ();
 
-  MASK_MERGE (i_d) (res_ref2, mask, SIZE_RES);
+  MASK_MERGE (i_d) (res_ref2, mask, SIZE);
   if (UNION_CHECK (AVX512F_LEN, i_d) (res2, res_ref2))
     abort ();
 
-  MASK_ZERO (i_d) (res_ref2, mask, SIZE_RES);
+  MASK_ZERO (i_d) (res_ref2, mask, SIZE);
   if (UNION_CHECK (AVX512F_LEN, i_d) (res3, res_ref2))
     abort ();
 }
index 7c959119a2a9084ab473a8e0681923ee92c7e7a7..4c9e9ceb0ce858baf186a1bd6cf58bc86390b26a 100644 (file)
 
 #include "avx10-helper.h"
 
-#define SIZE (AVX512F_LEN / 16)
-#define SIZE_RES (AVX512F_LEN / 32)
-
+#define SRC_SIZE (AVX512F_LEN / 16)
+#define SIZE (AVX512F_LEN / 32)
+#include "avx512f-mask-type.h"
 
 static void
 CALC (int *r, int *dst, short *s1, unsigned short *s2)
 {
-  int tempres[SIZE];
-  for (int i = 0; i < SIZE; i++)
+  int tempres[SRC_SIZE];
+  for (int i = 0; i < SRC_SIZE; i++)
     tempres[i] = (int) s1[i] * (unsigned int) s2[i];
-  for (int i = 0; i < SIZE_RES; i++)
+  for (int i = 0; i < SIZE; i++)
     {
       long long test = (long long) dst[i] + tempres[i * 2] + tempres[i * 2 + 1];
       long long max_int = 0x7FFFFFFF;
@@ -38,16 +38,16 @@ TEST (void)
   UNION_TYPE (AVX512F_LEN, i_w) src1;
   UNION_TYPE (AVX512F_LEN, i_uw) src2;
   MASK_TYPE mask = MASK_VALUE;
-  int res_ref[SIZE_RES], res_ref2[SIZE_RES];
+  int res_ref[SIZE], res_ref2[SIZE];
 
-  for (i = 0; i < SIZE; i++)
+  for (i = 0; i < SRC_SIZE; i++)
     {
       int sign = i % 2 ? 1 : -1;
       src1.a[i] = sign * (10 + 3 * i * i);
       src2.a[i] = sign * 10 * i * i;
     }
 
-  for (i = 0; i < SIZE_RES; i++)
+  for (i = 0; i < SIZE; i++)
     {
       res1.a[i] = 0x7FFFFFFF;
       res2.a[i] = DEFAULT_VALUE;
@@ -64,11 +64,11 @@ TEST (void)
   if (UNION_CHECK (AVX512F_LEN, i_d) (res1, res_ref))
     abort ();
 
-  MASK_MERGE (i_d) (res_ref2, mask, SIZE_RES);
+  MASK_MERGE (i_d) (res_ref2, mask, SIZE);
   if (UNION_CHECK (AVX512F_LEN, i_d) (res2, res_ref2))
     abort ();
 
-  MASK_ZERO (i_d) (res_ref2, mask, SIZE_RES);
+  MASK_ZERO (i_d) (res_ref2, mask, SIZE);
   if (UNION_CHECK (AVX512F_LEN, i_d) (res3, res_ref2))
     abort ();
 }
index b780e41bfba2637822c15b3120d27133640d2b23..9b931cf3b2211a11b2eb2826d02f4ecb7ec57a76 100644 (file)
 
 #include "avx10-helper.h"
 
-#define SIZE (AVX512F_LEN / 16)
-#define SIZE_RES (AVX512F_LEN / 32)
-
+#define SRC_SIZE (AVX512F_LEN / 16)
+#define SIZE (AVX512F_LEN / 32)
+#include "avx512f-mask-type.h"
 
 static void
 CALC (int *r, int *dst, unsigned short *s1, short *s2)
 {
-  int tempres[SIZE];
-  for (int i = 0; i < SIZE; i++)
+  int tempres[SRC_SIZE];
+  for (int i = 0; i < SRC_SIZE; i++)
     tempres[i] = (unsigned int) s1[i] * (int) s2[i];
-  for (int i = 0; i < SIZE_RES; i++)
+  for (int i = 0; i < SIZE; i++)
     {
       long long test = (long long) dst[i] + tempres[i * 2] + tempres[i * 2 + 1];
       r[i] = test;
@@ -35,16 +35,16 @@ TEST (void)
   UNION_TYPE (AVX512F_LEN, i_uw) src1;
   UNION_TYPE (AVX512F_LEN, i_w) src2;
   MASK_TYPE mask = MASK_VALUE;
-  int res_ref[SIZE_RES], res_ref2[SIZE_RES];
+  int res_ref[SIZE], res_ref2[SIZE];
 
-  for (i = 0; i < SIZE; i++)
+  for (i = 0; i < SRC_SIZE; i++)
     {
       int sign = i % 2 ? 1 : -1;
       src1.a[i] = sign * 10 * i * i;
       src2.a[i] = 10 + 3 * i * i + sign;
     }
 
-  for (i = 0; i < SIZE_RES; i++)
+  for (i = 0; i < SIZE; i++)
     {
       res1.a[i] = 0x7FFFFFFF;
       res2.a[i] = DEFAULT_VALUE;
@@ -61,11 +61,11 @@ TEST (void)
   if (UNION_CHECK (AVX512F_LEN, i_d) (res1, res_ref))
     abort ();
 
-  MASK_MERGE (i_d) (res_ref2, mask, SIZE_RES);
+  MASK_MERGE (i_d) (res_ref2, mask, SIZE);
   if (UNION_CHECK (AVX512F_LEN, i_d) (res2, res_ref2))
     abort ();
 
-  MASK_ZERO (i_d) (res_ref2, mask, SIZE_RES);
+  MASK_ZERO (i_d) (res_ref2, mask, SIZE);
   if (UNION_CHECK (AVX512F_LEN, i_d) (res3, res_ref2))
     abort ();
 }
index 922d4b37ab8b9e2beecc24de8892474a2fbfe6e3..0780452eb017301d01e22f09b8f4751055e39b7f 100644 (file)
 
 #include "avx10-helper.h"
 
-#define SIZE (AVX512F_LEN / 16)
-#define SIZE_RES (AVX512F_LEN / 32)
-
+#define SRC_SIZE (AVX512F_LEN / 16)
+#define SIZE (AVX512F_LEN / 32)
+#include "avx512f-mask-type.h"
 
 static void
 CALC (int *r, int *dst, unsigned short *s1, short *s2)
 {
-  int tempres[SIZE];
-  for (int i = 0; i < SIZE; i++)
+  int tempres[SRC_SIZE];
+  for (int i = 0; i < SRC_SIZE; i++)
     tempres[i] = (unsigned int) s1[i] * (int) s2[i];
-  for (int i = 0; i < SIZE_RES; i++)
+  for (int i = 0; i < SIZE; i++)
     {
       long long test = (long long) dst[i] + tempres[i * 2] + tempres[i * 2 + 1];
       long long max_int = 0x7FFFFFFF;
@@ -38,16 +38,16 @@ TEST (void)
   UNION_TYPE (AVX512F_LEN, i_uw) src1;
   UNION_TYPE (AVX512F_LEN, i_w) src2;
   MASK_TYPE mask = MASK_VALUE;
-  int res_ref[SIZE_RES], res_ref2[SIZE_RES];
+  int res_ref[SIZE], res_ref2[SIZE];
 
-  for (i = 0; i < SIZE; i++)
+  for (i = 0; i < SRC_SIZE; i++)
     {
       int sign = i % 2 ? 1 : -1;
       src1.a[i] = sign * 10 * i * i;
       src2.a[i] = 10 + 3 * i * i + sign;
     }
 
-  for (i = 0; i < SIZE_RES; i++)
+  for (i = 0; i < SIZE; i++)
     {
       res1.a[i] = 0x7FFFFFFF;
       res2.a[i] = DEFAULT_VALUE;
@@ -64,11 +64,11 @@ TEST (void)
   if (UNION_CHECK (AVX512F_LEN, i_d) (res1, res_ref))
     abort ();
 
-  MASK_MERGE (i_d) (res_ref2, mask, SIZE_RES);
+  MASK_MERGE (i_d) (res_ref2, mask, SIZE);
   if (UNION_CHECK (AVX512F_LEN, i_d) (res2, res_ref2))
     abort ();
 
-  MASK_ZERO (i_d) (res_ref2, mask, SIZE_RES);
+  MASK_ZERO (i_d) (res_ref2, mask, SIZE);
   if (UNION_CHECK (AVX512F_LEN, i_d) (res3, res_ref2))
     abort ();
 }
index d9f5dba8dff37830141f4bf886382d5d14bcff7d..720eee023e5c4e07aa9ffd3fb47168fea8103d01 100644 (file)
 
 #include "avx10-helper.h"
 
-#define SIZE (AVX512F_LEN / 16)
-#define SIZE_RES (AVX512F_LEN / 32)
-
+#define SRC_SIZE (AVX512F_LEN / 16)
+#define SIZE (AVX512F_LEN / 32)
+#include "avx512f-mask-type.h"
 
 static void
 CALC (int *r, int *dst, unsigned short *s1, unsigned short *s2)
 {
-  unsigned int tempres[SIZE];
-  for (int i = 0; i < SIZE; i++)
+  unsigned int tempres[SRC_SIZE];
+  for (int i = 0; i < SRC_SIZE; i++)
     tempres[i] = (unsigned int) s1[i] * (unsigned int) s2[i];
-  for (int i = 0; i < SIZE_RES; i++)
+  for (int i = 0; i < SIZE; i++)
     {
       long long test = (long long) dst[i] + tempres[i * 2] + tempres[i * 2 + 1];
       r[i] = test;
@@ -35,15 +35,15 @@ TEST (void)
   UNION_TYPE (AVX512F_LEN, i_uw) src1;
   UNION_TYPE (AVX512F_LEN, i_uw) src2;
   MASK_TYPE mask = MASK_VALUE;
-  int res_ref[SIZE_RES], res_ref2[SIZE_RES];
+  int res_ref[SIZE], res_ref2[SIZE];
 
-  for (i = 0; i < SIZE; i++)
+  for (i = 0; i < SRC_SIZE; i++)
     {
       src1.a[i] = 10 + 3 * i * i;
       src2.a[i] = 10 * i * i;
     }
 
-  for (i = 0; i < SIZE_RES; i++)
+  for (i = 0; i < SIZE; i++)
     {
       res1.a[i] = 0x7FFFFFFF;
       res2.a[i] = DEFAULT_VALUE;
@@ -60,11 +60,11 @@ TEST (void)
   if (UNION_CHECK (AVX512F_LEN, i_d) (res1, res_ref))
     abort ();
 
-  MASK_MERGE (i_d) (res_ref2, mask, SIZE_RES);
+  MASK_MERGE (i_d) (res_ref2, mask, SIZE);
   if (UNION_CHECK (AVX512F_LEN, i_d) (res2, res_ref2))
     abort ();
 
-  MASK_ZERO (i_d) (res_ref2, mask, SIZE_RES);
+  MASK_ZERO (i_d) (res_ref2, mask, SIZE);
   if (UNION_CHECK (AVX512F_LEN, i_d) (res3, res_ref2))
     abort ();
 }
index da3c82bd4cc24a40612c5a96a77bafbce55d81c9..268eb914aa446242d80b6c24ca15f6ee79860925 100644 (file)
 
 #include "avx10-helper.h"
 
-#define SIZE (AVX512F_LEN / 16)
-#define SIZE_RES (AVX512F_LEN / 32)
-
+#define SRC_SIZE (AVX512F_LEN / 16)
+#define SIZE (AVX512F_LEN / 32)
+#include "avx512f-mask-type.h"
 
 static void
 CALC (int *r, int *dst, unsigned short *s1, unsigned short *s2)
 {
-  unsigned int tempres[SIZE];
-  for (int i = 0; i < SIZE; i++)
+  unsigned int tempres[SRC_SIZE];
+  for (int i = 0; i < SRC_SIZE; i++)
     tempres[i] = (unsigned int) s1[i] * (unsigned int) s2[i];
-  for (int i = 0; i < SIZE_RES; i++)
+  for (int i = 0; i < SIZE; i++)
     {
       long long test = (long long) dst[i] + tempres[i * 2] + tempres[i * 2 + 1];
       long long max_uint = 0xFFFFFFFF;
@@ -38,15 +38,15 @@ TEST (void)
   UNION_TYPE (AVX512F_LEN, i_uw) src1;
   UNION_TYPE (AVX512F_LEN, i_uw) src2;
   MASK_TYPE mask = MASK_VALUE;
-  int res_ref[SIZE_RES], res_ref2[SIZE_RES];
+  int res_ref[SIZE], res_ref2[SIZE];
 
-  for (i = 0; i < SIZE; i++)
+  for (i = 0; i < SRC_SIZE; i++)
     {
       src1.a[i] = 10 + 3 * i * i;
       src2.a[i] = 10 * i * i;
     }
 
-  for (i = 0; i < SIZE_RES; i++)
+  for (i = 0; i < SIZE; i++)
     {
       res1.a[i] = 0x7FFFFFFF;
       res2.a[i] = DEFAULT_VALUE;
@@ -63,11 +63,11 @@ TEST (void)
   if (UNION_CHECK (AVX512F_LEN, i_d) (res1, res_ref))
     abort ();
 
-  MASK_MERGE (i_d) (res_ref2, mask, SIZE_RES);
+  MASK_MERGE (i_d) (res_ref2, mask, SIZE);
   if (UNION_CHECK (AVX512F_LEN, i_d) (res2, res_ref2))
     abort ();
 
-  MASK_ZERO (i_d) (res_ref2, mask, SIZE_RES);
+  MASK_ZERO (i_d) (res_ref2, mask, SIZE);
   if (UNION_CHECK (AVX512F_LEN, i_d) (res3, res_ref2))
     abort ();
 }
index 0bca27d504fdf9d15f14a74cd90084bc5d187ed0..6016491bd552b8faae663d373cba41e855b488ac 100644 (file)
@@ -8,7 +8,8 @@
 #define AVX10_512BIT
 #endif
 #include "avx10-helper.h"
-#define SIZE_RES (AVX512F_LEN / 16)
+#define SIZE (AVX512F_LEN / 16)
+#include "avx512f-mask-type.h"
 
 void
 TEST (void)
@@ -16,9 +17,9 @@ TEST (void)
   int i;
   UNION_TYPE (AVX512F_LEN, bf16_uw) res1, res2, res3, src1;
   MASK_TYPE mask = MASK_VALUE;
-  unsigned short res_ref[SIZE_RES], res_ref2[SIZE_RES];
+  unsigned short res_ref[SIZE], res_ref2[SIZE];
   
-  for (i = 0; i < SIZE_RES; i++)
+  for (i = 0; i < SIZE; i++)
     {
       res1.a[i] = 0;
       res2.a[i] = DEFAULT_VALUE;
@@ -35,11 +36,11 @@ TEST (void)
   if (UNION_CHECK (AVX512F_LEN, bf16_uw) (res1, res_ref))
     abort ();
   
-  MASK_MERGE (bf16_uw) (res_ref2, mask, SIZE_RES);
+  MASK_MERGE (bf16_uw) (res_ref2, mask, SIZE);
   if (UNION_CHECK (AVX512F_LEN, bf16_uw) (res2, res_ref2))
     abort ();
 
-  MASK_ZERO (bf16_uw) (res_ref2, mask, SIZE_RES);
+  MASK_ZERO (bf16_uw) (res_ref2, mask, SIZE);
   if (UNION_CHECK (AVX512F_LEN, bf16_uw) (res3, res_ref2))
     abort ();
 }
index c3e2b36864ebd18b7cc37b145784840943bc261d..5af09e900d77e8b9368038bab35d51b880af4527 100644 (file)
@@ -8,7 +8,8 @@
 #define AVX10_512BIT
 #endif
 #include "avx10-helper.h"
-#define SIZE_RES (AVX512F_LEN / 16)
+#define SIZE (AVX512F_LEN / 16)
+#include "avx512f-mask-type.h"
 
 void
 TEST (void)
@@ -16,14 +17,14 @@ TEST (void)
   int i;
   UNION_TYPE (AVX512F_LEN, bf16_uw) res1, res2, res3, src1;
   MASK_TYPE mask = MASK_VALUE;
-  unsigned short res_ref[SIZE_RES], res_ref2[SIZE_RES];
+  unsigned short res_ref[SIZE], res_ref2[SIZE];
 
-  for (i = 0; i < SIZE_RES; i++)
+  for (i = 0; i < SIZE; i++)
     {
       res1.a[i] = 5.0;
       res2.a[i] = DEFAULT_VALUE;
       res3.a[i] = DEFAULT_VALUE;
-      float s = (float) (SIZE_RES - 1) / (float) i;
+      float s = (float) (SIZE - 1) / (float) i;
       src1.a[i] = convert_fp32_to_bf16 (s);
       float x = convert_bf16_to_fp32 (src1.a[i]);
       __m128 px = _mm_load_ss (&x);
@@ -40,11 +41,11 @@ TEST (void)
   if (UNION_CHECK (AVX512F_LEN, bf16_uw) (res1, res_ref))
     abort ();
   
-  MASK_MERGE (bf16_uw) (res_ref2, mask, SIZE_RES);
+  MASK_MERGE (bf16_uw) (res_ref2, mask, SIZE);
   if (UNION_CHECK (AVX512F_LEN, bf16_uw) (res2, res_ref2))
     abort ();
 
-  MASK_ZERO (bf16_uw) (res_ref2, mask, SIZE_RES);
+  MASK_ZERO (bf16_uw) (res_ref2, mask, SIZE);
   if (UNION_CHECK (AVX512F_LEN, bf16_uw) (res3, res_ref2))
     abort ();  
 }
index 5b0e6a891202f3a9a4d5476269c7fdb59d7a3d92..35b8233a2afffda86224b6ea14d6ad76f8688575 100644 (file)
@@ -8,7 +8,8 @@
 #define AVX10_512BIT
 #endif
 #include "avx10-helper.h"
-#define SIZE_RES (AVX512F_LEN / 16)
+#define SIZE (AVX512F_LEN / 16)
+#include "avx512f-mask-type.h"
 
 void
 TEST (void)
@@ -16,14 +17,14 @@ TEST (void)
   int i;
   UNION_TYPE (AVX512F_LEN, bf16_uw) res1, res2, res3, src1;
   MASK_TYPE mask = MASK_VALUE;
-  unsigned short res_ref[SIZE_RES], res_ref2[SIZE_RES];
+  unsigned short res_ref[SIZE], res_ref2[SIZE];
 
-  for (i = 0; i < SIZE_RES; i++)
+  for (i = 0; i < SIZE; i++)
     {
       res1.a[i] = 5.0;
       res2.a[i] = DEFAULT_VALUE;
       res3.a[i] = DEFAULT_VALUE;
-      float s = (float) (SIZE_RES - 1) / (float) i;
+      float s = (float) (SIZE - 1) / (float) i;
       src1.a[i] = convert_fp32_to_bf16 (s);
       float x = convert_bf16_to_fp32 (src1.a[i]);
       res_ref[i] = res_ref2[i] =  convert_fp32_to_bf16_ne (rndscale (x));
@@ -36,11 +37,11 @@ TEST (void)
   if (UNION_CHECK (AVX512F_LEN, bf16_uw) (res1, res_ref))
     abort ();
   
-  MASK_MERGE (bf16_uw) (res_ref2, mask, SIZE_RES);
+  MASK_MERGE (bf16_uw) (res_ref2, mask, SIZE);
   if (UNION_CHECK (AVX512F_LEN, bf16_uw) (res2, res_ref2))
     abort ();
 
-  MASK_ZERO (bf16_uw) (res_ref2, mask, SIZE_RES);
+  MASK_ZERO (bf16_uw) (res_ref2, mask, SIZE);
   if (UNION_CHECK (AVX512F_LEN, bf16_uw) (res3, res_ref2))
     abort ();
 }
index a879efce3f8648204ae8ca411d2061cbec6e319a..a3c6c5add6578febeec7b04561804a400ce09034 100644 (file)
@@ -9,7 +9,8 @@
 #endif
 #include "avx10-helper.h"
 #include <math.h>
-#define SIZE_RES (AVX512F_LEN / 16)
+#define SIZE (AVX512F_LEN / 16)
+#include "avx512f-mask-type.h"
 
 void
 TEST (void)
@@ -17,9 +18,9 @@ TEST (void)
   int i;
   UNION_TYPE (AVX512F_LEN, bf16_uw) res1, res2, res3, src1;
   MASK_TYPE mask = MASK_VALUE;
-  unsigned short res_ref[SIZE_RES], res_ref2[SIZE_RES];
+  unsigned short res_ref[SIZE], res_ref2[SIZE];
 
-  for (i = 0; i < SIZE_RES; i++)
+  for (i = 0; i < SIZE; i++)
     {
       res1.a[i] = 0;
       res2.a[i] = DEFAULT_VALUE;
@@ -37,11 +38,11 @@ TEST (void)
   if (UNION_CHECK (AVX512F_LEN, bf16_uw) (res1, res_ref))
     abort ();
   
-  MASK_MERGE (bf16_uw) (res_ref2, mask, SIZE_RES);
+  MASK_MERGE (bf16_uw) (res_ref2, mask, SIZE);
   if (UNION_CHECK (AVX512F_LEN, bf16_uw) (res2, res_ref2))
     abort ();
 
-  MASK_ZERO (bf16_uw) (res_ref2, mask, SIZE_RES);
+  MASK_ZERO (bf16_uw) (res_ref2, mask, SIZE);
   if (UNION_CHECK (AVX512F_LEN, bf16_uw) (res3, res_ref2))
     abort ();
 }
index 78df474240df24d118f526e80a6120786e7aa127..d12be1b92b8406243ff8e9741413fe19ea7cdca9 100644 (file)
@@ -8,7 +8,8 @@
 #define AVX10_512BIT
 #endif
 #include "avx10-helper.h"
-#define SIZE_RES (AVX512F_LEN / 16)
+#define SIZE (AVX512F_LEN / 16)
+#include "avx512f-mask-type.h"
 
 void
 TEST (void)
@@ -16,15 +17,15 @@ TEST (void)
   int i;
   UNION_TYPE (AVX512F_LEN, bf16_uw) res1, res2, res3, src1, src2;
   MASK_TYPE mask = MASK_VALUE;
-  unsigned short res_ref[SIZE_RES], res_ref2[SIZE_RES];
+  unsigned short res_ref[SIZE], res_ref2[SIZE];
   
-  for (i = 0; i < SIZE_RES; i++)
+  for (i = 0; i < SIZE; i++)
     {
       res1.a[i] = 0;
       res2.a[i] = DEFAULT_VALUE;
       res3.a[i] = DEFAULT_VALUE;
       float x = (float) (2 * (i % 7) + 7);
-      float y = 1.0 + (float) (4 * i) / (float) SIZE_RES;
+      float y = 1.0 + (float) (4 * i) / (float) SIZE;
       float xx, yy, res;
       src2.a[i] = convert_fp32_to_bf16 (y);
       src1.a[i] = convert_fp32_to_bf16 (x);
@@ -41,11 +42,11 @@ TEST (void)
   if (UNION_CHECK (AVX512F_LEN, bf16_uw) (res1, res_ref))
     abort ();
   
-  MASK_MERGE (bf16_uw) (res_ref2, mask, SIZE_RES);
+  MASK_MERGE (bf16_uw) (res_ref2, mask, SIZE);
   if (UNION_CHECK (AVX512F_LEN, bf16_uw) (res2, res_ref2))
     abort ();
 
-  MASK_ZERO (bf16_uw) (res_ref2, mask, SIZE_RES);
+  MASK_ZERO (bf16_uw) (res_ref2, mask, SIZE);
   if (UNION_CHECK (AVX512F_LEN, bf16_uw) (res3, res_ref2))
     abort ();
 }
index 987c9b1abe9b01e038820e2c29f2330fb13c68bf..faf06e691c79f625b3df0a47d077dcefc7da0c4f 100644 (file)
@@ -9,7 +9,8 @@
 #endif
 #include "avx10-helper.h"
 #include <math.h>
-#define SIZE_RES (AVX512F_LEN / 16)
+#define SIZE (AVX512F_LEN / 16)
+#include "avx512f-mask-type.h"
 
 void
 TEST (void)
@@ -17,9 +18,9 @@ TEST (void)
   int i;
   UNION_TYPE (AVX512F_LEN, bf16_uw) res1, res2, res3, src1;
   MASK_TYPE mask = MASK_VALUE;
-  unsigned short res_ref[SIZE_RES], res_ref2[SIZE_RES];
+  unsigned short res_ref[SIZE], res_ref2[SIZE];
 
-  for (i = 0; i < SIZE_RES; i++)
+  for (i = 0; i < SIZE; i++)
     {
       res1.a[i] = 0;
       res2.a[i] = DEFAULT_VALUE;
@@ -37,11 +38,11 @@ TEST (void)
   if (UNION_CHECK (AVX512F_LEN, bf16_uw) (res1, res_ref))
     abort ();
   
-  MASK_MERGE (bf16_uw) (res_ref2, mask, SIZE_RES);
+  MASK_MERGE (bf16_uw) (res_ref2, mask, SIZE);
   if (UNION_CHECK (AVX512F_LEN, bf16_uw) (res2, res_ref2))
     abort ();
 
-  MASK_ZERO (bf16_uw) (res_ref2, mask, SIZE_RES);
+  MASK_ZERO (bf16_uw) (res_ref2, mask, SIZE);
   if (UNION_CHECK (AVX512F_LEN, bf16_uw) (res3, res_ref2))
     abort ();
 }
index f8a9a51cd37f03949c26c6fda2eca3f579f6c24c..cdd22d2aca0dffd0908cce0300ee1b49ac3e93d5 100644 (file)
@@ -8,7 +8,8 @@
 #define AVX10_512BIT
 #endif
 #include "avx10-helper.h"
-#define SIZE_RES (AVX512F_LEN / 16)
+#define SIZE (AVX512F_LEN / 16)
+#include "avx512f-mask-type.h"
 
 void
 TEST (void)
@@ -16,9 +17,9 @@ TEST (void)
   int i;
   UNION_TYPE (AVX512F_LEN, bf16_uw) res1, res2, res3, src1, src2;
   MASK_TYPE mask = MASK_VALUE;
-  unsigned short res_ref[SIZE_RES], res_ref2[SIZE_RES];
+  unsigned short res_ref[SIZE], res_ref2[SIZE];
   
-  for (i = 0; i < SIZE_RES; i++)
+  for (i = 0; i < SIZE; i++)
     {
       res1.a[i] = 0;
       res2.a[i] = DEFAULT_VALUE;
@@ -39,11 +40,11 @@ TEST (void)
   if (UNION_CHECK (AVX512F_LEN, bf16_uw) (res1, res_ref))
     abort ();
   
-  MASK_MERGE (bf16_uw) (res_ref2, mask, SIZE_RES);
+  MASK_MERGE (bf16_uw) (res_ref2, mask, SIZE);
   if (UNION_CHECK (AVX512F_LEN, bf16_uw) (res2, res_ref2))
     abort ();
 
-  MASK_ZERO (bf16_uw) (res_ref2, mask, SIZE_RES);
+  MASK_ZERO (bf16_uw) (res_ref2, mask, SIZE);
   if (UNION_CHECK (AVX512F_LEN, bf16_uw) (res3, res_ref2))
     abort ();
 }
index 9ffb5606b814374513964894e34c8ea8daa1ebc2..844bc5c006e0595755aa149a8d6b4f64817460c2 100644 (file)
@@ -8,8 +8,8 @@
 #include <math.h>
 #include <limits.h>
 #include <float.h>
-#include "avx512f-mask-type.h"
 #define SIZE (AVX512F_LEN / 16)
+#include "avx512f-mask-type.h"
 
 #ifndef __FPCLASSPH__
 #define __FPCLASSPH__