]> git.ipfire.org Git - thirdparty/gcc.git/commitdiff
i386: Fix AVX10.2 SAT CVT testcases.
authorHu, Lin1 <lin1.hu@intel.com>
Thu, 20 Mar 2025 03:55:49 +0000 (11:55 +0800)
committerHu, Lin1 <lin1.hu@intel.com>
Thu, 20 Mar 2025 08:27:14 +0000 (16:27 +0800)
Init res_ref2 for rounding control intrinsics.

gcc/testsuite/ChangeLog:

* gcc.target/i386/avx10_2-512-vcvtph2ibs-2.c: Fix testcase.
* gcc.target/i386/avx10_2-512-vcvtph2iubs-2.c: Ditto.
* gcc.target/i386/avx10_2-512-vcvtps2ibs-2.c: Ditto.
* gcc.target/i386/avx10_2-512-vcvtps2iubs-2.c: Ditto.
* gcc.target/i386/avx10_2-512-vcvttpd2dqs-2.c: Ditto.
* gcc.target/i386/avx10_2-512-vcvttpd2qqs-2.c: Ditto.
* gcc.target/i386/avx10_2-512-vcvttpd2udqs-2.c: Ditto.
* gcc.target/i386/avx10_2-512-vcvttpd2uqqs-2.c: Ditto.
* gcc.target/i386/avx10_2-512-vcvttph2ibs-2.c: Ditto.
* gcc.target/i386/avx10_2-512-vcvttps2dqs-2.c: Ditto.
* gcc.target/i386/avx10_2-512-vcvttps2ibs-2.c: Ditto.
* gcc.target/i386/avx10_2-512-vcvttps2iubs-2.c: Ditto.
* gcc.target/i386/avx10_2-512-vcvttps2qqs-2.c: Ditto.
* gcc.target/i386/avx10_2-512-vcvttps2udqs-2.c: Ditto.
* gcc.target/i386/avx10_2-512-vcvttps2uqqs-2.c: Ditto.

15 files changed:
gcc/testsuite/gcc.target/i386/avx10_2-512-vcvtph2ibs-2.c
gcc/testsuite/gcc.target/i386/avx10_2-512-vcvtph2iubs-2.c
gcc/testsuite/gcc.target/i386/avx10_2-512-vcvtps2ibs-2.c
gcc/testsuite/gcc.target/i386/avx10_2-512-vcvtps2iubs-2.c
gcc/testsuite/gcc.target/i386/avx10_2-512-vcvttpd2dqs-2.c
gcc/testsuite/gcc.target/i386/avx10_2-512-vcvttpd2qqs-2.c
gcc/testsuite/gcc.target/i386/avx10_2-512-vcvttpd2udqs-2.c
gcc/testsuite/gcc.target/i386/avx10_2-512-vcvttpd2uqqs-2.c
gcc/testsuite/gcc.target/i386/avx10_2-512-vcvttph2ibs-2.c
gcc/testsuite/gcc.target/i386/avx10_2-512-vcvttps2dqs-2.c
gcc/testsuite/gcc.target/i386/avx10_2-512-vcvttps2ibs-2.c
gcc/testsuite/gcc.target/i386/avx10_2-512-vcvttps2iubs-2.c
gcc/testsuite/gcc.target/i386/avx10_2-512-vcvttps2qqs-2.c
gcc/testsuite/gcc.target/i386/avx10_2-512-vcvttps2udqs-2.c
gcc/testsuite/gcc.target/i386/avx10_2-512-vcvttps2uqqs-2.c

index 0c860b02046f584f47467b41b78e3954622c7c93..523b3f0a4cb663da0f0ea8e712d3b3ff277bf8bb 100644 (file)
@@ -9,6 +9,7 @@
 #endif
 #include "avx10-helper.h"
 #include <limits.h>
+#include <string.h>
 
 #define SIZE (AVX512F_LEN / 16)
 #include "avx512f-mask-type.h"
@@ -37,7 +38,7 @@ TEST (void)
   UNION_TYPE (AVX512F_LEN, h) s;
   UNION_TYPE (AVX512F_LEN, i_w) res1, res2, res3;
   MASK_TYPE mask = MASK_VALUE;
-  short res_ref[SIZE] = { 0 };
+  short res_ref[SIZE] = { 0 }, res_ref2[SIZE] = { 0 };
   int i, sign = 1;
 
   for (i = 0; i < SIZE; i++)
@@ -54,6 +55,7 @@ TEST (void)
   res3.x = INTRINSIC (_maskz_ipcvts_ph_epi8) (mask, s.x);
 
   CALC (s.a, res_ref);
+  memcpy(res_ref2, res_ref, sizeof(res_ref));
 
   if (UNION_CHECK (AVX512F_LEN, i_w) (res1, res_ref))
     abort ();
@@ -67,19 +69,22 @@ TEST (void)
     abort ();
 
 #if AVX512F_LEN != 128
+  for (i = 0; i < SIZE; i++)
+    res2.a[i] = DEFAULT_VALUE;
+
   res1.x = INTRINSIC (_ipcvts_roundph_epi8) (s.x, 8);
   res2.x = INTRINSIC (_mask_ipcvts_roundph_epi8) (res2.x, mask, s.x, 8);
   res3.x = INTRINSIC (_maskz_ipcvts_roundph_epi8) (mask, s.x, 8);
 
-  if (UNION_CHECK (AVX512F_LEN, i_w) (res1, res_ref))
+  if (UNION_CHECK (AVX512F_LEN, i_w) (res1, res_ref2))
     abort ();
 
-  MASK_MERGE (i_w) (res_ref, mask, SIZE);
-  if (UNION_CHECK (AVX512F_LEN, i_w) (res2, res_ref))
+  MASK_MERGE (i_w) (res_ref2, mask, SIZE);
+  if (UNION_CHECK (AVX512F_LEN, i_w) (res2, res_ref2))
     abort ();
 
-  MASK_ZERO (i_w) (res_ref, mask, SIZE);
-  if (UNION_CHECK (AVX512F_LEN, i_w) (res3, res_ref))
+  MASK_ZERO (i_w) (res_ref2, mask, SIZE);
+  if (UNION_CHECK (AVX512F_LEN, i_w) (res3, res_ref2))
     abort ();
 #endif
 }
index 75e4e1141be8cbf605bc5dfd9a05f9fd8aaecd17..a8f6e57d46ab682a0c0d6f35255a670675991c98 100644 (file)
@@ -9,6 +9,7 @@
 #endif
 #include "avx10-helper.h"
 #include <limits.h>
+#include <string.h>
 
 #define SIZE (AVX512F_LEN / 16)
 #include "avx512f-mask-type.h"
@@ -37,7 +38,7 @@ TEST (void)
   UNION_TYPE (AVX512F_LEN, h) s;
   UNION_TYPE (AVX512F_LEN, i_w) res1, res2, res3;
   MASK_TYPE mask = MASK_VALUE;
-  short res_ref[SIZE] = { 0 };
+  short res_ref[SIZE] = { 0 }, res_ref2[SIZE] = { 0 };
   int i, sign = 1;
 
   for (i = 0; i < SIZE; i++)
@@ -54,6 +55,7 @@ TEST (void)
   res3.x = INTRINSIC (_maskz_ipcvts_ph_epu8) (mask, s.x);
 
   CALC (s.a, res_ref);
+  memcpy(res_ref2, res_ref, sizeof(res_ref));
 
   if (UNION_CHECK (AVX512F_LEN, i_w) (res1, res_ref))
     abort ();
@@ -67,19 +69,22 @@ TEST (void)
     abort ();
 
 #if AVX512F_LEN != 128
+  for (i = 0; i < SIZE; i++)
+    res2.a[i] = DEFAULT_VALUE;
+
   res1.x = INTRINSIC (_ipcvts_roundph_epu8) (s.x, 8);
   res2.x = INTRINSIC (_mask_ipcvts_roundph_epu8) (res2.x, mask, s.x, 8);
   res3.x = INTRINSIC (_maskz_ipcvts_roundph_epu8) (mask, s.x, 8);
 
-  if (UNION_CHECK (AVX512F_LEN, i_w) (res1, res_ref))
+  if (UNION_CHECK (AVX512F_LEN, i_w) (res1, res_ref2))
     abort ();
 
-  MASK_MERGE (i_w) (res_ref, mask, SIZE);
-  if (UNION_CHECK (AVX512F_LEN, i_w) (res2, res_ref))
+  MASK_MERGE (i_w) (res_ref2, mask, SIZE);
+  if (UNION_CHECK (AVX512F_LEN, i_w) (res2, res_ref2))
     abort ();
 
-  MASK_ZERO (i_w) (res_ref, mask, SIZE);
-  if (UNION_CHECK (AVX512F_LEN, i_w) (res3, res_ref))
+  MASK_ZERO (i_w) (res_ref2, mask, SIZE);
+  if (UNION_CHECK (AVX512F_LEN, i_w) (res3, res_ref2))
     abort ();
 #endif
 }
index 44a0e2ce58c388a10ceea800477f6a11f6c0b175..369cb64b3d53335bbd61f99fe9467e41ffd6803c 100644 (file)
@@ -10,6 +10,7 @@
 #include "avx10-helper.h"
 #include <limits.h>
 #include <math.h>
+#include <string.h>
 
 #define SIZE (AVX512F_LEN / 32)
 #include "avx512f-mask-type.h"
@@ -38,7 +39,7 @@ TEST (void)
   UNION_TYPE (AVX512F_LEN, ) s;
   UNION_TYPE (AVX512F_LEN, i_d) res1, res2, res3;
   MASK_TYPE mask = MASK_VALUE;
-  int res_ref[SIZE] = { 0 };
+  int res_ref[SIZE] = { 0 }, res_ref2[SIZE] = { 0 };
   int i, sign = 1;
 
   for (i = 0; i < SIZE; i++)
@@ -55,6 +56,7 @@ TEST (void)
   res3.x = INTRINSIC (_maskz_ipcvts_ps_epi8) (mask, s.x);
 
   CALC (s.a, res_ref);
+  memcpy(res_ref2, res_ref, sizeof(res_ref));
 
   if (UNION_CHECK (AVX512F_LEN, i_d) (res1, res_ref))
     abort ();
@@ -68,19 +70,22 @@ TEST (void)
     abort ();
 
 #if AVX512F_LEN != 128
+  for (i = 0; i < SIZE; i++)
+    res2.a[i] = DEFAULT_VALUE;
+
   res1.x = INTRINSIC (_ipcvts_roundps_epi8) (s.x, 8);
   res2.x = INTRINSIC (_mask_ipcvts_roundps_epi8) (res2.x, mask, s.x, 8);
   res3.x = INTRINSIC (_maskz_ipcvts_roundps_epi8) (mask, s.x, 8);
 
-  if (UNION_CHECK (AVX512F_LEN, i_d) (res1, res_ref))
+  if (UNION_CHECK (AVX512F_LEN, i_d) (res1, res_ref2))
     abort ();
 
-  MASK_MERGE (i_d) (res_ref, mask, SIZE);
-  if (UNION_CHECK (AVX512F_LEN, i_d) (res2, res_ref))
+  MASK_MERGE (i_d) (res_ref2, mask, SIZE);
+  if (UNION_CHECK (AVX512F_LEN, i_d) (res2, res_ref2))
     abort ();
 
-  MASK_ZERO (i_d) (res_ref, mask, SIZE);
-  if (UNION_CHECK (AVX512F_LEN, i_d) (res3, res_ref))
+  MASK_ZERO (i_d) (res_ref2, mask, SIZE);
+  if (UNION_CHECK (AVX512F_LEN, i_d) (res3, res_ref2))
     abort ();
 #endif
 }
index 709734e1eebb686160272b84661270d64cb49f2b..f79264ec798934ee008f44b560b93234382c9632 100644 (file)
@@ -10,6 +10,7 @@
 #include "avx10-helper.h"
 #include <limits.h>
 #include <math.h>
+#include <string.h>
 
 #define SIZE (AVX512F_LEN / 32)
 #include "avx512f-mask-type.h"
@@ -36,7 +37,7 @@ TEST (void)
   UNION_TYPE (AVX512F_LEN, ) s;
   UNION_TYPE (AVX512F_LEN, i_d) res1, res2, res3;
   MASK_TYPE mask = MASK_VALUE;
-  int res_ref[SIZE] = { 0 };
+  int res_ref[SIZE] = { 0 }, res_ref2[SIZE] = { 0 };
   int i, sign = 1;
 
   for (i = 0; i < SIZE; i++)
@@ -53,6 +54,7 @@ TEST (void)
   res3.x = INTRINSIC (_maskz_ipcvts_ps_epu8) (mask, s.x);
 
   CALC (s.a, res_ref);
+  memcpy(res_ref2, res_ref, sizeof(res_ref));
 
   if (UNION_CHECK (AVX512F_LEN, i_d) (res1, res_ref))
     abort ();
@@ -66,19 +68,22 @@ TEST (void)
     abort ();
 
 #if AVX512F_LEN != 128
+  for (i = 0; i < SIZE; i++)
+    res2.a[i] = DEFAULT_VALUE;
+
   res1.x = INTRINSIC (_ipcvts_roundps_epu8) (s.x, 8);
   res2.x = INTRINSIC (_mask_ipcvts_roundps_epu8) (res2.x, mask, s.x, 8);
   res3.x = INTRINSIC (_maskz_ipcvts_roundps_epu8) (mask, s.x, 8);
 
-  if (UNION_CHECK (AVX512F_LEN, i_d) (res1, res_ref))
+  if (UNION_CHECK (AVX512F_LEN, i_d) (res1, res_ref2))
     abort ();
 
-  MASK_MERGE (i_d) (res_ref, mask, SIZE);
-  if (UNION_CHECK (AVX512F_LEN, i_d) (res2, res_ref))
+  MASK_MERGE (i_d) (res_ref2, mask, SIZE);
+  if (UNION_CHECK (AVX512F_LEN, i_d) (res2, res_ref2))
     abort ();
 
-  MASK_ZERO (i_d) (res_ref, mask, SIZE);
-  if (UNION_CHECK (AVX512F_LEN, i_d) (res3, res_ref))
+  MASK_ZERO (i_d) (res_ref2, mask, SIZE);
+  if (UNION_CHECK (AVX512F_LEN, i_d) (res3, res_ref2))
     abort ();
 #endif
 }
index 0b12aed2b278d1cdf168911fc73b35492e17ac23..72937729d6d25647e2d283864a7edf7ff3315f92 100644 (file)
@@ -9,6 +9,7 @@
 #endif
 #include "avx10-helper.h"
 #include <limits.h>
+#include <string.h>
 
 #define SRC_SIZE (AVX512F_LEN / 64)
 #define SIZE (AVX512F_LEN_HALF / 32)
@@ -36,7 +37,7 @@ TEST (void)
   UNION_TYPE (AVX512F_LEN, d) s;
   UNION_TYPE (AVX512F_LEN_HALF, i_d) res1, res2, res3;
   MASK_TYPE mask = MASK_VALUE;
-  int res_ref[SIZE] = { 0 };
+  int res_ref[SIZE] = { 0 }, res_ref2[SIZE] = { 0 };
   int i, sign = 1;
 
   for (i = 0; i < SRC_SIZE; i++)
@@ -53,6 +54,7 @@ TEST (void)
   res3.x = INTRINSIC (_maskz_cvtts_pd_epi32) (mask, s.x);
 
   CALC (s.a, res_ref);
+  memcpy(res_ref2, res_ref, sizeof(res_ref));
 
   if (UNION_CHECK (AVX512F_LEN_HALF, i_d) (res1, res_ref))
     abort ();
@@ -66,19 +68,22 @@ TEST (void)
     abort ();
 
 #if AVX512F_LEN != 128
+  for (i = 0; i < SIZE; i++)
+    res2.a[i] = DEFAULT_VALUE;
+
   res1.x = INTRINSIC (_cvtts_roundpd_epi32) (s.x, 8);
   res2.x = INTRINSIC (_mask_cvtts_roundpd_epi32) (res2.x, mask, s.x, 8);
   res3.x = INTRINSIC (_maskz_cvtts_roundpd_epi32) (mask, s.x, 8);
 
-  if (UNION_CHECK (AVX512F_LEN_HALF, i_d) (res1, res_ref))
+  if (UNION_CHECK (AVX512F_LEN_HALF, i_d) (res1, res_ref2))
     abort ();
 
-  MASK_MERGE (i_d) (res_ref, mask, SRC_SIZE);
-  if (UNION_CHECK (AVX512F_LEN_HALF, i_d) (res2, res_ref))
+  MASK_MERGE (i_d) (res_ref2, mask, SRC_SIZE);
+  if (UNION_CHECK (AVX512F_LEN_HALF, i_d) (res2, res_ref2))
     abort ();
 
-  MASK_ZERO (i_d) (res_ref, mask, SRC_SIZE);
-  if (UNION_CHECK (AVX512F_LEN_HALF, i_d) (res3, res_ref))
+  MASK_ZERO (i_d) (res_ref2, mask, SRC_SIZE);
+  if (UNION_CHECK (AVX512F_LEN_HALF, i_d) (res3, res_ref2))
     abort ();
 #endif
 }
index fdadda9f93ade2b5fe1dec40c79c6ed51c450dc7..23eb111eab11011a0979b3460d1fa74d53310ca8 100644 (file)
@@ -9,6 +9,7 @@
 #endif
 #include "avx10-helper.h"
 #include <limits.h>
+#include <string.h>
 
 #define SIZE (AVX512F_LEN / 64)
 #include "avx512f-mask-type.h"
@@ -35,7 +36,7 @@ TEST (void)
   UNION_TYPE (AVX512F_LEN, d) s;
   UNION_TYPE (AVX512F_LEN, i_q) res1, res2, res3;
   MASK_TYPE mask = MASK_VALUE;
-  long long res_ref[SIZE] = { 0 };
+  long long res_ref[SIZE] = { 0 }, res_ref2[SIZE] = { 0 };
   int i, sign = 1;
 
   for (i = 0; i < SIZE; i++)
@@ -52,6 +53,7 @@ TEST (void)
   res3.x = INTRINSIC (_maskz_cvtts_pd_epi64) (mask, s.x);
 
   CALC (s.a, res_ref);
+  memcpy(res_ref2, res_ref, sizeof(res_ref));
 
   if (UNION_CHECK (AVX512F_LEN, i_q) (res1, res_ref))
     abort ();
@@ -65,19 +67,22 @@ TEST (void)
     abort ();
 
 #if AVX512F_LEN != 128
+  for (i = 0; i < SIZE; i++)
+    res2.a[i] = DEFAULT_VALUE;
+
   res1.x = INTRINSIC (_cvtts_roundpd_epi64) (s.x, 8);
   res2.x = INTRINSIC (_mask_cvtts_roundpd_epi64) (res2.x, mask, s.x, 8);
   res3.x = INTRINSIC (_maskz_cvtts_roundpd_epi64) (mask, s.x, 8);
 
-  if (UNION_CHECK (AVX512F_LEN, i_q) (res1, res_ref))
+  if (UNION_CHECK (AVX512F_LEN, i_q) (res1, res_ref2))
     abort ();
 
-  MASK_MERGE (i_q) (res_ref, mask, SIZE);
-  if (UNION_CHECK (AVX512F_LEN, i_q) (res2, res_ref))
+  MASK_MERGE (i_q) (res_ref2, mask, SIZE);
+  if (UNION_CHECK (AVX512F_LEN, i_q) (res2, res_ref2))
     abort ();
 
-  MASK_ZERO (i_q) (res_ref, mask, SIZE);
-  if (UNION_CHECK (AVX512F_LEN, i_q) (res3, res_ref))
+  MASK_ZERO (i_q) (res_ref2, mask, SIZE);
+  if (UNION_CHECK (AVX512F_LEN, i_q) (res3, res_ref2))
     abort ();
 #endif
 }
index dbf056726ce51eaac88bce7e9138fb688031c55f..7058423d8fdd76b1f4e46b18919c2c73d7c33058 100644 (file)
@@ -9,6 +9,7 @@
 #endif
 #include "avx10-helper.h"
 #include <limits.h>
+#include <string.h>
 
 #define SRC_SIZE (AVX512F_LEN / 64)
 #define SIZE (AVX512F_LEN_HALF / 32)
@@ -36,7 +37,7 @@ TEST (void)
   UNION_TYPE (AVX512F_LEN, d) s;
   UNION_TYPE (AVX512F_LEN_HALF, i_ud) res1, res2, res3;
   MASK_TYPE mask = MASK_VALUE;
-  unsigned int res_ref[SIZE] = { 0 };
+  unsigned int res_ref[SIZE] = { 0 }, res_ref2[SIZE] = { 0 };
   int i, sign = 1;
 
   for (i = 0; i < SRC_SIZE; i++)
@@ -53,6 +54,7 @@ TEST (void)
   res3.x = INTRINSIC (_maskz_cvtts_pd_epu32) (mask, s.x);
 
   CALC (s.a, res_ref);
+  memcpy(res_ref2, res_ref, sizeof(res_ref));
 
   if (UNION_CHECK (AVX512F_LEN_HALF, i_ud) (res1, res_ref))
     abort ();
@@ -66,19 +68,22 @@ TEST (void)
     abort ();
 
 #if AVX512F_LEN != 128
+  for (i = 0; i < SIZE; i++)
+    res2.a[i] = DEFAULT_VALUE;
+
   res1.x = INTRINSIC (_cvtts_roundpd_epu32) (s.x, 8);
   res2.x = INTRINSIC (_mask_cvtts_roundpd_epu32) (res2.x, mask, s.x, 8);
   res3.x = INTRINSIC (_maskz_cvtts_roundpd_epu32) (mask, s.x, 8);
 
-  if (UNION_CHECK (AVX512F_LEN_HALF, i_ud) (res1, res_ref))
+  if (UNION_CHECK (AVX512F_LEN_HALF, i_ud) (res1, res_ref2))
     abort ();
 
-  MASK_MERGE (i_ud) (res_ref, mask, SRC_SIZE);
-  if (UNION_CHECK (AVX512F_LEN_HALF, i_ud) (res2, res_ref))
+  MASK_MERGE (i_ud) (res_ref2, mask, SRC_SIZE);
+  if (UNION_CHECK (AVX512F_LEN_HALF, i_ud) (res2, res_ref2))
     abort ();
 
-  MASK_ZERO (i_ud) (res_ref, mask, SRC_SIZE);
-  if (UNION_CHECK (AVX512F_LEN_HALF, i_ud) (res3, res_ref))
+  MASK_ZERO (i_ud) (res_ref2, mask, SRC_SIZE);
+  if (UNION_CHECK (AVX512F_LEN_HALF, i_ud) (res3, res_ref2))
     abort ();
 #endif
 }
index d5bb46a7c5acb2a521c2b570eab70e6528618882..9c826f4f19de7dcad1abc48725986cd143da63b8 100644 (file)
@@ -9,6 +9,7 @@
 #endif
 #include "avx10-helper.h"
 #include <limits.h>
+#include <string.h>
 
 #define SIZE (AVX512F_LEN / 64)
 #include "avx512f-mask-type.h"
@@ -35,7 +36,7 @@ TEST (void)
   UNION_TYPE (AVX512F_LEN, d) s;
   UNION_TYPE (AVX512F_LEN, i_uq) res1, res2, res3;
   MASK_TYPE mask = MASK_VALUE;
-  unsigned long long res_ref[SIZE] = { 0 };
+  unsigned long long res_ref[SIZE] = { 0 }, res_ref2[SIZE] = { 0 };
   int i, sign = 1;
 
   for (i = 0; i < SIZE; i++)
@@ -52,6 +53,7 @@ TEST (void)
   res3.x = INTRINSIC (_maskz_cvtts_pd_epu64) (mask, s.x);
 
   CALC (s.a, res_ref);
+  memcpy(res_ref2, res_ref, sizeof(res_ref));
 
   if (UNION_CHECK (AVX512F_LEN, i_uq) (res1, res_ref))
     abort ();
@@ -65,19 +67,22 @@ TEST (void)
     abort ();
 
 #if AVX512F_LEN != 128
+  for (i = 0; i < SIZE; i++)
+    res2.a[i] = DEFAULT_VALUE;
+
   res1.x = INTRINSIC (_cvtts_roundpd_epu64) (s.x, 8);
   res2.x = INTRINSIC (_mask_cvtts_roundpd_epu64) (res2.x, mask, s.x, 8);
   res3.x = INTRINSIC (_maskz_cvtts_roundpd_epu64) (mask, s.x, 8);
 
-  if (UNION_CHECK (AVX512F_LEN, i_uq) (res1, res_ref))
+  if (UNION_CHECK (AVX512F_LEN, i_uq) (res1, res_ref2))
     abort ();
 
-  MASK_MERGE (i_uq) (res_ref, mask, SIZE);
-  if (UNION_CHECK (AVX512F_LEN, i_uq) (res2, res_ref))
+  MASK_MERGE (i_uq) (res_ref2, mask, SIZE);
+  if (UNION_CHECK (AVX512F_LEN, i_uq) (res2, res_ref2))
     abort ();
 
-  MASK_ZERO (i_uq) (res_ref, mask, SIZE);
-  if (UNION_CHECK (AVX512F_LEN, i_uq) (res3, res_ref))
+  MASK_ZERO (i_uq) (res_ref2, mask, SIZE);
+  if (UNION_CHECK (AVX512F_LEN, i_uq) (res3, res_ref2))
     abort ();
 #endif
 }
index 03f18f7f21f00eb0013f65bdc4d863421814ee2d..7f94020adf8aefc726cee47ef41c5a9b9b4b7776 100644 (file)
@@ -9,6 +9,7 @@
 #endif
 #include "avx10-helper.h"
 #include <limits.h>
+#include <string.h>
 
 #define SIZE (AVX512F_LEN / 16)
 #include "avx512f-mask-type.h"
@@ -37,7 +38,7 @@ TEST (void)
   UNION_TYPE (AVX512F_LEN, h) s;
   UNION_TYPE (AVX512F_LEN, i_w) res1, res2, res3;
   MASK_TYPE mask = MASK_VALUE;
-  short res_ref[SIZE] = { 0 };
+  short res_ref[SIZE] = { 0 }, res_ref2[SIZE] = { 0 };
   int i, sign = 1;
 
   for (i = 0; i < SIZE; i++)
@@ -54,6 +55,7 @@ TEST (void)
   res3.x = INTRINSIC (_maskz_ipcvtts_ph_epi8) (mask, s.x);
 
   CALC (s.a, res_ref);
+  memcpy(res_ref2, res_ref, sizeof(res_ref));
 
   if (UNION_CHECK (AVX512F_LEN, i_w) (res1, res_ref))
     abort ();
@@ -67,19 +69,22 @@ TEST (void)
     abort ();
 
 #if AVX512F_LEN != 128
+  for (i = 0; i < SIZE; i++)
+    res2.a[i] = DEFAULT_VALUE;
+
   res1.x = INTRINSIC (_ipcvtts_roundph_epi8) (s.x, 8);
   res2.x = INTRINSIC (_mask_ipcvtts_roundph_epi8) (res2.x, mask, s.x, 8);
   res3.x = INTRINSIC (_maskz_ipcvtts_roundph_epi8) (mask, s.x, 8);
 
-  if (UNION_CHECK (AVX512F_LEN, i_w) (res1, res_ref))
+  if (UNION_CHECK (AVX512F_LEN, i_w) (res1, res_ref2))
     abort ();
 
-  MASK_MERGE (i_w) (res_ref, mask, SIZE);
-  if (UNION_CHECK (AVX512F_LEN, i_w) (res2, res_ref))
+  MASK_MERGE (i_w) (res_ref2, mask, SIZE);
+  if (UNION_CHECK (AVX512F_LEN, i_w) (res2, res_ref2))
     abort ();
 
-  MASK_ZERO (i_w) (res_ref, mask, SIZE);
-  if (UNION_CHECK (AVX512F_LEN, i_w) (res3, res_ref))
+  MASK_ZERO (i_w) (res_ref2, mask, SIZE);
+  if (UNION_CHECK (AVX512F_LEN, i_w) (res3, res_ref2))
     abort ();
 #endif
 }
index ee268cc95abd743ef7139f0bf2ea44a5270cf638..9d3bc2cce7c19189ce381c4449f5c4ac55bcf7bf 100644 (file)
@@ -9,6 +9,7 @@
 #endif
 #include "avx10-helper.h"
 #include <limits.h>
+#include <string.h>
 
 #define SIZE (AVX512F_LEN / 32)
 #include "avx512f-mask-type.h"
@@ -35,7 +36,7 @@ TEST (void)
   UNION_TYPE (AVX512F_LEN, ) s;
   UNION_TYPE (AVX512F_LEN, i_d) res1, res2, res3;
   MASK_TYPE mask = MASK_VALUE;
-  int res_ref[SIZE] = { 0 };
+  int res_ref[SIZE] = { 0 }, res_ref2[SIZE];
   int i, sign = 1;
 
   for (i = 0; i < SIZE; i++)
@@ -52,6 +53,7 @@ TEST (void)
   res3.x = INTRINSIC (_maskz_cvtts_ps_epi32) (mask, s.x);
 
   CALC (s.a, res_ref);
+  memcpy(res_ref2, res_ref, sizeof(res_ref));
 
   if (UNION_CHECK (AVX512F_LEN, i_d) (res1, res_ref))
     abort ();
@@ -65,19 +67,22 @@ TEST (void)
     abort ();
 
 #if AVX512F_LEN != 128
+  for (i = 0; i < SIZE; i++)
+    res2.a[i] = DEFAULT_VALUE;
+
   res1.x = INTRINSIC (_cvtts_roundps_epi32) (s.x, 8);
   res2.x = INTRINSIC (_mask_cvtts_roundps_epi32) (res2.x, mask, s.x, 8);
   res3.x = INTRINSIC (_maskz_cvtts_roundps_epi32) (mask, s.x, 8);
 
-  if (UNION_CHECK (AVX512F_LEN, i_d) (res1, res_ref))
+  if (UNION_CHECK (AVX512F_LEN, i_d) (res1, res_ref2))
     abort ();
 
-  MASK_MERGE (i_d) (res_ref, mask, SIZE);
-  if (UNION_CHECK (AVX512F_LEN, i_d) (res2, res_ref))
+  MASK_MERGE (i_d) (res_ref2, mask, SIZE);
+  if (UNION_CHECK (AVX512F_LEN, i_d) (res2, res_ref2))
     abort ();
 
-  MASK_ZERO (i_d) (res_ref, mask, SIZE);
-  if (UNION_CHECK (AVX512F_LEN, i_d) (res3, res_ref))
+  MASK_ZERO (i_d) (res_ref2, mask, SIZE);
+  if (UNION_CHECK (AVX512F_LEN, i_d) (res3, res_ref2))
     abort ();
 #endif
 }
index f63fee4367a2dccb053b3cff0f16fdc4ea0c4b66..96543859552d43edb246f24cf023b8648cecc9c7 100644 (file)
@@ -10,6 +10,7 @@
 #include "avx10-helper.h"
 #include <limits.h>
 #include <math.h>
+#include <string.h>
 
 #define SIZE (AVX512F_LEN / 32)
 #include "avx512f-mask-type.h"
@@ -38,7 +39,7 @@ TEST (void)
   UNION_TYPE (AVX512F_LEN, ) s;
   UNION_TYPE (AVX512F_LEN, i_d) res1, res2, res3;
   MASK_TYPE mask = MASK_VALUE;
-  int res_ref[SIZE] = { 0 };
+  int res_ref[SIZE] = { 0 }, res_ref2[SIZE] = { 0 };
   int i, sign = 1;
 
   for (i = 0; i < SIZE; i++)
@@ -55,6 +56,7 @@ TEST (void)
   res3.x = INTRINSIC (_maskz_ipcvtts_ps_epi8) (mask, s.x);
 
   CALC (s.a, res_ref);
+  memcpy(res_ref2, res_ref, sizeof(res_ref));
 
   if (UNION_CHECK (AVX512F_LEN, i_d) (res1, res_ref))
     abort ();
@@ -68,19 +70,22 @@ TEST (void)
     abort ();
 
 #if AVX512F_LEN != 128
+  for (i = 0; i < SIZE; i++)
+    res2.a[i] = DEFAULT_VALUE;
+
   res1.x = INTRINSIC (_ipcvtts_roundps_epi8) (s.x, 8);
   res2.x = INTRINSIC (_mask_ipcvtts_roundps_epi8) (res2.x, mask, s.x, 8);
   res3.x = INTRINSIC (_maskz_ipcvtts_roundps_epi8) (mask, s.x, 8);
 
-  if (UNION_CHECK (AVX512F_LEN, i_d) (res1, res_ref))
+  if (UNION_CHECK (AVX512F_LEN, i_d) (res1, res_ref2))
     abort ();
 
-  MASK_MERGE (i_d) (res_ref, mask, SIZE);
-  if (UNION_CHECK (AVX512F_LEN, i_d) (res2, res_ref))
+  MASK_MERGE (i_d) (res_ref2, mask, SIZE);
+  if (UNION_CHECK (AVX512F_LEN, i_d) (res2, res_ref2))
     abort ();
 
-  MASK_ZERO (i_d) (res_ref, mask, SIZE);
-  if (UNION_CHECK (AVX512F_LEN, i_d) (res3, res_ref))
+  MASK_ZERO (i_d) (res_ref2, mask, SIZE);
+  if (UNION_CHECK (AVX512F_LEN, i_d) (res3, res_ref2))
     abort ();
 #endif
 }
index 1b0f70e0624e9603dd32d0737d67fe6a40c94bf3..976677f15b5192584998186d9f11dce233a119a9 100644 (file)
@@ -10,6 +10,7 @@
 #include "avx10-helper.h"
 #include <limits.h>
 #include <math.h>
+#include <string.h>
 
 #define SIZE (AVX512F_LEN / 32)
 #include "avx512f-mask-type.h"
@@ -36,7 +37,7 @@ TEST (void)
   UNION_TYPE (AVX512F_LEN, ) s;
   UNION_TYPE (AVX512F_LEN, i_d) res1, res2, res3;
   MASK_TYPE mask = MASK_VALUE;
-  int res_ref[SIZE] = { 0 };
+  int res_ref[SIZE] = { 0 }, res_ref2[SIZE] = { 0 };
   int i, sign = 1;
 
   for (i = 0; i < SIZE; i++)
@@ -53,6 +54,7 @@ TEST (void)
   res3.x = INTRINSIC (_maskz_ipcvtts_ps_epu8) (mask, s.x);
 
   CALC (s.a, res_ref);
+  memcpy(res_ref2, res_ref, sizeof(res_ref));
 
   if (UNION_CHECK (AVX512F_LEN, i_d) (res1, res_ref))
     abort ();
@@ -66,19 +68,22 @@ TEST (void)
     abort ();
 
 #if AVX512F_LEN != 128
+  for (i = 0; i < SIZE; i++)
+    res2.a[i] = DEFAULT_VALUE;
+
   res1.x = INTRINSIC (_ipcvtts_roundps_epu8) (s.x, 8);
   res2.x = INTRINSIC (_mask_ipcvtts_roundps_epu8) (res2.x, mask, s.x, 8);
   res3.x = INTRINSIC (_maskz_ipcvtts_roundps_epu8) (mask, s.x, 8);
 
-  if (UNION_CHECK (AVX512F_LEN, i_d) (res1, res_ref))
+  if (UNION_CHECK (AVX512F_LEN, i_d) (res1, res_ref2))
     abort ();
 
-  MASK_MERGE (i_d) (res_ref, mask, SIZE);
-  if (UNION_CHECK (AVX512F_LEN, i_d) (res2, res_ref))
+  MASK_MERGE (i_d) (res_ref2, mask, SIZE);
+  if (UNION_CHECK (AVX512F_LEN, i_d) (res2, res_ref2))
     abort ();
 
-  MASK_ZERO (i_d) (res_ref, mask, SIZE);
-  if (UNION_CHECK (AVX512F_LEN, i_d) (res3, res_ref))
+  MASK_ZERO (i_d) (res_ref2, mask, SIZE);
+  if (UNION_CHECK (AVX512F_LEN, i_d) (res3, res_ref2))
     abort ();
 #endif
 }
index f8fde12f986119e5413a0f82152596873f2846cd..0d5797e54cfc6111983201cf47561672ebf32873 100644 (file)
@@ -9,6 +9,7 @@
 #endif
 #include "avx10-helper.h"
 #include <limits.h>
+#include <string.h>
 
 #define SRC_SIZE (AVX512F_LEN_HALF / 32)
 #define SIZE (AVX512F_LEN / 64)
@@ -36,7 +37,7 @@ TEST (void)
   UNION_TYPE (AVX512F_LEN_HALF, ) s;
   UNION_TYPE (AVX512F_LEN, i_q) res1, res2, res3;
   MASK_TYPE mask = MASK_VALUE;
-  long long res_ref[SIZE] = { 0 };
+  long long res_ref[SIZE] = { 0 }, res_ref2[SIZE] = { 0 };
   int i, sign = 1;
 
   for (i = 0; i < SRC_SIZE; i++)
@@ -53,6 +54,7 @@ TEST (void)
   res3.x = INTRINSIC (_maskz_cvtts_ps_epi64) (mask, s.x);
 
   CALC (s.a, res_ref);
+  memcpy(res_ref2, res_ref, sizeof(res_ref));
 
   if (UNION_CHECK (AVX512F_LEN, i_q) (res1, res_ref))
     abort ();
@@ -66,19 +68,22 @@ TEST (void)
     abort ();
 
 #if AVX512F_LEN != 128
+  for (i = 0; i < SIZE; i++)
+    res2.a[i] = DEFAULT_VALUE;
+
   res1.x = INTRINSIC (_cvtts_roundps_epi64) (s.x, 8);
   res2.x = INTRINSIC (_mask_cvtts_roundps_epi64) (res2.x, mask, s.x, 8);
   res3.x = INTRINSIC (_maskz_cvtts_roundps_epi64) (mask, s.x, 8);
 
-  if (UNION_CHECK (AVX512F_LEN, i_q) (res1, res_ref))
+  if (UNION_CHECK (AVX512F_LEN, i_q) (res1, res_ref2))
     abort ();
 
-  MASK_MERGE (i_q) (res_ref, mask, SIZE);
-  if (UNION_CHECK (AVX512F_LEN, i_q) (res2, res_ref))
+  MASK_MERGE (i_q) (res_ref2, mask, SIZE);
+  if (UNION_CHECK (AVX512F_LEN, i_q) (res2, res_ref2))
     abort ();
 
-  MASK_ZERO (i_q) (res_ref, mask, SIZE);
-  if (UNION_CHECK (AVX512F_LEN, i_q) (res3, res_ref))
+  MASK_ZERO (i_q) (res_ref2, mask, SIZE);
+  if (UNION_CHECK (AVX512F_LEN, i_q) (res3, res_ref2))
     abort ();
 #endif
 }
index 2d7f631273c754c444c2138dcd2aff09b6967f06..f578cd0d8169d9997b4f7178d0caa4bc0c20e14a 100644 (file)
@@ -9,6 +9,7 @@
 #endif
 #include "avx10-helper.h"
 #include <limits.h>
+#include <string.h>
 
 #define SIZE (AVX512F_LEN / 32)
 #include "avx512f-mask-type.h"
@@ -35,7 +36,7 @@ TEST (void)
   UNION_TYPE (AVX512F_LEN, ) s;
   UNION_TYPE (AVX512F_LEN, i_ud) res1, res2, res3;
   MASK_TYPE mask = MASK_VALUE;
-  unsigned int res_ref[SIZE] = { 0 };
+  unsigned int res_ref[SIZE] = { 0 }, res_ref2[SIZE] = { 0 };
   int i, sign = 1;
 
   for (i = 0; i < SIZE; i++)
@@ -52,6 +53,7 @@ TEST (void)
   res3.x = INTRINSIC (_maskz_cvtts_ps_epu32) (mask, s.x);
 
   CALC (s.a, res_ref);
+  memcpy(res_ref2, res_ref, sizeof(res_ref));
 
   if (UNION_CHECK (AVX512F_LEN, i_ud) (res1, res_ref))
     abort ();
@@ -65,19 +67,22 @@ TEST (void)
     abort ();
 
 #if AVX512F_LEN != 128
+  for (i = 0; i < SIZE; i++)
+    res2.a[i] = DEFAULT_VALUE;
+
   res1.x = INTRINSIC (_cvtts_roundps_epu32) (s.x, 8);
   res2.x = INTRINSIC (_mask_cvtts_roundps_epu32) (res2.x, mask, s.x, 8);
   res3.x = INTRINSIC (_maskz_cvtts_roundps_epu32) (mask, s.x, 8);
 
-  if (UNION_CHECK (AVX512F_LEN, i_ud) (res1, res_ref))
+  if (UNION_CHECK (AVX512F_LEN, i_ud) (res1, res_ref2))
     abort ();
 
-  MASK_MERGE (i_ud) (res_ref, mask, SIZE);
-  if (UNION_CHECK (AVX512F_LEN, i_ud) (res2, res_ref))
+  MASK_MERGE (i_ud) (res_ref2, mask, SIZE);
+  if (UNION_CHECK (AVX512F_LEN, i_ud) (res2, res_ref2))
     abort ();
 
-  MASK_ZERO (i_ud) (res_ref, mask, SIZE);
-  if (UNION_CHECK (AVX512F_LEN, i_ud) (res3, res_ref))
+  MASK_ZERO (i_ud) (res_ref2, mask, SIZE);
+  if (UNION_CHECK (AVX512F_LEN, i_ud) (res3, res_ref2))
     abort ();
 #endif
 }
index 32e206d71271fa7b7cc6f5a0e5ad56f31c7004db..93e71acab2043c1f781b54ab0ddc05d9f34eb535 100644 (file)
@@ -9,6 +9,7 @@
 #endif
 #include "avx10-helper.h"
 #include <limits.h>
+#include <string.h>
 
 #define SRC_SIZE (AVX512F_LEN_HALF / 32)
 #define SIZE (AVX512F_LEN / 64)
@@ -36,7 +37,7 @@ TEST (void)
   UNION_TYPE (AVX512F_LEN_HALF, ) s;
   UNION_TYPE (AVX512F_LEN, i_uq) res1, res2, res3;
   MASK_TYPE mask = MASK_VALUE;
-  unsigned long long res_ref[SIZE] = { 0 };
+  unsigned long long res_ref[SIZE] = { 0 }, res_ref2[SIZE] = { 0 };
   int i, sign = 1;
 
   for (i = 0; i < SRC_SIZE; i++)
@@ -53,6 +54,7 @@ TEST (void)
   res3.x = INTRINSIC (_maskz_cvtts_ps_epu64) (mask, s.x);
 
   CALC (s.a, res_ref);
+  memcpy(res_ref2, res_ref, sizeof(res_ref));
 
   if (UNION_CHECK (AVX512F_LEN, i_uq) (res1, res_ref))
     abort ();
@@ -66,19 +68,22 @@ TEST (void)
     abort ();
 
 #if AVX512F_LEN != 128
+  for (i = 0; i < SIZE; i++)
+    res2.a[i] = DEFAULT_VALUE;
+
   res1.x = INTRINSIC (_cvtts_roundps_epu64) (s.x, 8);
   res2.x = INTRINSIC (_mask_cvtts_roundps_epu64) (res2.x, mask, s.x, 8);
   res3.x = INTRINSIC (_maskz_cvtts_roundps_epu64) (mask, s.x, 8);
 
-  if (UNION_CHECK (AVX512F_LEN, i_uq) (res1, res_ref))
+  if (UNION_CHECK (AVX512F_LEN, i_uq) (res1, res_ref2))
     abort ();
 
-  MASK_MERGE (i_uq) (res_ref, mask, SRC_SIZE);
-  if (UNION_CHECK (AVX512F_LEN, i_uq) (res2, res_ref))
+  MASK_MERGE (i_uq) (res_ref2, mask, SRC_SIZE);
+  if (UNION_CHECK (AVX512F_LEN, i_uq) (res2, res_ref2))
     abort ();
 
-  MASK_ZERO (i_uq) (res_ref, mask, SRC_SIZE);
-  if (UNION_CHECK (AVX512F_LEN, i_uq) (res3, res_ref))
+  MASK_ZERO (i_uq) (res_ref2, mask, SRC_SIZE);
+  if (UNION_CHECK (AVX512F_LEN, i_uq) (res3, res_ref2))
     abort ();
 #endif
 }