]> git.ipfire.org Git - thirdparty/gcc.git/commitdiff
Optimize kmov + kmov + or to kortest.
authorliuhongt <hongtao.liu@intel.com>
Tue, 11 Nov 2025 08:19:19 +0000 (00:19 -0800)
committerliuhongt <hongtao.liu@intel.com>
Thu, 13 Nov 2025 13:58:05 +0000 (05:58 -0800)
For instruction sequence like
        kmovb   %k0, %edx
        kmovb   %k1, %ecx
        orb     %cl, %dl
        je      .L5

if only CCZ is cared, it can be optimized to

    kortestb %k1, %k0
je .L5

gcc/ChangeLog:

* config/i386/i386.md (*ior<mode>_ccz_1): New define_insn.

gcc/testsuite/ChangeLog:

* gcc.target/i386/kortest_ccz-1.c: New test.

gcc/config/i386/i386.md
gcc/testsuite/gcc.target/i386/kortest_ccz-1.c [new file with mode: 0644]

index 3ea2439526bef1a8f9a0347318de7aafbb137ae3..f3c8f595de91157b3712511b1ecfe6f007a171dc 100644 (file)
    (set_attr "isa" "*,apx_ndd")
    (set_attr "mode" "SI")])
 
+;; It must be put before *<code><mode>_3, the blow one.
+(define_insn "*ior<mode>_ccz_1"
+  [(set (reg:CCZ FLAGS_REG)
+       (compare:CCZ
+        (ior:SWI1248_AVX512BWDQ_64
+         (match_operand:SWI1248_AVX512BWDQ_64 1 "nonimmediate_operand" "%0,?k")
+         (match_operand:SWI1248_AVX512BWDQ_64 2 "<general_operand>" "<g>, k"))
+        (const_int 0)))
+   (clobber (match_scratch:SWI1248_AVX512BWDQ_64 0 "=<r>, X"))]
+  "TARGET_AVX512F && !(MEM_P (operands[1]) && MEM_P (operands[2]))"
+  "@
+   or{<imodesuffix>}\t{%2, %0|%0, %2}
+   kortest<mskmodesuffix>\t{%1, %2|%2, %1}"
+  [(set_attr "type" "alu,msklog")
+   (set_attr "mode" "<MODE>")])
+
 (define_insn "*<code><mode>_3"
   [(set (reg FLAGS_REG)
        (compare (any_or:SWI
diff --git a/gcc/testsuite/gcc.target/i386/kortest_ccz-1.c b/gcc/testsuite/gcc.target/i386/kortest_ccz-1.c
new file mode 100644 (file)
index 0000000..b3cf5b8
--- /dev/null
@@ -0,0 +1,13 @@
+/* { dg-do compile } */
+/* { dg-options "-march=x86-64-v4 -O3" } */
+/* { dg-final { scan-assembler-not "kmov" } } */
+/* { dg-final { scan-assembler "kortest" } } */
+
+int
+foo (int *__restrict a, int* __restrict d, int b, int c, int n)
+{
+  for (int i = 0; i != 10000; i++)
+    if (a[i] > b | d[i] > c)
+      return 1;
+  return 0;
+}