git.ipfire.org Git - thirdparty/gcc.git/commit

author	Dennis Zhang <dennis.zhang@arm.com>
	Fri, 11 Dec 2020 16:18:05 +0000 (16:18 +0000)
committer	Dennis Zhang <dennis.zhang@arm.com>
	Fri, 11 Dec 2020 16:18:05 +0000 (16:18 +0000)
commit	c25f7eac6555d67523f0520c7e93bbc398d0da84
tree	b9806b869e5e374b123a7c9641c5e94051bea5f1	tree
parent	702e45ee471422dee86d32fc84f617d341d33175	commit \| diff

aarch64: intrinsics to extract half of bf16 vector

This patch implements ACLE intrinsics vget_low_bf16 and vget_high_bf16
to extract lower or higher half from a bfloat16x8 vector. The
vget_high_bf16 is done by 'dup' instruction. The vget_low_bf16 is just
to return the lower half of a vector register. Tests include both big-
and little-endian cases.

gcc/ChangeLog:

* config/aarch64/aarch64-simd-builtins.def (vget_lo_half): New entry.
(vget_hi_half): Likewise.
* config/aarch64/aarch64-simd.md (aarch64_vget_lo_halfv8bf): New entry.
(aarch64_vget_hi_halfv8bf): Likewise.
* config/aarch64/arm_neon.h (vget_low_bf16): New intrinsic.
(vget_high_bf16): Likewise.

gcc/testsuite/ChangeLog

* gcc.target/aarch64/advsimd-intrinsics/bf16_get.c: New test.

(cherry picked from commit 3553c658533e430b232997bdfd97faf6606fb102)

gcc/config/aarch64/aarch64-simd-builtins.def		diff \| blob \| blame \| history
gcc/config/aarch64/aarch64-simd.md		diff \| blob \| blame \| history
gcc/config/aarch64/arm_neon.h		diff \| blob \| blame \| history
gcc/testsuite/gcc.target/aarch64/advsimd-intrinsics/bf16_get.c	[new file with mode: 0644]	blob