[thirdparty/gcc.git] / libgcc / config / arc / ieee-754 / arc600 / divsf3.S

/* Copyright (C) 2008-2024 Free Software Foundation, Inc.
   Contributor: Joern Rennecke <joern.rennecke@embecosm.com>
		on behalf of Synopsys Inc.

This file is part of GCC.

GCC is free software; you can redistribute it and/or modify it under
the terms of the GNU General Public License as published by the Free
Software Foundation; either version 3, or (at your option) any later
version.

GCC is distributed in the hope that it will be useful, but WITHOUT ANY
WARRANTY; without even the implied warranty of MERCHANTABILITY or
FITNESS FOR A PARTICULAR PURPOSE.  See the GNU General Public License
for more details.

Under Section 7 of GPL version 3, you are granted additional
permissions described in the GCC Runtime Library Exception, version
3.1, as published by the Free Software Foundation.

You should have received a copy of the GNU General Public License and
a copy of the GCC Runtime Library Exception along with this program;
see the files COPYING3 and COPYING.RUNTIME respectively.  If not, see
<http://www.gnu.org/licenses/>.  */

#include "../arc-ieee-754.h"

#if 0 /* DEBUG */
	.global __divsf3
	FUNC(__divsf3)
	.balign 4
__divsf3:
	push_s blink
	push_s r1
	bl.d __divsf3_c
	push_s r0
	ld_s r1,[sp,4]
	st_s r0,[sp,4]
	bl.d __divsf3_asm
	pop_s r0
	pop_s r1
	pop_s blink
	cmp r0,r1
        jeq_s [blink]
        and r12,r0,r1
        bic.f 0,0x7f800000,r12 ; both NaN -> OK
        jeq_s [blink]
        bl abort
	ENDFUNC(__divsf3)
#define __divsf3 __divsf3_asm
#endif /* DEBUG */

	.balign 4
__divdf3_support: /* This label makes debugger output saner.  */
	FUNC(__divsf3)
.Ldenorm_fp0:
	norm.f r12,r2 ; flag for 0/x -> 0 check
	bic.ne.f 0,0x60000000,r1 ; denorm/large number -> 0
	beq_s .Lret0_NaN
	tst r1,r9
	add_s r2,r2,r2
	sub_s r12,r12,8
	asl_s r2,r2,r12
	asl_l r12,r12,23
	bne.d .Lpast_denorm_fp0
	add r5,r5,r12
/* r0 is subnormal, r1 is subnormal or 0.  */

	.balign 4
.Ldenorm_fp1:
	norm.f r12,r3 ; flag for  x/0 -> Inf check
	bic.ne.f 0,0x60000000,r0 ; large number/denorm -> Inf
	beq_s .Linf
	add_s r3,r3,r3
	sub_s r12,r12,8
	asl_s r3,r3,r12
	asl_s r12,r12,23
	b.d .Lpast_denorm_fp1
	add r4,r4,r12

.Lret0_NaN:
	bclr.f 0,r1,31 ; 0/0 -> NaN
	bic r0,r10,r9
	j_s.d [blink]
	sub.eq r0,r0,1

	.balign 4
.Linf_nan_fp0:
	bic.f 0,r9,r1 ; fp1 Inf -> result NaN
	bic r1,r5,r9  ; fp1 sign
	sub.eq r1,r1,1
	j_s.d [blink]
	xor_s r0,r0,r1
.Linf_nan_fp1:
	bic r0,r4,r9 ; fp0 sign
	bmsk.f 0,r1,22 ; x/inf -> 0, x/nan -> nan
	xor.eq r1,r1,r9
	j_s.d [blink]
	xor_s r0,r0,r1

	.global __divsf3
	.balign 4
        .long 0x7f800000 ; exponent mask
__divsf3:
	ld r9,[pcl,-4]
	bmsk r2,r0,22
	xor r4,r0,r2
	bmsk r3,r1,22
	xor r5,r1,r3
	and r11,r0,r9
	breq.d r11,0,.Ldenorm_fp0
	xor r10,r4,r5
	breq r11,r9,.Linf_nan_fp0
	bset_s r2,r2,23
	and r11,r1,r9
	breq r11,0,.Ldenorm_fp1
	breq r11,r9,.Linf_nan_fp1
.Lpast_denorm_fp0:
	bset_s r3,r3,23
.Lpast_denorm_fp1:
	cmp r2,r3
	asl_s r2,r2,6+1
	asl_s r3,r3,7
	add.lo r2,r2,r2
	bclr r8,r9,30 ; exponent bias
	bclr.lo r8,r8,23 ; reduce exp by one if fraction is shifted
	sub r4,r4,r5
	add r4,r4,r8
	xor.f 0,r10,r4
	bmi .Linf_denorm
	and.f r12,r4,r9
	beq .Ldenorm
	sub_s r2,r2,r3 ; discard implicit 1
	rsub r3,r3,1 ; prime r3 for two-insn divide-step use
.Ldiv_23bit:
	.rep 6
	add1.f r2,r3,r2
	sub.cc r2,r2,r3
	.endr
	breq r12,r9,.Linf
	bmsk r0,r2,6
	xor_s r2,r2,r0
.Ldiv_17bit:
	.rep 7
	add1.f r2,r3,r2
	sub.cc r2,r2,r3
	.endr
	asl_s r0,r0,7
	bmsk r1,r2,6
	xor_s r2,r2,r1
	or_s r0,r0,r1
.Ldiv_10bit:
	.rep 7
	add1.f r2,r3,r2
	sub.cc r2,r2,r3
	.endr
	asl_s r0,r0,7
	bmsk r1,r2,6
	xor_s r2,r2,r1
	or_s r0,r0,r1
.Ldiv_3bit:
	.rep 3
	add1.f r2,r3,r2
	sub.cc r2,r2,r3
	.endr
	asl_s r0,r0,3
.Ldiv_0bit:
	add1.f r1,r3,r2
	sub.cc r1,r1,r3
	bmsk_s r2,r2,2
	tst r1,-0x7e ; 0xffffff82, test for rest or odd
	bmsk_s r1,r1,0
	add_s r0,r0,r2 ; assemble fraction
	add_s r0,r0,r4 ; add in sign & exponent
	j_s.d [blink]
	add.ne r0,r0,r1 ; round to nearest / even

	.balign 4
.Linf:
	j_s.d [blink]
	or r0,r10,r9

.Lret_r4:
	j_s.d [blink]
	mov_s r0,r4
	.balign 4
.Linf_denorm:
	add.f r12,r4,r4
	asr_l r12,r12,24
	bpl .Linf
	max r12,r12,-24
.Ldenorm:
	rsub r3,r3,1
	add r1,pcl,68; .Ldenorm_tab-.
	ldw.as r12,[r1,r12]
	mov_s r0,0
	lsr_s r2,r2
	sub_s r1,r1,r12
	j_s.d [r1]
	bic r4,r10,r9
	.short .Ldenorm_tab-.Lret_r4
	.short .Ldenorm_tab-.Ldiv_0bit
	.short .Ldenorm_tab-.Ldiv_3bit-2*8
	.short .Ldenorm_tab-.Ldiv_3bit-1*8
	.short .Ldenorm_tab-.Ldiv_3bit
	.short .Ldenorm_tab-.Ldiv_10bit-6*8
	.short .Ldenorm_tab-.Ldiv_10bit-5*8
	.short .Ldenorm_tab-.Ldiv_10bit-3*8
	.short .Ldenorm_tab-.Ldiv_10bit-3*8
	.short .Ldenorm_tab-.Ldiv_10bit-2*8
	.short .Ldenorm_tab-.Ldiv_10bit-1*8
	.short .Ldenorm_tab-.Ldiv_10bit
	.short .Ldenorm_tab-.Ldiv_17bit-6*8
	.short .Ldenorm_tab-.Ldiv_17bit-5*8
	.short .Ldenorm_tab-.Ldiv_17bit-4*8
	.short .Ldenorm_tab-.Ldiv_17bit-3*8
	.short .Ldenorm_tab-.Ldiv_17bit-2*8
	.short .Ldenorm_tab-.Ldiv_17bit-1*8
	.short .Ldenorm_tab-.Ldiv_17bit
	.short .Ldenorm_tab-.Ldiv_23bit-5*8
	.short .Ldenorm_tab-.Ldiv_23bit-4*8
	.short .Ldenorm_tab-.Ldiv_23bit-3*8
	.short .Ldenorm_tab-.Ldiv_23bit-2*8
	.short .Ldenorm_tab-.Ldiv_23bit-1*8
.Ldenorm_tab:
	.short .Ldenorm_tab-.Ldiv_23bit
	ENDFUNC(__divsf3)
Commit	Line	Data
	1	/* Copyright (C) 2008-2024 Free Software Foundation, Inc.
	2	Contributor: Joern Rennecke <joern.rennecke@embecosm.com>
	3	on behalf of Synopsys Inc.
	4
	5	This file is part of GCC.
	6
	7	GCC is free software; you can redistribute it and/or modify it under
	8	the terms of the GNU General Public License as published by the Free
	9	Software Foundation; either version 3, or (at your option) any later
	10	version.
	11
	12	GCC is distributed in the hope that it will be useful, but WITHOUT ANY
	13	WARRANTY; without even the implied warranty of MERCHANTABILITY or
	14	FITNESS FOR A PARTICULAR PURPOSE. See the GNU General Public License
	15	for more details.
	16
	17	Under Section 7 of GPL version 3, you are granted additional
	18	permissions described in the GCC Runtime Library Exception, version
	19	3.1, as published by the Free Software Foundation.
	20
	21	You should have received a copy of the GNU General Public License and
	22	a copy of the GCC Runtime Library Exception along with this program;
	23	see the files COPYING3 and COPYING.RUNTIME respectively. If not, see
	24	<http://www.gnu.org/licenses/>. */
	25
	26	#include "../arc-ieee-754.h"
	27
	28	#if 0 /* DEBUG */
	29	.global __divsf3
	30	FUNC(__divsf3)
	31	.balign 4
	32	__divsf3:
	33	push_s blink
	34	push_s r1
	35	bl.d __divsf3_c
	36	push_s r0
	37	ld_s r1,[sp,4]
	38	st_s r0,[sp,4]
	39	bl.d __divsf3_asm
	40	pop_s r0
	41	pop_s r1
	42	pop_s blink
	43	cmp r0,r1
	44	jeq_s [blink]
	45	and r12,r0,r1
	46	bic.f 0,0x7f800000,r12 ; both NaN -> OK
	47	jeq_s [blink]
	48	bl abort
	49	ENDFUNC(__divsf3)
	50	#define __divsf3 __divsf3_asm
	51	#endif /* DEBUG */
	52
	53	.balign 4
	54	__divdf3_support: /* This label makes debugger output saner. */
	55	FUNC(__divsf3)
	56	.Ldenorm_fp0:
	57	norm.f r12,r2 ; flag for 0/x -> 0 check
	58	bic.ne.f 0,0x60000000,r1 ; denorm/large number -> 0
	59	beq_s .Lret0_NaN
	60	tst r1,r9
	61	add_s r2,r2,r2
	62	sub_s r12,r12,8
	63	asl_s r2,r2,r12
	64	asl_l r12,r12,23
	65	bne.d .Lpast_denorm_fp0
	66	add r5,r5,r12
	67	/* r0 is subnormal, r1 is subnormal or 0. */
	68
	69	.balign 4
	70	.Ldenorm_fp1:
	71	norm.f r12,r3 ; flag for x/0 -> Inf check
	72	bic.ne.f 0,0x60000000,r0 ; large number/denorm -> Inf
	73	beq_s .Linf
	74	add_s r3,r3,r3
	75	sub_s r12,r12,8
	76	asl_s r3,r3,r12
	77	asl_s r12,r12,23
	78	b.d .Lpast_denorm_fp1
	79	add r4,r4,r12
	80
	81	.Lret0_NaN:
	82	bclr.f 0,r1,31 ; 0/0 -> NaN
	83	bic r0,r10,r9
	84	j_s.d [blink]
	85	sub.eq r0,r0,1
	86
	87	.balign 4
	88	.Linf_nan_fp0:
	89	bic.f 0,r9,r1 ; fp1 Inf -> result NaN
	90	bic r1,r5,r9 ; fp1 sign
	91	sub.eq r1,r1,1
	92	j_s.d [blink]
	93	xor_s r0,r0,r1
	94	.Linf_nan_fp1:
	95	bic r0,r4,r9 ; fp0 sign
	96	bmsk.f 0,r1,22 ; x/inf -> 0, x/nan -> nan
	97	xor.eq r1,r1,r9
	98	j_s.d [blink]
	99	xor_s r0,r0,r1
	100
	101	.global __divsf3
	102	.balign 4
	103	.long 0x7f800000 ; exponent mask
	104	__divsf3:
	105	ld r9,[pcl,-4]
	106	bmsk r2,r0,22
	107	xor r4,r0,r2
	108	bmsk r3,r1,22
	109	xor r5,r1,r3
	110	and r11,r0,r9
	111	breq.d r11,0,.Ldenorm_fp0
	112	xor r10,r4,r5
	113	breq r11,r9,.Linf_nan_fp0
	114	bset_s r2,r2,23
	115	and r11,r1,r9
	116	breq r11,0,.Ldenorm_fp1
	117	breq r11,r9,.Linf_nan_fp1
	118	.Lpast_denorm_fp0:
	119	bset_s r3,r3,23
	120	.Lpast_denorm_fp1:
	121	cmp r2,r3
	122	asl_s r2,r2,6+1
	123	asl_s r3,r3,7
	124	add.lo r2,r2,r2
	125	bclr r8,r9,30 ; exponent bias
	126	bclr.lo r8,r8,23 ; reduce exp by one if fraction is shifted
	127	sub r4,r4,r5
	128	add r4,r4,r8
	129	xor.f 0,r10,r4
	130	bmi .Linf_denorm
	131	and.f r12,r4,r9
	132	beq .Ldenorm
	133	sub_s r2,r2,r3 ; discard implicit 1
	134	rsub r3,r3,1 ; prime r3 for two-insn divide-step use
	135	.Ldiv_23bit:
	136	.rep 6
	137	add1.f r2,r3,r2
	138	sub.cc r2,r2,r3
	139	.endr
	140	breq r12,r9,.Linf
	141	bmsk r0,r2,6
	142	xor_s r2,r2,r0
	143	.Ldiv_17bit:
	144	.rep 7
	145	add1.f r2,r3,r2
	146	sub.cc r2,r2,r3
	147	.endr
	148	asl_s r0,r0,7
	149	bmsk r1,r2,6
	150	xor_s r2,r2,r1
	151	or_s r0,r0,r1
	152	.Ldiv_10bit:
	153	.rep 7
	154	add1.f r2,r3,r2
	155	sub.cc r2,r2,r3
	156	.endr
	157	asl_s r0,r0,7
	158	bmsk r1,r2,6
	159	xor_s r2,r2,r1
	160	or_s r0,r0,r1
	161	.Ldiv_3bit:
	162	.rep 3
	163	add1.f r2,r3,r2
	164	sub.cc r2,r2,r3
	165	.endr
	166	asl_s r0,r0,3
	167	.Ldiv_0bit:
	168	add1.f r1,r3,r2
	169	sub.cc r1,r1,r3
	170	bmsk_s r2,r2,2
	171	tst r1,-0x7e ; 0xffffff82, test for rest or odd
	172	bmsk_s r1,r1,0
	173	add_s r0,r0,r2 ; assemble fraction
	174	add_s r0,r0,r4 ; add in sign & exponent
	175	j_s.d [blink]
	176	add.ne r0,r0,r1 ; round to nearest / even
	177
	178	.balign 4
	179	.Linf:
	180	j_s.d [blink]
	181	or r0,r10,r9
	182
	183	.Lret_r4:
	184	j_s.d [blink]
	185	mov_s r0,r4
	186	.balign 4
	187	.Linf_denorm:
	188	add.f r12,r4,r4
	189	asr_l r12,r12,24
	190	bpl .Linf
	191	max r12,r12,-24
	192	.Ldenorm:
	193	rsub r3,r3,1
	194	add r1,pcl,68; .Ldenorm_tab-.
	195	ldw.as r12,[r1,r12]
	196	mov_s r0,0
	197	lsr_s r2,r2
	198	sub_s r1,r1,r12
	199	j_s.d [r1]
	200	bic r4,r10,r9
	201	.short .Ldenorm_tab-.Lret_r4
	202	.short .Ldenorm_tab-.Ldiv_0bit
	203	.short .Ldenorm_tab-.Ldiv_3bit-2*8
	204	.short .Ldenorm_tab-.Ldiv_3bit-1*8
	205	.short .Ldenorm_tab-.Ldiv_3bit
	206	.short .Ldenorm_tab-.Ldiv_10bit-6*8
	207	.short .Ldenorm_tab-.Ldiv_10bit-5*8
	208	.short .Ldenorm_tab-.Ldiv_10bit-3*8
	209	.short .Ldenorm_tab-.Ldiv_10bit-3*8
	210	.short .Ldenorm_tab-.Ldiv_10bit-2*8
	211	.short .Ldenorm_tab-.Ldiv_10bit-1*8
	212	.short .Ldenorm_tab-.Ldiv_10bit
	213	.short .Ldenorm_tab-.Ldiv_17bit-6*8
	214	.short .Ldenorm_tab-.Ldiv_17bit-5*8
	215	.short .Ldenorm_tab-.Ldiv_17bit-4*8
	216	.short .Ldenorm_tab-.Ldiv_17bit-3*8
	217	.short .Ldenorm_tab-.Ldiv_17bit-2*8
	218	.short .Ldenorm_tab-.Ldiv_17bit-1*8
	219	.short .Ldenorm_tab-.Ldiv_17bit
	220	.short .Ldenorm_tab-.Ldiv_23bit-5*8
	221	.short .Ldenorm_tab-.Ldiv_23bit-4*8
	222	.short .Ldenorm_tab-.Ldiv_23bit-3*8
	223	.short .Ldenorm_tab-.Ldiv_23bit-2*8
	224	.short .Ldenorm_tab-.Ldiv_23bit-1*8
	225	.Ldenorm_tab:
	226	.short .Ldenorm_tab-.Ldiv_23bit
	227	ENDFUNC(__divsf3)