[thirdparty/gcc.git] / gcc / testsuite / gcc.target / powerpc / ppc-fma-1.c

/* { dg-do compile { target { powerpc*-*-* } } } */
/* { dg-skip-if "" { powerpc*-*-darwin* } } */
/* { dg-require-effective-target powerpc_vsx_ok } */
/* { dg-skip-if "do not override -mcpu" { powerpc*-*-* } { "-mcpu=*" } { "-mcpu=power7" } } */
/* { dg-options "-O3 -ftree-vectorize -mcpu=power7 -ffast-math" } */
/* { dg-final { scan-assembler-times "xvmadd" 4 } } */
/* { dg-final { scan-assembler-times "xsmadd\|fmadd\ " 2 } } */
/* { dg-final { scan-assembler-times "fmadds" 2 } } */
/* { dg-final { scan-assembler-times "xvmsub" 2 } } */
/* { dg-final { scan-assembler-times "xsmsub\|fmsub\ " 1 } } */
/* { dg-final { scan-assembler-times "fmsubs" 1 } } */
/* { dg-final { scan-assembler-times "xvnmadd" 2 } } */
/* { dg-final { scan-assembler-times "xsnmadd\|fnmadd " 1 } } */
/* { dg-final { scan-assembler-times "fnmadds" 1 } } */
/* { dg-final { scan-assembler-times "xvnmsub" 2 } } */
/* { dg-final { scan-assembler-times "xsnmsub\|fnmsub " 1 } } */
/* { dg-final { scan-assembler-times "fnmsubs" 1 } } */

/* All functions should generate an appropriate (a * b) + c instruction
   since -mfused-madd is on by default.  */

double
builtin_fma (double b, double c, double d)
{
  return __builtin_fma (b, c, d);			/* xsmadd{a,m}dp */
}

double
builtin_fms (double b, double c, double d)
{
  return __builtin_fma (b, c, -d);			/* xsmsub{a,b}dp */
}

double
builtin_fnma (double b, double c, double d)
{
  return - __builtin_fma (b, c, d);			/* xsnmadd{a,b}dp */
}

double
builtin_fnms (double b, double c, double d)
{
  return - __builtin_fma (b, c, -d);			/* xsnmsub{a,b}dp */
}

float
builtin_fmaf (float b, float c, float d)
{
  return __builtin_fmaf (b, c, d);			/* fmadds */
}

float
builtin_fmsf (float b, float c, float d)
{
  return __builtin_fmaf (b, c, -d);			/* fmsubs */
}

float
builtin_fnmaf (float b, float c, float d)
{
  return - __builtin_fmaf (b, c, d);			/* fnmadds */
}

float
builtin_fnmsf (float b, float c, float d)
{
  return - __builtin_fmaf (b, c, -d);			/* fnmsubs */
}

double
normal_fma (double b, double c, double d)
{
  return (b * c) + d;					/* xsmadd{a,m}dp */
}

float
normal_fmaf (float b, float c, float d)
{
  return (b * c) + d;					/* fmadds */
}

#ifndef SIZE
#define SIZE 1024
#endif

double vda[SIZE] __attribute__((__aligned__(32)));
double vdb[SIZE] __attribute__((__aligned__(32)));
double vdc[SIZE] __attribute__((__aligned__(32)));
double vdd[SIZE] __attribute__((__aligned__(32)));

float vfa[SIZE] __attribute__((__aligned__(32)));
float vfb[SIZE] __attribute__((__aligned__(32)));
float vfc[SIZE] __attribute__((__aligned__(32)));
float vfd[SIZE] __attribute__((__aligned__(32)));

void
vector_fma (void)
{
  int i;

  for (i = 0; i < SIZE; i++)
    vda[i] = __builtin_fma (vdb[i], vdc[i], vdd[i]);	/* xvmadd{a,m}dp */
}

void
vector_fms (void)
{
  int i;

  for (i = 0; i < SIZE; i++)
    vda[i] = __builtin_fma (vdb[i], vdc[i], -vdd[i]);	/* xvmsub{a,m}dp */
}

void
vector_fnma (void)
{
  int i;

  for (i = 0; i < SIZE; i++)
    vda[i] = - __builtin_fma (vdb[i], vdc[i], vdd[i]);	/* xvnmadd{a,m}dp */
}

void
vector_fnms (void)
{
  int i;

  for (i = 0; i < SIZE; i++)
    vda[i] = - __builtin_fma (vdb[i], vdc[i], -vdd[i]);	/* xvnmsub{a,m}dp */
}

void
vector_fmaf (void)
{
  int i;

  for (i = 0; i < SIZE; i++)
    vfa[i] = __builtin_fmaf (vfb[i], vfc[i], vfd[i]);	/* xvmadd{a,m}sp */
}

void
vector_fmsf (void)
{
  int i;

  for (i = 0; i < SIZE; i++)
    vfa[i] = __builtin_fmaf (vfb[i], vfc[i], -vfd[i]);	/* xvmsub{a,m}sp */
}

void
vector_fnmaf (void)
{
  int i;

  for (i = 0; i < SIZE; i++)
    vfa[i] = - __builtin_fmaf (vfb[i], vfc[i], vfd[i]);	/* xvnmadd{a,m}sp */
}

void
vector_fnmsf (void)
{
  int i;

  for (i = 0; i < SIZE; i++)
    vfa[i] = - __builtin_fmaf (vfb[i], vfc[i], -vfd[i]); /* xvnmsub{a,m}sp */
}

void
vnormal_fma (void)
{
  int i;

  for (i = 0; i < SIZE; i++)
    vda[i] = (vdb[i] * vdc[i]) + vdd[i];		/* xvmadd{a,m}dp */
}

void
vnormal_fmaf (void)
{
  int i;

  for (i = 0; i < SIZE; i++)
    vfa[i] = (vfb[i] * vfc[i]) + vfd[i];		/* xvmadd{a,m}sp */
}
Commit	Line	Data
1b1562a5	1	/* { dg-do compile { target { powerpc--* } } } */
4f4b0ab8	2	/* { dg-skip-if "" { powerpc--darwin* } } */
1b1562a5	3	/* { dg-require-effective-target powerpc_vsx_ok } */
a5fc83a1	4	/* { dg-skip-if "do not override -mcpu" { powerpc--* } { "-mcpu=" } { "-mcpu=power7" } } /
1b1562a5 MM	5	/* { dg-options "-O3 -ftree-vectorize -mcpu=power7 -ffast-math" } */
1b1562a5 MM	6	/* { dg-final { scan-assembler-times "xvmadd" 4 } } */
c36193c6	7	/* { dg-final { scan-assembler-times "xsmadd\\|fmadd\ " 2 } } */
1b1562a5 MM	8	/* { dg-final { scan-assembler-times "fmadds" 2 } } */
1b1562a5 MM	9	/* { dg-final { scan-assembler-times "xvmsub" 2 } } */
c36193c6	10	/* { dg-final { scan-assembler-times "xsmsub\\|fmsub\ " 1 } } */
1b1562a5 MM	11	/* { dg-final { scan-assembler-times "fmsubs" 1 } } */
1b1562a5 MM	12	/* { dg-final { scan-assembler-times "xvnmadd" 2 } } */
c36193c6	13	/* { dg-final { scan-assembler-times "xsnmadd\\|fnmadd " 1 } } */
1b1562a5 MM	14	/* { dg-final { scan-assembler-times "fnmadds" 1 } } */
1b1562a5 MM	15	/* { dg-final { scan-assembler-times "xvnmsub" 2 } } */
c36193c6	16	/* { dg-final { scan-assembler-times "xsnmsub\\|fnmsub " 1 } } */
1b1562a5 MM	17	/* { dg-final { scan-assembler-times "fnmsubs" 1 } } */
	18
	19	/* All functions should generate an appropriate (a * b) + c instruction
	20	since -mfused-madd is on by default. */
	21
	22	double
	23	builtin_fma (double b, double c, double d)
	24	{
	25	return __builtin_fma (b, c, d); /* xsmadd{a,m}dp */
	26	}
	27
	28	double
	29	builtin_fms (double b, double c, double d)
	30	{
	31	return __builtin_fma (b, c, -d); /* xsmsub{a,b}dp */
	32	}
	33
	34	double
	35	builtin_fnma (double b, double c, double d)
	36	{
	37	return - __builtin_fma (b, c, d); /* xsnmadd{a,b}dp */
	38	}
	39
	40	double
	41	builtin_fnms (double b, double c, double d)
	42	{
	43	return - __builtin_fma (b, c, -d); /* xsnmsub{a,b}dp */
	44	}
	45
	46	float
	47	builtin_fmaf (float b, float c, float d)
	48	{
	49	return __builtin_fmaf (b, c, d); /* fmadds */
	50	}
	51
	52	float
	53	builtin_fmsf (float b, float c, float d)
	54	{
	55	return __builtin_fmaf (b, c, -d); /* fmsubs */
	56	}
	57
	58	float
	59	builtin_fnmaf (float b, float c, float d)
	60	{
	61	return - __builtin_fmaf (b, c, d); /* fnmadds */
	62	}
	63
	64	float
	65	builtin_fnmsf (float b, float c, float d)
	66	{
	67	return - __builtin_fmaf (b, c, -d); /* fnmsubs */
	68	}
	69
	70	double
	71	normal_fma (double b, double c, double d)
	72	{
	73	return (b * c) + d; /* xsmadd{a,m}dp */
	74	}
	75
	76	float
	77	normal_fmaf (float b, float c, float d)
	78	{
	79	return (b * c) + d; /* fmadds */
	80	}
81
82	#ifndef SIZE
83	#define SIZE 1024
84	#endif
85
86	double vda[SIZE] __attribute__((__aligned__(32)));
87	double vdb[SIZE] __attribute__((__aligned__(32)));
88	double vdc[SIZE] __attribute__((__aligned__(32)));
89	double vdd[SIZE] __attribute__((__aligned__(32)));
90
91	float vfa[SIZE] __attribute__((__aligned__(32)));
92	float vfb[SIZE] __attribute__((__aligned__(32)));
93	float vfc[SIZE] __attribute__((__aligned__(32)));
94	float vfd[SIZE] __attribute__((__aligned__(32)));
95
96	void
97	vector_fma (void)
98	{
99	int i;
100
101	for (i = 0; i < SIZE; i++)
102	vda[i] = __builtin_fma (vdb[i], vdc[i], vdd[i]); /* xvmadd{a,m}dp */
103	}
104
105	void
106	vector_fms (void)
107	{
108	int i;
109
110	for (i = 0; i < SIZE; i++)
111	vda[i] = __builtin_fma (vdb[i], vdc[i], -vdd[i]); /* xvmsub{a,m}dp */
112	}
113
114	void
115	vector_fnma (void)
116	{
117	int i;
118
119	for (i = 0; i < SIZE; i++)
120	vda[i] = - __builtin_fma (vdb[i], vdc[i], vdd[i]); /* xvnmadd{a,m}dp */
121	}
122
123	void
124	vector_fnms (void)
125	{
126	int i;
127
128	for (i = 0; i < SIZE; i++)
129	vda[i] = - __builtin_fma (vdb[i], vdc[i], -vdd[i]); /* xvnmsub{a,m}dp */
130	}
131
132	void
133	vector_fmaf (void)
134	{
135	int i;
136
137	for (i = 0; i < SIZE; i++)
138	vfa[i] = __builtin_fmaf (vfb[i], vfc[i], vfd[i]); /* xvmadd{a,m}sp */
139	}
140
141	void
142	vector_fmsf (void)
143	{
144	int i;
145
146	for (i = 0; i < SIZE; i++)
147	vfa[i] = __builtin_fmaf (vfb[i], vfc[i], -vfd[i]); /* xvmsub{a,m}sp */
148	}
149
150	void
151	vector_fnmaf (void)
152	{
153	int i;
154
155	for (i = 0; i < SIZE; i++)
156	vfa[i] = - __builtin_fmaf (vfb[i], vfc[i], vfd[i]); /* xvnmadd{a,m}sp */
157	}
158
159	void
160	vector_fnmsf (void)
161	{
162	int i;
163
164	for (i = 0; i < SIZE; i++)
165	vfa[i] = - __builtin_fmaf (vfb[i], vfc[i], -vfd[i]); /* xvnmsub{a,m}sp */
166	}
167
168	void
169	vnormal_fma (void)
170	{
171	int i;
172
173	for (i = 0; i < SIZE; i++)
174	vda[i] = (vdb[i] * vdc[i]) + vdd[i]; /* xvmadd{a,m}dp */
175	}
176
177	void
178	vnormal_fmaf (void)
179	{
180	int i;
181
182	for (i = 0; i < SIZE; i++)
183	vfa[i] = (vfb[i] * vfc[i]) + vfd[i]; /* xvmadd{a,m}sp */
184	}