[thirdparty/openssl.git] / crypto / ec / curve448 / arch_32 / f_impl.c

/*
 * Copyright 2017-2021 The OpenSSL Project Authors. All Rights Reserved.
 * Copyright 2014 Cryptography Research, Inc.
 *
 * Licensed under the Apache License 2.0 (the "License").  You may not use
 * this file except in compliance with the License.  You can obtain a copy
 * in the file LICENSE in the source distribution or at
 * https://www.openssl.org/source/license.html
 *
 * Originally written by Mike Hamburg
 */

#include "../field.h"

void gf_mul(gf_s * RESTRICT cs, const gf as, const gf bs)
{
    const uint32_t *a = as->limb, *b = bs->limb;
    uint32_t *c = cs->limb;
    uint64_t accum0 = 0, accum1 = 0, accum2 = 0;
    uint32_t mask = (1 << 28) - 1;
    uint32_t aa[8], bb[8];
    int i, j;

    for (i = 0; i < 8; i++) {
        aa[i] = a[i] + a[i + 8];
        bb[i] = b[i] + b[i + 8];
    }

    for (j = 0; j < 8; j++) {
        accum2 = 0;
        for (i = 0; i < j + 1; i++) {
            accum2 += widemul(a[j - i], b[i]);
            accum1 += widemul(aa[j - i], bb[i]);
            accum0 += widemul(a[8 + j - i], b[8 + i]);
        }
        accum1 -= accum2;
        accum0 += accum2;
        accum2 = 0;
        for (i = j + 1; i < 8; i++) {
            accum0 -= widemul(a[8 + j - i], b[i]);
            accum2 += widemul(aa[8 + j - i], bb[i]);
            accum1 += widemul(a[16 + j - i], b[8 + i]);
        }
        accum1 += accum2;
        accum0 += accum2;
        c[j] = ((uint32_t)(accum0)) & mask;
        c[j + 8] = ((uint32_t)(accum1)) & mask;
        accum0 >>= 28;
        accum1 >>= 28;
    }

    accum0 += accum1;
    accum0 += c[8];
    accum1 += c[0];
    c[8] = ((uint32_t)(accum0)) & mask;
    c[0] = ((uint32_t)(accum1)) & mask;

    accum0 >>= 28;
    accum1 >>= 28;
    c[9] += ((uint32_t)(accum0));
    c[1] += ((uint32_t)(accum1));
}

void gf_mulw_unsigned(gf_s * RESTRICT cs, const gf as, uint32_t b)
{
    const uint32_t *a = as->limb;
    uint32_t *c = cs->limb;
    uint64_t accum0 = 0, accum8 = 0;
    uint32_t mask = (1 << 28) - 1;
    int i;

    assert(b <= mask);

    for (i = 0; i < 8; i++) {
        accum0 += widemul(b, a[i]);
        accum8 += widemul(b, a[i + 8]);
        c[i] = accum0 & mask;
        accum0 >>= 28;
        c[i + 8] = accum8 & mask;
        accum8 >>= 28;
    }

    accum0 += accum8 + c[8];
    c[8] = ((uint32_t)accum0) & mask;
    c[9] += (uint32_t)(accum0 >> 28);

    accum8 += c[0];
    c[0] = ((uint32_t)accum8) & mask;
    c[1] += (uint32_t)(accum8 >> 28);
}

void gf_sqr(gf_s * RESTRICT cs, const gf as)
{
    gf_mul(cs, as, as);         /* Performs better with a dedicated square */
}
Commit	Line	Data
1308e022	1	/*
3c2bdd7d	2	* Copyright 2017-2021 The OpenSSL Project Authors. All Rights Reserved.
1308e022 MC	3	* Copyright 2014 Cryptography Research, Inc.
1308e022 MC	4	*
a7f182b7	5	* Licensed under the Apache License 2.0 (the "License"). You may not use
1308e022 MC	6	* this file except in compliance with the License. You can obtain a copy
	7	* in the file LICENSE in the source distribution or at
	8	* https://www.openssl.org/source/license.html
	9	*
	10	* Originally written by Mike Hamburg
7324473f MC	11	*/
7324473f MC	12
0f4286c7	13	#include "../field.h"
7324473f	14
52a9587c	15	void gf_mul(gf_s * RESTRICT cs, const gf as, const gf bs)
205fd638	16	{
7324473f MC	17	const uint32_t a = as->limb, b = bs->limb;
7324473f MC	18	uint32_t *c = cs->limb;
7324473f	19	uint64_t accum0 = 0, accum1 = 0, accum2 = 0;
205fd638	20	uint32_t mask = (1 << 28) - 1;
7324473f	21	uint32_t aa[8], bb[8];
205fd638	22	int i, j;
8d55f844	23
205fd638 MC	24	for (i = 0; i < 8; i++) {
	25	aa[i] = a[i] + a[i + 8];
	26	bb[i] = b[i] + b[i + 8];
	27	}
7324473f	28
cb5ed326 MC	29	for (j = 0; j < 8; j++) {
	30	accum2 = 0;
	31	for (i = 0; i < j + 1; i++) {
	32	accum2 += widemul(a[j - i], b[i]);
	33	accum1 += widemul(aa[j - i], bb[i]);
	34	accum0 += widemul(a[8 + j - i], b[8 + i]);
	35	}
	36	accum1 -= accum2;
	37	accum0 += accum2;
	38	accum2 = 0;
	39	for (i = j + 1; i < 8; i++) {
	40	accum0 -= widemul(a[8 + j - i], b[i]);
	41	accum2 += widemul(aa[8 + j - i], bb[i]);
	42	accum1 += widemul(a[16 + j - i], b[8 + i]);
	43	}
	44	accum1 += accum2;
	45	accum0 += accum2;
	46	c[j] = ((uint32_t)(accum0)) & mask;
	47	c[j + 8] = ((uint32_t)(accum1)) & mask;
	48	accum0 >>= 28;
	49	accum1 >>= 28;
	50	}
7324473f	51
7324473f MC	52	accum0 += accum1;
	53	accum0 += c[8];
	54	accum1 += c[0];
	55	c[8] = ((uint32_t)(accum0)) & mask;
	56	c[0] = ((uint32_t)(accum1)) & mask;
205fd638	57
7324473f MC	58	accum0 >>= 28;
	59	accum1 >>= 28;
	60	c[9] += ((uint32_t)(accum0));
	61	c[1] += ((uint32_t)(accum1));
	62	}
	63
52a9587c	64	void gf_mulw_unsigned(gf_s * RESTRICT cs, const gf as, uint32_t b)
205fd638	65	{
7324473f MC	66	const uint32_t *a = as->limb;
7324473f MC	67	uint32_t *c = cs->limb;
7324473f	68	uint64_t accum0 = 0, accum8 = 0;
205fd638	69	uint32_t mask = (1 << 28) - 1;
7324473f	70	int i;
094c071c	71
8e32ec7a	72	assert(b <= mask);
094c071c	73
cb5ed326 MC	74	for (i = 0; i < 8; i++) {
	75	accum0 += widemul(b, a[i]);
	76	accum8 += widemul(b, a[i + 8]);
	77	c[i] = accum0 & mask;
	78	accum0 >>= 28;
	79	c[i + 8] = accum8 & mask;
	80	accum8 >>= 28;
	81	}
7324473f MC	82
7324473f MC	83	accum0 += accum8 + c[8];
52a9587c MC	84	c[8] = ((uint32_t)accum0) & mask;
52a9587c MC	85	c[9] += (uint32_t)(accum0 >> 28);
7324473f MC	86
7324473f MC	87	accum8 += c[0];
52a9587c MC	88	c[0] = ((uint32_t)accum8) & mask;
52a9587c MC	89	c[1] += (uint32_t)(accum8 >> 28);
7324473f MC	90	}
7324473f MC	91
52a9587c	92	void gf_sqr(gf_s * RESTRICT cs, const gf as)
205fd638 MC	93	{
205fd638 MC	94	gf_mul(cs, as, as); /* Performs better with a dedicated square */
7324473f	95	}