optimize ossl_sm4_set_key speed

author zhangzhilei <zhangzhilei@360.cn>

Sat, 24 Sep 2022 02:32:36 +0000 (10:32 +0800)

committer Hugo Landau <hlandau@openssl.org>

Thu, 13 Oct 2022 12:20:24 +0000 (13:20 +0100)
author zhangzhilei <zhangzhilei@360.cn>
Sat, 24 Sep 2022 02:32:36 +0000 (10:32 +0800)
committer Hugo Landau <hlandau@openssl.org>
Thu, 13 Oct 2022 12:20:24 +0000 (13:20 +0100)
diff --git a/crypto/sm4/sm4.c b/crypto/sm4/sm4.c

index f9d659f0643b49734c38663e0c7885074b8c8e0d..4c58c25fa711d572a13816782f22a05d826c8893 100644 (file)
--- a/crypto/sm4/sm4.c
+++ b/crypto/sm4/sm4.c
@@ -241,7 +241,7 @@ static ossl_inline void store_u32_be(uint32_t v, uint8_t *b)
      b[3] = (uint8_t)(v);
  }
  
-static ossl_inline uint32_t SM4_T_slow(uint32_t X)
+static ossl_inline uint32_t SM4_T_non_lin_sub(uint32_t X)
  {
      uint32_t t = 0;
  
@@ -250,6 +250,13 @@ static ossl_inline uint32_t SM4_T_slow(uint32_t X)
      t |= ((uint32_t)SM4_S[(uint8_t)(X >> 8)]) << 8;
      t |= SM4_S[(uint8_t)X];
  
+    return t;
+}
+
+static ossl_inline uint32_t SM4_T_slow(uint32_t X)
+{
+    uint32_t t = SM4_T_non_lin_sub(X);
+
      /*
       * L linear transform
       */
@@ -264,6 +271,13 @@ static ossl_inline uint32_t SM4_T(uint32_t X)
             SM4_SBOX_T3[(uint8_t)X];
  }
  
+static ossl_inline uint32_t SM4_key_sub(uint32_t X)
+{
+    uint32_t t = SM4_T_non_lin_sub(X);
+
+    return t ^ rotl(t, 13) ^ rotl(t, 23);
+}
+
  int ossl_sm4_set_key(const uint8_t *key, SM4_KEY *ks)
  {
      /*
@@ -294,18 +308,15 @@ int ossl_sm4_set_key(const uint8_t *key, SM4_KEY *ks)
      K[2] = load_u32_be(key, 2) ^ FK[2];
      K[3] = load_u32_be(key, 3) ^ FK[3];
  
-    for (i = 0; i != SM4_KEY_SCHEDULE; ++i) {
-        uint32_t X = K[(i + 1) % 4] ^ K[(i + 2) % 4] ^ K[(i + 3) % 4] ^ CK[i];
-        uint32_t t = 0;
-
-        t |= ((uint32_t)SM4_S[(uint8_t)(X >> 24)]) << 24;
-        t |= ((uint32_t)SM4_S[(uint8_t)(X >> 16)]) << 16;
-        t |= ((uint32_t)SM4_S[(uint8_t)(X >> 8)]) << 8;
-        t |= SM4_S[(uint8_t)X];
-
-        t = t ^ rotl(t, 13) ^ rotl(t, 23);
-        K[i % 4] ^= t;
-        ks->rk[i] = K[i % 4];
+    for (i = 0; i < SM4_KEY_SCHEDULE; i = i + 4) {
+        K[0] ^= SM4_key_sub(K[1] ^ K[2] ^ K[3] ^ CK[i]);
+        K[1] ^= SM4_key_sub(K[2] ^ K[3] ^ K[0] ^ CK[i + 1]);
+        K[2] ^= SM4_key_sub(K[3] ^ K[0] ^ K[1] ^ CK[i + 2]);
+        K[3] ^= SM4_key_sub(K[0] ^ K[1] ^ K[2] ^ CK[i + 3]);
+        ks->rk[i    ] = K[0];
+        ks->rk[i + 1] = K[1];
+        ks->rk[i + 2] = K[2];
+        ks->rk[i + 3] = K[3];
      }
  
      return 1;
author	zhangzhilei <zhangzhilei@360.cn>
	Sat, 24 Sep 2022 02:32:36 +0000 (10:32 +0800)
committer	Hugo Landau <hlandau@openssl.org>
	Thu, 13 Oct 2022 12:20:24 +0000 (13:20 +0100)