target/arm: Implement FMMLA (FP8 to FP32) for AdvSIMD

author Richard Henderson <richard.henderson@linaro.org>

Tue, 9 Jun 2026 19:21:04 +0000 (12:21 -0700)

committer Peter Maydell <peter.maydell@linaro.org>

Wed, 10 Jun 2026 15:54:40 +0000 (16:54 +0100)
author Richard Henderson <richard.henderson@linaro.org>
Tue, 9 Jun 2026 19:21:04 +0000 (12:21 -0700)
committer Peter Maydell <peter.maydell@linaro.org>
Wed, 10 Jun 2026 15:54:40 +0000 (16:54 +0100)
diff --git a/target/arm/cpu-features.h b/target/arm/cpu-features.h

index 1745989bce9f714ae65c392750a3a5ed3a9cfd61..be3db5300fb19e2273baad325ad2df1e51431c9a 100644 (file)
--- a/target/arm/cpu-features.h
+++ b/target/arm/cpu-features.h
@@ -1645,6 +1645,11 @@ static inline bool isar_feature_aa64_f8dp2(const ARMISARegisters *id)
      return FIELD_EX64_IDREG(id, ID_AA64FPFR0, F8DP2);
  }
  
+static inline bool isar_feature_aa64_f8mm8(const ARMISARegisters *id)
+{
+    return FIELD_EX64_IDREG(id, ID_AA64FPFR0, F8MM8);
+}
+
  /*
   * Combinations of feature tests, for ease of use with TRANS_FEAT.
   */
diff --git a/target/arm/tcg/a64.decode b/target/arm/tcg/a64.decode

index a3e404e7feb7b19930fd1e13f0e681d82d230b33..6922e910103722e165ff3a0eb8eede7ad9d67b45 100644 (file)
--- a/target/arm/tcg/a64.decode
+++ b/target/arm/tcg/a64.decode
@@ -1227,6 +1227,8 @@ FMLALL_sb_v     0.00 1110 0.0 rm:5 110001 rn:5 rd:5 \
  FDOT_sb_v       0.00 1110 000 ..... 11111 1 ..... ..... @qrrr_s
  FDOT_hb_v       0.00 1110 010 ..... 11111 1 ..... ..... @qrrr_h
  
+FMMLA_sb        0110 1110 100 ..... 11101 1 ..... ..... @rrr_q1e0
+
  ### Advanced SIMD scalar x indexed element
  
  FMUL_si         0101 1111 00 .. .... 1001 . 0 ..... .....   @rrx_h
diff --git a/target/arm/tcg/fp8_helper.c b/target/arm/tcg/fp8_helper.c

index 065df24b84f6dfdec9e09e03bf18ff58a3b35daa..b9d4ba3b6afd835bae169d6e7f5fdaf1867fe9f2 100644 (file)
--- a/target/arm/tcg/fp8_helper.c
+++ b/target/arm/tcg/fp8_helper.c
@@ -807,3 +807,28 @@ void HELPER(gvec_fdot_idx_hb)(void *vd, void *vn, void *vm,
  
      clear_tail(vd, oprsz, simd_maxsz(desc));
  }
+
+void HELPER(gvec_fmmla_sb)(void *vd, void *vn, void *vm,
+                           CPUARMState *env, uint32_t desc)
+{
+    FP8MulContext ctx = fp8_mul_start(env, -1);
+    size_t oprsz = simd_oprsz(desc);
+    size_t nseg = oprsz / 16;
+    uint64_t *n = vn;
+    uint64_t *m = vm;
+    float32 *d = vd;
+
+    for (size_t seg = 0; seg < nseg; seg++, d += 4, n += 2, m += 2) {
+        float32 d0 = f8dotadd_s(n[0], m[0], 8, d[H4(0)], &ctx);
+        float32 d1 = f8dotadd_s(n[0], m[1], 8, d[H4(1)], &ctx);
+        float32 d2 = f8dotadd_s(n[1], m[0], 8, d[H4(2)], &ctx);
+        float32 d3 = f8dotadd_s(n[1], m[1], 8, d[H4(3)], &ctx);
+
+        d[H4(0)] = d0;
+        d[H4(1)] = d1;
+        d[H4(2)] = d2;
+        d[H4(3)] = d3;
+    }
+
+    clear_tail(vd, oprsz, simd_maxsz(desc));
+}
diff --git a/target/arm/tcg/helper-fp8-defs.h b/target/arm/tcg/helper-fp8-defs.h

index 5995d77577c26c7d80f4bdbc1e5868c9dd6a0675..3c74f02022e26df2c3a459075b6575ce3088bca4 100644 (file)
--- a/target/arm/tcg/helper-fp8-defs.h
+++ b/target/arm/tcg/helper-fp8-defs.h
@@ -35,3 +35,5 @@ DEF_HELPER_FLAGS_5(gvec_fdot_idx_sb, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, env,
  
  DEF_HELPER_FLAGS_5(gvec_fdot_hb, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, env, i32)
  DEF_HELPER_FLAGS_5(gvec_fdot_idx_hb, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, env, i32)
+
+DEF_HELPER_FLAGS_5(gvec_fmmla_sb, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, env, i32)
diff --git a/target/arm/tcg/translate-a64.c b/target/arm/tcg/translate-a64.c

index e4c539fb1802b869af7f1d7bef4ae7a79491c956..ffe59b94718ced1cb1ab50d7e8953ed7822d4dc9 100644 (file)
--- a/target/arm/tcg/translate-a64.c
+++ b/target/arm/tcg/translate-a64.c
@@ -7515,6 +7515,7 @@ static bool do_f8dot(DisasContext *s, arg_qrrr_e *a,
  
  TRANS_FEAT(FDOT_sb_v, aa64_f8dp4, do_f8dot, a, gen_helper_gvec_fdot_sb)
  TRANS_FEAT(FDOT_hb_v, aa64_f8dp2, do_f8dot, a, gen_helper_gvec_fdot_hb)
+TRANS_FEAT(FMMLA_sb, aa64_f8mm8, do_f8dot, a, gen_helper_gvec_fmmla_sb)
  
  static bool do_f8dot_idx(DisasContext *s, arg_qrrx_e *a,
                           gen_helper_gvec_3_ptr *fn)
author	Richard Henderson <richard.henderson@linaro.org>
	Tue, 9 Jun 2026 19:21:04 +0000 (12:21 -0700)
committer	Peter Maydell <peter.maydell@linaro.org>
	Wed, 10 Jun 2026 15:54:40 +0000 (16:54 +0100)
target/arm/cpu-features.h		patch \| blob \| blame \| history
target/arm/tcg/a64.decode		patch \| blob \| blame \| history
target/arm/tcg/fp8_helper.c		patch \| blob \| blame \| history
target/arm/tcg/helper-fp8-defs.h		patch \| blob \| blame \| history
target/arm/tcg/translate-a64.c		patch \| blob \| blame \| history