L4B_loop:
ld1 {S0.16b,S1.16b,S2.16b,S3.16b},[SRC],#64
- AESD_ROUND_4B(S0,S1,S2,S3,K0)
- AESD_ROUND_4B(S0,S1,S2,S3,K1)
- AESD_ROUND_4B(S0,S1,S2,S3,K2)
- AESD_ROUND_4B(S0,S1,S2,S3,K3)
- AESD_ROUND_4B(S0,S1,S2,S3,K4)
- AESD_ROUND_4B(S0,S1,S2,S3,K5)
- AESD_ROUND_4B(S0,S1,S2,S3,K6)
- AESD_ROUND_4B(S0,S1,S2,S3,K7)
+ AESD_ROUND_4B(S0,S1,S2,S3,K10)
+ AESD_ROUND_4B(S0,S1,S2,S3,K9)
AESD_ROUND_4B(S0,S1,S2,S3,K8)
- AESD_LAST_ROUND_4B(S0,S1,S2,S3,K9,K10)
+ AESD_ROUND_4B(S0,S1,S2,S3,K7)
+ AESD_ROUND_4B(S0,S1,S2,S3,K6)
+ AESD_ROUND_4B(S0,S1,S2,S3,K5)
+ AESD_ROUND_4B(S0,S1,S2,S3,K4)
+ AESD_ROUND_4B(S0,S1,S2,S3,K3)
+ AESD_ROUND_4B(S0,S1,S2,S3,K2)
+ AESD_LAST_ROUND_4B(S0,S1,S2,S3,K1,K0)
st1 {S0.16b,S1.16b,S2.16b,S3.16b},[DST],#64
L1B_loop:
ld1 {S0.16b},[SRC],#16
- AESD_ROUND_1B(S0,K0)
- AESD_ROUND_1B(S0,K1)
- AESD_ROUND_1B(S0,K2)
- AESD_ROUND_1B(S0,K3)
- AESD_ROUND_1B(S0,K4)
- AESD_ROUND_1B(S0,K5)
- AESD_ROUND_1B(S0,K6)
- AESD_ROUND_1B(S0,K7)
+ AESD_ROUND_1B(S0,K10)
+ AESD_ROUND_1B(S0,K9)
AESD_ROUND_1B(S0,K8)
- AESD_LAST_ROUND_1B(S0,K9,K10)
+ AESD_ROUND_1B(S0,K7)
+ AESD_ROUND_1B(S0,K6)
+ AESD_ROUND_1B(S0,K5)
+ AESD_ROUND_1B(S0,K4)
+ AESD_ROUND_1B(S0,K3)
+ AESD_ROUND_1B(S0,K2)
+ AESD_LAST_ROUND_1B(S0,K1,K0)
st1 {S0.16b},[DST],#16
L4B_loop:
ld1 {S0.16b,S1.16b,S2.16b,S3.16b},[SRC],#64
- AESD_ROUND_4B(S0,S1,S2,S3,K0)
- AESD_ROUND_4B(S0,S1,S2,S3,K1)
- AESD_ROUND_4B(S0,S1,S2,S3,K2)
- AESD_ROUND_4B(S0,S1,S2,S3,K3)
- AESD_ROUND_4B(S0,S1,S2,S3,K4)
- AESD_ROUND_4B(S0,S1,S2,S3,K5)
- AESD_ROUND_4B(S0,S1,S2,S3,K6)
- AESD_ROUND_4B(S0,S1,S2,S3,K7)
- AESD_ROUND_4B(S0,S1,S2,S3,K8)
- AESD_ROUND_4B(S0,S1,S2,S3,K9)
+ AESD_ROUND_4B(S0,S1,S2,S3,K12)
+ AESD_ROUND_4B(S0,S1,S2,S3,K11)
AESD_ROUND_4B(S0,S1,S2,S3,K10)
- AESD_LAST_ROUND_4B(S0,S1,S2,S3,K11,K12)
+ AESD_ROUND_4B(S0,S1,S2,S3,K9)
+ AESD_ROUND_4B(S0,S1,S2,S3,K8)
+ AESD_ROUND_4B(S0,S1,S2,S3,K7)
+ AESD_ROUND_4B(S0,S1,S2,S3,K6)
+ AESD_ROUND_4B(S0,S1,S2,S3,K5)
+ AESD_ROUND_4B(S0,S1,S2,S3,K4)
+ AESD_ROUND_4B(S0,S1,S2,S3,K3)
+ AESD_ROUND_4B(S0,S1,S2,S3,K2)
+ AESD_LAST_ROUND_4B(S0,S1,S2,S3,K1,K0)
st1 {S0.16b,S1.16b,S2.16b,S3.16b},[DST],#64
L1B_loop:
ld1 {S0.16b},[SRC],#16
- AESD_ROUND_1B(S0,K0)
- AESD_ROUND_1B(S0,K1)
- AESD_ROUND_1B(S0,K2)
- AESD_ROUND_1B(S0,K3)
- AESD_ROUND_1B(S0,K4)
- AESD_ROUND_1B(S0,K5)
- AESD_ROUND_1B(S0,K6)
- AESD_ROUND_1B(S0,K7)
- AESD_ROUND_1B(S0,K8)
- AESD_ROUND_1B(S0,K9)
+ AESD_ROUND_1B(S0,K12)
+ AESD_ROUND_1B(S0,K11)
AESD_ROUND_1B(S0,K10)
- AESD_LAST_ROUND_1B(S0,K11,K12)
+ AESD_ROUND_1B(S0,K9)
+ AESD_ROUND_1B(S0,K8)
+ AESD_ROUND_1B(S0,K7)
+ AESD_ROUND_1B(S0,K6)
+ AESD_ROUND_1B(S0,K5)
+ AESD_ROUND_1B(S0,K4)
+ AESD_ROUND_1B(S0,K3)
+ AESD_ROUND_1B(S0,K2)
+ AESD_LAST_ROUND_1B(S0,K1,K0)
st1 {S0.16b},[DST],#16
L4B_loop:
ld1 {S0.16b,S1.16b,S2.16b,S3.16b},[SRC],#64
- AESD_ROUND_4B(S0,S1,S2,S3,K0)
- AESD_ROUND_4B(S0,S1,S2,S3,K1)
- AESD_ROUND_4B(S0,S1,S2,S3,K2)
- AESD_ROUND_4B(S0,S1,S2,S3,K3)
- AESD_ROUND_4B(S0,S1,S2,S3,K4)
- AESD_ROUND_4B(S0,S1,S2,S3,K5)
- AESD_ROUND_4B(S0,S1,S2,S3,K6)
- AESD_ROUND_4B(S0,S1,S2,S3,K7)
- AESD_ROUND_4B(S0,S1,S2,S3,K8)
- AESD_ROUND_4B(S0,S1,S2,S3,K9)
- AESD_ROUND_4B(S0,S1,S2,S3,K10)
- AESD_ROUND_4B(S0,S1,S2,S3,K11)
+ AESD_ROUND_4B(S0,S1,S2,S3,K14)
+ AESD_ROUND_4B(S0,S1,S2,S3,K13)
AESD_ROUND_4B(S0,S1,S2,S3,K12)
- AESD_LAST_ROUND_4B(S0,S1,S2,S3,K13,K14)
+ AESD_ROUND_4B(S0,S1,S2,S3,K11)
+ AESD_ROUND_4B(S0,S1,S2,S3,K10)
+ AESD_ROUND_4B(S0,S1,S2,S3,K9)
+ AESD_ROUND_4B(S0,S1,S2,S3,K8)
+ AESD_ROUND_4B(S0,S1,S2,S3,K7)
+ AESD_ROUND_4B(S0,S1,S2,S3,K6)
+ AESD_ROUND_4B(S0,S1,S2,S3,K5)
+ AESD_ROUND_4B(S0,S1,S2,S3,K4)
+ AESD_ROUND_4B(S0,S1,S2,S3,K3)
+ AESD_ROUND_4B(S0,S1,S2,S3,K2)
+ AESD_LAST_ROUND_4B(S0,S1,S2,S3,K1,K0)
st1 {S0.16b,S1.16b,S2.16b,S3.16b},[DST],#64
L1B_loop:
ld1 {S0.16b},[SRC],#16
- AESD_ROUND_1B(S0,K0)
- AESD_ROUND_1B(S0,K1)
- AESD_ROUND_1B(S0,K2)
- AESD_ROUND_1B(S0,K3)
- AESD_ROUND_1B(S0,K4)
- AESD_ROUND_1B(S0,K5)
- AESD_ROUND_1B(S0,K6)
- AESD_ROUND_1B(S0,K7)
- AESD_ROUND_1B(S0,K8)
- AESD_ROUND_1B(S0,K9)
- AESD_ROUND_1B(S0,K10)
- AESD_ROUND_1B(S0,K11)
+ AESD_ROUND_1B(S0,K14)
+ AESD_ROUND_1B(S0,K13)
AESD_ROUND_1B(S0,K12)
- AESD_LAST_ROUND_1B(S0,K13,K14)
+ AESD_ROUND_1B(S0,K11)
+ AESD_ROUND_1B(S0,K10)
+ AESD_ROUND_1B(S0,K9)
+ AESD_ROUND_1B(S0,K8)
+ AESD_ROUND_1B(S0,K7)
+ AESD_ROUND_1B(S0,K6)
+ AESD_ROUND_1B(S0,K5)
+ AESD_ROUND_1B(S0,K4)
+ AESD_ROUND_1B(S0,K3)
+ AESD_ROUND_1B(S0,K2)
+ AESD_LAST_ROUND_1B(S0,K1,K0)
st1 {S0.16b},[DST],#16