powerpc: Remove assembler workarounds

author Andreas Schwab <schwab@suse.de>

Thu, 5 Jun 2025 08:24:46 +0000 (10:24 +0200)

committer Andreas Schwab <schwab@suse.de>

Wed, 18 Jun 2025 07:29:10 +0000 (09:29 +0200)
author Andreas Schwab <schwab@suse.de>
Thu, 5 Jun 2025 08:24:46 +0000 (10:24 +0200)
committer Andreas Schwab <schwab@suse.de>
Wed, 18 Jun 2025 07:29:10 +0000 (09:29 +0200)
diff --git a/sysdeps/powerpc/powerpc64/le/power10/memcmp.S b/sysdeps/powerpc/powerpc64/le/power10/memcmp.S

index f32dc3815fa88eeb2957ad062653852eacc9cd6a..9c1a41b80544751106d53fa02034e782fada7ce1 100644 (file)
--- a/sysdeps/powerpc/powerpc64/le/power10/memcmp.S
+++ b/sysdeps/powerpc/powerpc64/le/power10/memcmp.S
@@ -18,26 +18,10 @@
  
  #include <sysdep.h>
  
-/* TODO: Replace macros by the actual instructions when minimum binutils becomes
-   >= 2.35.  This is used to keep compatibility with older versions.  */
-#define VEXTRACTBM(rt,vrb)      \
-       .long(((4)<<(32-6))      \
-             | ((rt)<<(32-11))  \
-             | ((8)<<(32-16))   \
-             | ((vrb)<<(32-21)) \
-             | 1602)
-
-#define LXVP(xtp,dq,ra)                           \
-       .long(((6)<<(32-6))                \
-             | ((((xtp)-32)>>1)<<(32-10)) \
-             | ((1)<<(32-11))             \
-             | ((ra)<<(32-16))            \
-             | dq)
-
  /* Compare 32 bytes.  */
  #define COMPARE_32(vr1,vr2,offset,tail_1,tail_2)\
-       LXVP(32+vr1,offset,r3);         \
-       LXVP(32+vr2,offset,r4);         \
+       lxvp      32+vr1,offset(r3);    \
+       lxvp      32+vr2,offset(r4);    \
         vcmpneb.  v5,vr1+1,vr2+1;       \
         bne       cr6,L(tail_2);        \
         vcmpneb.  v4,vr1,vr2;           \
diff --git a/sysdeps/powerpc/powerpc64/le/power10/strlen.S b/sysdeps/powerpc/powerpc64/le/power10/strlen.S

index 4985a9291bd5c36d7c94ce05a6f25fefa18b970c..74f572c2c6de54691b86374c12767e83f725d676 100644 (file)
--- a/sysdeps/powerpc/powerpc64/le/power10/strlen.S
+++ b/sysdeps/powerpc/powerpc64/le/power10/strlen.S
@@ -63,22 +63,6 @@
         blr
  #endif /* USE_AS_RAWMEMCHR */
  
-/* TODO: Replace macros by the actual instructions when minimum binutils becomes
-   >= 2.35.  This is used to keep compatibility with older versions.  */
-#define VEXTRACTBM(rt,vrb)      \
-       .long(((4)<<(32-6))      \
-             | ((rt)<<(32-11))  \
-             | ((8)<<(32-16))   \
-             | ((vrb)<<(32-21)) \
-             | 1602)
-
-#define LXVP(xtp,dq,ra)                   \
-       .long(((6)<<(32-6))                \
-             | ((((xtp)-32)>>1)<<(32-10)) \
-             | ((1)<<(32-11))             \
-             | ((ra)<<(32-16))            \
-             | dq)
-
  #define CHECK16(vreg,offset,addr,label) \
         lxv       vreg+32,offset(addr); \
         vcmpequb. vreg,vreg,v18;        \
@@ -88,8 +72,8 @@
     of bytes already checked.  */
  #define CHECK64(offset,addr,label)         \
         li        r6,offset;                \
-       LXVP(v4+32,offset,addr);            \
-       LXVP(v6+32,offset+32,addr);         \
+       lxvp      v4+32,offset(addr);       \
+       lxvp      v6+32,offset+32(addr);    \
         RAWMEMCHR_SUBTRACT_VECTORS;         \
         vminub    v14,v4,v5;                \
         vminub    v15,v6,v7;                \
@@ -234,10 +218,10 @@ L(tail_64b):
         add     r5,r5,r6
  
         /* Extract first bit of each byte.  */
-       VEXTRACTBM(r7,v1)
-       VEXTRACTBM(r8,v2)
-       VEXTRACTBM(r9,v3)
-       VEXTRACTBM(r10,v4)
+       vextractbm r7,v1
+       vextractbm r8,v2
+       vextractbm r9,v3
+       vextractbm r10,v4
  
         /* Shift each value into their corresponding position.  */
         sldi      r8,r8,16
diff --git a/sysdeps/powerpc/powerpc64/le/power9/strcmp.S b/sysdeps/powerpc/powerpc64/le/power9/strcmp.S

index 83b21c65c3ccc9a8b1037150fbfdd6c8875c1983..f0cde8171d82f09e989d9b4186125a97726437c3 100644 (file)
--- a/sysdeps/powerpc/powerpc64/le/power9/strcmp.S
+++ b/sysdeps/powerpc/powerpc64/le/power9/strcmp.S
@@ -28,21 +28,6 @@
     The implementation uses unaligned doubleword access for first 32 bytes
     as in POWER8 patch and uses vectorised loops after that.  */
  
-/* TODO: Change this to actual instructions when minimum binutils is upgraded
-   to 2.27.  Macros are defined below for these newer instructions in order
-   to maintain compatibility.  */
-#define VCTZLSBB(r,v) .long (0x10010602 | ((r)<<(32-11)) | ((v)<<(32-21)))
-
-#define VEXTUBRX(t,a,b) .long (0x1000070d \
-                               | ((t)<<(32-11))  \
-                               | ((a)<<(32-16))  \
-                               | ((b)<<(32-21)) )
-
-#define VCMPNEZB(t,a,b) .long (0x10000507 \
-                               | ((t)<<(32-11))  \
-                               | ((a)<<(32-16))  \
-                               | ((b)<<(32-21)) )
-
  /* Get 16 bytes for unaligned case.
     reg1: Vector to hold next 16 bytes.
     reg2: Address to read from.
@@ -61,10 +46,7 @@
  2: \
         vperm   reg1, v9, reg1, reg3;
  
-/* TODO: change this to .machine power9 when the minimum required binutils
-   allows it.  */
-
-       .machine  power7
+       .machine  power9
  ENTRY_TOCLESS (STRCMP, 4)
         li      r0, 0
  
@@ -116,7 +98,7 @@ L(align):
         /* Both s1 and s2 are unaligned.  */
         GET16BYTES(v4, r7, v10)
         GET16BYTES(v5, r4, v6)
-       VCMPNEZB(v7, v5, v4)
+       vcmpnezb. v7, v5, v4
         beq     cr6, L(match)
         b       L(different)
  
@@ -136,28 +118,28 @@ L(match):
  L(s1_align):
         lvx     v4, r7, r0
         GET16BYTES(v5, r4, v6)
-       VCMPNEZB(v7, v5, v4)
+       vcmpnezb. v7, v5, v4
         addi    r7, r7, 16
         addi    r4, r4, 16
         bne     cr6, L(different)
  
         lvx     v4, r7, r0
         GET16BYTES(v5, r4, v6)
-       VCMPNEZB(v7, v5, v4)
+       vcmpnezb. v7, v5, v4
         addi    r7, r7, 16
         addi    r4, r4, 16
         bne     cr6, L(different)
  
         lvx     v4, r7, r0
         GET16BYTES(v5, r4, v6)
-       VCMPNEZB(v7, v5, v4)
+       vcmpnezb. v7, v5, v4
         addi    r7, r7, 16
         addi    r4, r4, 16
         bne     cr6, L(different)
  
         lvx     v4, r7, r0
         GET16BYTES(v5, r4, v6)
-       VCMPNEZB(v7, v5, v4)
+       vcmpnezb. v7, v5, v4
         addi    r7, r7, 16
         addi    r4, r4, 16
         beq     cr6, L(s1_align)
@@ -167,37 +149,37 @@ L(s1_align):
  L(aligned):
         lvx     v4, 0, r7
         lvx     v5, 0, r4
-       VCMPNEZB(v7, v5, v4)
+       vcmpnezb. v7, v5, v4
         addi    r7, r7, 16
         addi    r4, r4, 16
         bne     cr6, L(different)
  
         lvx     v4, 0, r7
         lvx     v5, 0, r4
-       VCMPNEZB(v7, v5, v4)
+       vcmpnezb. v7, v5, v4
         addi    r7, r7, 16
         addi    r4, r4, 16
         bne     cr6, L(different)
  
         lvx     v4, 0, r7
         lvx     v5, 0, r4
-       VCMPNEZB(v7, v5, v4)
+       vcmpnezb. v7, v5, v4
         addi    r7, r7, 16
         addi    r4, r4, 16
         bne     cr6, L(different)
  
         lvx     v4, 0, r7
         lvx     v5, 0, r4
-       VCMPNEZB(v7, v5, v4)
+       vcmpnezb. v7, v5, v4
         addi    r7, r7, 16
         addi    r4, r4, 16
         beq     cr6, L(aligned)
  
         /* Calculate and return the difference.  */
  L(different):
-       VCTZLSBB(r6, v7)
-       VEXTUBRX(r5, r6, v4)
-       VEXTUBRX(r4, r6, v5)
+       vctzlsbb r6, v7
+       vextubrx r5, r6, v4
+       vextubrx r4, r6, v5
         subf    r3, r4, r5
         extsw   r3, r3
         blr
diff --git a/sysdeps/powerpc/powerpc64/le/power9/strncmp.S b/sysdeps/powerpc/powerpc64/le/power9/strncmp.S

index 60c74ab6037e1972360a3b146f76228ffc511383..5a25f9490085be5cd69febd835e4b17db961586c 100644 (file)
--- a/sysdeps/powerpc/powerpc64/le/power9/strncmp.S
+++ b/sysdeps/powerpc/powerpc64/le/power9/strncmp.S
@@ -29,21 +29,6 @@
  # define STRNCMP strncmp
  #endif
  
-/* TODO: Change this to actual instructions when minimum binutils is upgraded
-   to 2.27.  Macros are defined below for these newer instructions in order
-   to maintain compatibility.  */
-#define VCTZLSBB(r,v) .long (0x10010602 | ((r)<<(32-11)) | ((v)<<(32-21)))
-
-#define VEXTUBRX(t,a,b) .long (0x1000070d \
-                               | ((t)<<(32-11))  \
-                               | ((a)<<(32-16))  \
-                               | ((b)<<(32-21)) )
-
-#define VCMPNEZB(t,a,b) .long (0x10000507 \
-                               | ((t)<<(32-11))  \
-                               | ((a)<<(32-16))  \
-                               | ((b)<<(32-21)) )
-
  /* Get 16 bytes for unaligned case.
     reg1: Vector to hold next 16 bytes.
     reg2: Address to read from.
@@ -64,9 +49,7 @@
  2: \
         vperm   reg1, v9, reg1, reg3;
  
-/* TODO: change this to .machine power9 when minimum binutils
-   is upgraded to 2.27.  */
-       .machine  power7
+       .machine  power9
  ENTRY_TOCLESS (STRNCMP, 4)
         /* Check if size is 0.  */
         cmpdi   cr0, r5, 0
@@ -163,7 +146,7 @@ L(align):
         clrldi  r6, r3, 60
         subfic  r11, r6, 16
         GET16BYTES(v4, r3, v10)
-       VCMPNEZB(v7, v5, v4)
+       vcmpnezb. v7, v5, v4
         beq     cr6, L(match)
         b       L(different)
  
@@ -186,7 +169,7 @@ L(match):
  L(s1_align):
         lvx     v4, 0, r3
         GET16BYTES(v5, r4, v6)
-       VCMPNEZB(v7, v5, v4)
+       vcmpnezb. v7, v5, v4
         bne     cr6, L(different)
         cmpldi  cr7, r5, 16
         ble     cr7, L(ret0)
@@ -196,7 +179,7 @@ L(s1_align):
  
         lvx     v4, 0, r3
         GET16BYTES(v5, r4, v6)
-       VCMPNEZB(v7, v5, v4)
+       vcmpnezb. v7, v5, v4
         bne     cr6, L(different)
         cmpldi  cr7, r5, 16
         ble     cr7, L(ret0)
@@ -206,7 +189,7 @@ L(s1_align):
  
         lvx     v4, 0, r3
         GET16BYTES(v5, r4, v6)
-       VCMPNEZB(v7, v5, v4)
+       vcmpnezb. v7, v5, v4
         bne     cr6, L(different)
         cmpldi  cr7, r5, 16
         ble     cr7, L(ret0)
@@ -216,7 +199,7 @@ L(s1_align):
  
         lvx     v4, 0, r3
         GET16BYTES(v5, r4, v6)
-       VCMPNEZB(v7, v5, v4)
+       vcmpnezb. v7, v5, v4
         bne     cr6, L(different)
         cmpldi  cr7, r5, 16
         ble     cr7, L(ret0)
@@ -228,7 +211,7 @@ L(s1_align):
  L(aligned):
         lvx     v4, 0, r3
         lvx     v5, 0, r4
-       VCMPNEZB(v7, v5, v4)
+       vcmpnezb. v7, v5, v4
         bne     cr6, L(different)
         cmpldi  cr7, r5, 16
         ble     cr7, L(ret0)
@@ -238,7 +221,7 @@ L(aligned):
  
         lvx     v4, 0, r3
         lvx     v5, 0, r4
-       VCMPNEZB(v7, v5, v4)
+       vcmpnezb. v7, v5, v4
         bne     cr6, L(different)
         cmpldi  cr7, r5, 16
         ble     cr7, L(ret0)
@@ -248,7 +231,7 @@ L(aligned):
  
         lvx     v4, 0, r3
         lvx     v5, 0, r4
-       VCMPNEZB(v7, v5, v4)
+       vcmpnezb. v7, v5, v4
         bne     cr6, L(different)
         cmpldi  cr7, r5, 16
         ble     cr7, L(ret0)
@@ -258,7 +241,7 @@ L(aligned):
  
         lvx     v4, 0, r3
         lvx     v5, 0, r4
-       VCMPNEZB(v7, v5, v4)
+       vcmpnezb. v7, v5, v4
         bne     cr6, L(different)
         cmpldi  cr7, r5, 16
         ble     cr7, L(ret0)
@@ -268,11 +251,11 @@ L(aligned):
         b       L(aligned)
         /* Calculate and return the difference.  */
  L(different):
-       VCTZLSBB(r6, v7)
+       vctzlsbb r6, v7
         cmplw   cr7, r5, r6
         ble     cr7, L(ret0)
-       VEXTUBRX(r5, r6, v4)
-       VEXTUBRX(r4, r6, v5)
+       vextubrx r5, r6, v4
+       vextubrx r4, r6, v5
         subf    r3, r4, r5
         extsw   r3, r3
         blr
author	Andreas Schwab <schwab@suse.de>
	Thu, 5 Jun 2025 08:24:46 +0000 (10:24 +0200)
committer	Andreas Schwab <schwab@suse.de>
	Wed, 18 Jun 2025 07:29:10 +0000 (09:29 +0200)
sysdeps/powerpc/powerpc64/le/power10/memcmp.S		patch \| blob \| blame \| history
sysdeps/powerpc/powerpc64/le/power10/strlen.S		patch \| blob \| blame \| history
sysdeps/powerpc/powerpc64/le/power9/strcmp.S		patch \| blob \| blame \| history
sysdeps/powerpc/powerpc64/le/power9/strncmp.S		patch \| blob \| blame \| history