powerpc: Replace lxvd2x/stxvd2x with lvx/stvx in P7's memcpy/memmove

author Rajalakshmi Srinivasaraghavan <raji@linux.vnet.ibm.com>

Tue, 21 Nov 2017 17:02:20 +0000 (22:32 +0530)

committer Rajalakshmi Srinivasaraghavan <raji@linux.vnet.ibm.com>

Tue, 21 Nov 2017 17:02:20 +0000 (22:32 +0530)
author Rajalakshmi Srinivasaraghavan <raji@linux.vnet.ibm.com>
Tue, 21 Nov 2017 17:02:20 +0000 (22:32 +0530)
committer Rajalakshmi Srinivasaraghavan <raji@linux.vnet.ibm.com>
Tue, 21 Nov 2017 17:02:20 +0000 (22:32 +0530)
diff --git a/ChangeLog b/ChangeLog

index eb9204d97224374fcd045d75cb62ff5166bd2e5e..c72c2396205e075b33588738636d2c8d4341c233 100644 (file)
--- a/ChangeLog
+++ b/ChangeLog
@@ -1,3 +1,9 @@
+2017-11-21  Rajalakshmi Srinivasaraghavan  <raji@linux.vnet.ibm.com>
+
+       * sysdeps/powerpc/powerpc64/power7/memcpy.S: Replace
+       lxvd2x/stxvd2x with lvx/stvx.
+       * sysdeps/powerpc/powerpc64/power7/memmove.S: Likewise.
+
  2017-10-04  Florian Weimer  <fweimer@redhat.com>
  
         * scripts/check-local-headers.sh: Ignore nspr4 header file
diff --git a/sysdeps/powerpc/powerpc64/power7/memcpy.S b/sysdeps/powerpc/powerpc64/power7/memcpy.S

index 641c7e21184a3e07a9301e92c925dd9dfbef4f6a..c9b6507d1b4497f3b1a69b6bedede2b113f3d0e7 100644 (file)
--- a/sysdeps/powerpc/powerpc64/power7/memcpy.S
+++ b/sysdeps/powerpc/powerpc64/power7/memcpy.S
@@ -91,63 +91,63 @@ L(aligned_copy):
         srdi    12,cnt,7
         cmpdi   12,0
         beq     L(aligned_tail)
-       lxvd2x  6,0,src
-       lxvd2x  7,src,6
+       lvx     6,0,src
+       lvx     7,src,6
         mtctr   12
         b       L(aligned_128loop)
  
         .align  4
  L(aligned_128head):
         /* for the 2nd + iteration of this loop. */
-       lxvd2x  6,0,src
-       lxvd2x  7,src,6
+       lvx     6,0,src
+       lvx     7,src,6
  L(aligned_128loop):
-       lxvd2x  8,src,7
-       lxvd2x  9,src,8
-       stxvd2x 6,0,dst
+       lvx     8,src,7
+       lvx     9,src,8
+       stvx    6,0,dst
         addi    src,src,64
-       stxvd2x 7,dst,6
-       stxvd2x 8,dst,7
-       stxvd2x 9,dst,8
-       lxvd2x  6,0,src
-       lxvd2x  7,src,6
+       stvx    7,dst,6
+       stvx    8,dst,7
+       stvx    9,dst,8
+       lvx     6,0,src
+       lvx     7,src,6
         addi    dst,dst,64
-       lxvd2x  8,src,7
-       lxvd2x  9,src,8
+       lvx     8,src,7
+       lvx     9,src,8
         addi    src,src,64
-       stxvd2x 6,0,dst
-       stxvd2x 7,dst,6
-       stxvd2x 8,dst,7
-       stxvd2x 9,dst,8
+       stvx    6,0,dst
+       stvx    7,dst,6
+       stvx    8,dst,7
+       stvx    9,dst,8
         addi    dst,dst,64
         bdnz    L(aligned_128head)
  
  L(aligned_tail):
         mtocrf  0x01,cnt
         bf      25,32f
-       lxvd2x  6,0,src
-       lxvd2x  7,src,6
-       lxvd2x  8,src,7
-       lxvd2x  9,src,8
+       lvx     6,0,src
+       lvx     7,src,6
+       lvx     8,src,7
+       lvx     9,src,8
         addi    src,src,64
-       stxvd2x 6,0,dst
-       stxvd2x 7,dst,6
-       stxvd2x 8,dst,7
-       stxvd2x 9,dst,8
+       stvx    6,0,dst
+       stvx    7,dst,6
+       stvx    8,dst,7
+       stvx    9,dst,8
         addi    dst,dst,64
  32:
         bf      26,16f
-       lxvd2x  6,0,src
-       lxvd2x  7,src,6
+       lvx     6,0,src
+       lvx     7,src,6
         addi    src,src,32
-       stxvd2x 6,0,dst
-       stxvd2x 7,dst,6
+       stvx    6,0,dst
+       stvx    7,dst,6
         addi    dst,dst,32
  16:
         bf      27,8f
-       lxvd2x  6,0,src
+       lvx     6,0,src
         addi    src,src,16
-       stxvd2x 6,0,dst
+       stvx    6,0,dst
         addi    dst,dst,16
  8:
         bf      28,4f
diff --git a/sysdeps/powerpc/powerpc64/power7/memmove.S b/sysdeps/powerpc/powerpc64/power7/memmove.S

index 93baa69ee26c61328384dbba3d661eb072248506..667c6e20925ec327fafcb45d887acbe7b4207687 100644 (file)
--- a/sysdeps/powerpc/powerpc64/power7/memmove.S
+++ b/sysdeps/powerpc/powerpc64/power7/memmove.S
@@ -92,63 +92,63 @@ L(aligned_copy):
         srdi    12,r5,7
         cmpdi   12,0
         beq     L(aligned_tail)
-       lxvd2x  6,0,r4
-       lxvd2x  7,r4,6
+       lvx     6,0,r4
+       lvx     7,r4,6
         mtctr   12
         b       L(aligned_128loop)
  
         .align  4
  L(aligned_128head):
         /* for the 2nd + iteration of this loop. */
-       lxvd2x  6,0,r4
-       lxvd2x  7,r4,6
+       lvx     6,0,r4
+       lvx     7,r4,6
  L(aligned_128loop):
-       lxvd2x  8,r4,7
-       lxvd2x  9,r4,8
-       stxvd2x 6,0,r11
+       lvx     8,r4,7
+       lvx     9,r4,8
+       stvx    6,0,r11
         addi    r4,r4,64
-       stxvd2x 7,r11,6
-       stxvd2x 8,r11,7
-       stxvd2x 9,r11,8
-       lxvd2x  6,0,r4
-       lxvd2x  7,r4,6
+       stvx    7,r11,6
+       stvx    8,r11,7
+       stvx    9,r11,8
+       lvx     6,0,r4
+       lvx     7,r4,6
         addi    r11,r11,64
-       lxvd2x  8,r4,7
-       lxvd2x  9,r4,8
+       lvx     8,r4,7
+       lvx     9,r4,8
         addi    r4,r4,64
-       stxvd2x 6,0,r11
-       stxvd2x 7,r11,6
-       stxvd2x 8,r11,7
-       stxvd2x 9,r11,8
+       stvx    6,0,r11
+       stvx    7,r11,6
+       stvx    8,r11,7
+       stvx    9,r11,8
         addi    r11,r11,64
         bdnz    L(aligned_128head)
  
  L(aligned_tail):
         mtocrf  0x01,r5
         bf      25,32f
-       lxvd2x  6,0,r4
-       lxvd2x  7,r4,6
-       lxvd2x  8,r4,7
-       lxvd2x  9,r4,8
+       lvx     6,0,r4
+       lvx     7,r4,6
+       lvx     8,r4,7
+       lvx     9,r4,8
         addi    r4,r4,64
-       stxvd2x 6,0,r11
-       stxvd2x 7,r11,6
-       stxvd2x 8,r11,7
-       stxvd2x 9,r11,8
+       stvx    6,0,r11
+       stvx    7,r11,6
+       stvx    8,r11,7
+       stvx    9,r11,8
         addi    r11,r11,64
  32:
         bf      26,16f
-       lxvd2x  6,0,r4
-       lxvd2x  7,r4,6
+       lvx     6,0,r4
+       lvx     7,r4,6
         addi    r4,r4,32
-       stxvd2x 6,0,r11
-       stxvd2x 7,r11,6
+       stvx    6,0,r11
+       stvx    7,r11,6
         addi    r11,r11,32
  16:
         bf      27,8f
-       lxvd2x  6,0,r4
+       lvx     6,0,r4
         addi    r4,r4,16
-       stxvd2x 6,0,r11
+       stvx    6,0,r11
         addi    r11,r11,16
  8:
         bf      28,4f
@@ -488,63 +488,63 @@ L(aligned_copy_bwd):
         srdi    r12,r5,7
         cmpdi   r12,0
         beq     L(aligned_tail_bwd)
-       lxvd2x  v6,r4,r6
-       lxvd2x  v7,r4,r7
+       lvx     v6,r4,r6
+       lvx     v7,r4,r7
         mtctr   12
         b       L(aligned_128loop_bwd)
  
         .align  4
  L(aligned_128head_bwd):
         /* for the 2nd + iteration of this loop. */
-       lxvd2x  v6,r4,r6
-       lxvd2x  v7,r4,r7
+       lvx     v6,r4,r6
+       lvx     v7,r4,r7
  L(aligned_128loop_bwd):
-       lxvd2x  v8,r4,r8
-       lxvd2x  v9,r4,r9
-       stxvd2x v6,r11,r6
+       lvx     v8,r4,r8
+       lvx     v9,r4,r9
+       stvx    v6,r11,r6
         subi    r4,r4,64
-       stxvd2x v7,r11,r7
-       stxvd2x v8,r11,r8
-       stxvd2x v9,r11,r9
-       lxvd2x  v6,r4,r6
-       lxvd2x  v7,r4,7
+       stvx    v7,r11,r7
+       stvx    v8,r11,r8
+       stvx    v9,r11,r9
+       lvx     v6,r4,r6
+       lvx     v7,r4,7
         subi    r11,r11,64
-       lxvd2x  v8,r4,r8
-       lxvd2x  v9,r4,r9
+       lvx     v8,r4,r8
+       lvx     v9,r4,r9
         subi    r4,r4,64
-       stxvd2x v6,r11,r6
-       stxvd2x v7,r11,r7
-       stxvd2x v8,r11,r8
-       stxvd2x v9,r11,r9
+       stvx    v6,r11,r6
+       stvx    v7,r11,r7
+       stvx    v8,r11,r8
+       stvx    v9,r11,r9
         subi    r11,r11,64
         bdnz    L(aligned_128head_bwd)
  
  L(aligned_tail_bwd):
         mtocrf  0x01,r5
         bf      25,32f
-       lxvd2x  v6,r4,r6
-       lxvd2x  v7,r4,r7
-       lxvd2x  v8,r4,r8
-       lxvd2x  v9,r4,r9
+       lvx     v6,r4,r6
+       lvx     v7,r4,r7
+       lvx     v8,r4,r8
+       lvx     v9,r4,r9
         subi    r4,r4,64
-       stxvd2x v6,r11,r6
-       stxvd2x v7,r11,r7
-       stxvd2x v8,r11,r8
-       stxvd2x v9,r11,r9
+       stvx    v6,r11,r6
+       stvx    v7,r11,r7
+       stvx    v8,r11,r8
+       stvx    v9,r11,r9
         subi    r11,r11,64
  32:
         bf      26,16f
-       lxvd2x  v6,r4,r6
-       lxvd2x  v7,r4,r7
+       lvx     v6,r4,r6
+       lvx     v7,r4,r7
         subi    r4,r4,32
-       stxvd2x v6,r11,r6
-       stxvd2x v7,r11,r7
+       stvx    v6,r11,r6
+       stvx    v7,r11,r7
         subi    r11,r11,32
  16:
         bf      27,8f
-       lxvd2x  v6,r4,r6
+       lvx     v6,r4,r6
         subi    r4,r4,16
-       stxvd2x v6,r11,r6
+       stvx    v6,r11,r6
         subi    r11,r11,16
  8:
         bf      28,4f
author	Rajalakshmi Srinivasaraghavan <raji@linux.vnet.ibm.com>
	Tue, 21 Nov 2017 17:02:20 +0000 (22:32 +0530)
committer	Rajalakshmi Srinivasaraghavan <raji@linux.vnet.ibm.com>
	Tue, 21 Nov 2017 17:02:20 +0000 (22:32 +0530)
ChangeLog		patch \| blob \| blame \| history
sysdeps/powerpc/powerpc64/power7/memcpy.S		patch \| blob \| blame \| history
sysdeps/powerpc/powerpc64/power7/memmove.S		patch \| blob \| blame \| history