]> git.ipfire.org Git - thirdparty/glibc.git/commit - ChangeLog.old-ports-tile
Optimize tile (mostly tilegx) memcpy and memmove performance.
authorChris Metcalf <cmetcalf@tilera.com>
Fri, 2 Nov 2012 16:53:57 +0000 (12:53 -0400)
committerChris Metcalf <cmetcalf@tilera.com>
Tue, 6 Nov 2012 14:24:19 +0000 (09:24 -0500)
commitcd84016efe83d92ee3903fef37f79ca2bafb3985
tree7a92df4a9a081a6f20b8fd68f31139b6336e595c
parent82477c28f46c579a149a8333c07233e9f4e43408
Optimize tile (mostly tilegx) memcpy and memmove performance.

- Override <memcopy.h> so we use full 8-byte word copies on tilegx32
  for memmove, then use op_t in memcpy instead of the previous
  locally-defined word_t just to avoid proliferating identical types.
- Fix bug in memcpy prefetch that caused us to never prefetch past
  the first cache line.
- Optimize misaligned memcpy by inlining _wordcopy_fwd_dest_aligned
  instead of just doing a dumb word-at-a-time copy.
- Make memcpy safe for forward copies by doing all the loads from
  a given cache line prior to doing a wh64 (cache line zero-fill)
  on the destination.  Remove now-redundant src == dst check.
- Copy and optimize the generic wordcopy.c routines to use the tile
  "double align" instruction instead of the MERGE macro; to avoid
  offset addressing mode (which tile doesn't have) by rewriting the
  pointer math to load and store with a zero index; and to use
  post-increment addresses in the inner loops to improve scheduling.
ports/ChangeLog.tile
ports/sysdeps/tile/memcopy.h [new file with mode: 0644]
ports/sysdeps/tile/tilegx/memcpy.c
ports/sysdeps/tile/wordcopy.c [new file with mode: 0644]