]> git.ipfire.org Git - thirdparty/Python/cpython.git/commitdiff
gh-117151: increase default buffer size of shutil.copyfileobj() to 256k. (GH-119783)
authormorotti <r.morotti@gmail.com>
Fri, 4 Oct 2024 23:51:22 +0000 (00:51 +0100)
committerGitHub <noreply@github.com>
Fri, 4 Oct 2024 23:51:22 +0000 (16:51 -0700)
* gh-117151: increase default buffer size of shutil.copyfileobj() to 256k.

it was set to 16k in the 1990s.
it was raised to 64k in 2019. the discussion at the time mentioned another 5% improvement by raising to 128k and settled for a very conservative setting.

it's 2024 now, I think it should be revisited to match modern hardware. I am measuring 0-15% performance improvement when raising to 256k on various types of disk. there is no downside as far as I can tell.

this function is only intended for sequential copy of full files (or file like objects). it's the typical use case that benefits from larger operations.

for reference, I came across this function while trying to profile pip that is using it to copy files when installing python packages.

* add news

---------

Co-authored-by: rmorotti <romain.morotti@man.com>
Lib/shutil.py
Misc/NEWS.d/next/Library/2024-10-03-05-00-25.gh-issue-117151.Prdw_W.rst [new file with mode: 0644]

index dab3ca5ee91245ce25777b7de1a2d64b276970c0..dd3e0e0c5da54b48d67a03e59b13c4c640a34cd3 100644 (file)
@@ -44,7 +44,7 @@ if sys.platform == 'win32':
 else:
     _winapi = None
 
-COPY_BUFSIZE = 1024 * 1024 if _WINDOWS else 64 * 1024
+COPY_BUFSIZE = 1024 * 1024 if _WINDOWS else 256 * 1024
 # This should never be removed, see rationale in:
 # https://bugs.python.org/issue43743#msg393429
 _USE_CP_SENDFILE = (hasattr(os, "sendfile")
diff --git a/Misc/NEWS.d/next/Library/2024-10-03-05-00-25.gh-issue-117151.Prdw_W.rst b/Misc/NEWS.d/next/Library/2024-10-03-05-00-25.gh-issue-117151.Prdw_W.rst
new file mode 100644 (file)
index 0000000..a7d6251
--- /dev/null
@@ -0,0 +1,3 @@
+The default buffer size used by :func:`shutil.copyfileobj` has been
+increased from 64k to 256k on non-Windows platforms. It was already larger
+on Windows.