]> git.ipfire.org Git - thirdparty/glibc.git/commit
stdio-common: Convert vfprintf and related functions to buffers
authorFlorian Weimer <fweimer@redhat.com>
Mon, 19 Dec 2022 17:56:54 +0000 (18:56 +0100)
committerFlorian Weimer <fweimer@redhat.com>
Mon, 19 Dec 2022 17:56:54 +0000 (18:56 +0100)
commite88b9f0e5cc50cab57a299dc7efe1a4eb385161d
tree2b733d221cc4247e16aef46150c2fc8153ad6db4
parent46378560e056300623364669de2405a7182b064f
stdio-common: Convert vfprintf and related functions to buffers

vfprintf is entangled with vfwprintf (of course), __printf_fp,
__printf_fphex, __vstrfmon_l_internal, and the strfrom family of
functions.  The latter use the internal snprintf functionality,
so vsnprintf is converted as well.

The simples conversion is __printf_fphex, followed by
__vstrfmon_l_internal and __printf_fp, and finally
__vfprintf_internal and __vfwprintf_internal.  __vsnprintf_internal
and strfrom* are mostly consuming the new interfaces, so they
are comparatively simple.

__printf_fp is a public symbol, so the FILE *-based interface
had to preserved.

The __printf_fp rewrite does not change the actual binary-to-decimal
conversion algorithm, and digits are still not emitted directly to
the target buffer.  However, the staging buffer now uses bytes
instead of wide characters, and one buffer copy is eliminated.

The changes are at least performance-neutral in my testing.
Floating point printing and snprintf improved measurably, so that
this Lua script

  for i=1,5000000 do
      print(i, i * math.pi)
  end

runs about 5% faster for me.  To preserve fprintf performance for
a simple "%d" format, this commit has some logic changes under
LABEL (unsigned_number) to avoid additional function calls.  There
are certainly some very easy performance improvements here: binary,
octal and hexadecimal formatting can easily avoid the temporary work
buffer (the number of digits can be computed ahead-of-time using one
of the __builtin_clz* built-ins). Decimal formatting can use a
specialized version of _itoa_word for base 10.

The existing (inconsistent) width handling between strfmon and printf
is preserved here.  __print_fp_buffer_1 would have to use
__translated_number_width to achieve ISO conformance for printf.

Test expectations in libio/tst-vtables-common.c are adjusted because
the internal staging buffer merges all virtual function calls into
one.

In general, stack buffer usage is greatly reduced, particularly for
unbuffered input streams.  __printf_fp can still use a large buffer
in binary128 mode for %g, though.

Reviewed-by: Adhemerval Zanella <adhemerval.zanella@linaro.org>
18 files changed:
elf/Makefile
include/printf.h
include/printf_buffer.h
libio/strfile.h
libio/tst-vtables-common.c
libio/vsnprintf.c
stdio-common/printf_buffer_flush.c
stdio-common/printf_fp.c
stdio-common/printf_fphex.c
stdio-common/vfprintf-internal.c
stdio-common/vfprintf-process-arg.c
stdlib/strfmon_l.c
stdlib/strfrom-skeleton.c
sysdeps/ia64/fpu/printf_fphex.c
sysdeps/ieee754/ldbl-128/printf_fphex_macros.h
sysdeps/ieee754/ldbl-128ibm/printf_fphex.c
sysdeps/ieee754/ldbl-96/printf_fphex.c
sysdeps/x86_64/fpu/printf_fphex.c