]> git.ipfire.org Git - thirdparty/coreutils.git/log
thirdparty/coreutils.git
2 years agotsort: diagnose errors reading the input
Pádraig Brady [Sat, 22 Apr 2023 20:41:53 +0000 (21:41 +0100)] 
tsort: diagnose errors reading the input

* src/tsort.c (tsort): Check for errors after readtoken().
* NEWS: Mention the bug fix.

2 years agocksum: fix failure to diagnose read errors with crc32
Pádraig Brady [Sat, 22 Apr 2023 14:59:48 +0000 (15:59 +0100)] 
cksum: fix failure to diagnose read errors with crc32

The default crc32 mode fails to diagnose read errors.

* src/cksum.c (cksum_slice8): Fix the check for read errors.
(cksum_pclmul): Likewise.
* NEWS: Mention the bug fix.

2 years agotests: avoid failure when cp fails for proc files
Andreas Schwab [Mon, 24 Apr 2023 08:15:01 +0000 (10:15 +0200)] 
tests: avoid failure when cp fails for proc files

When run under QEmu emulation emulated /proc files have
unstable inode numbers.

* tests/cp/proc-short-read.sh: Skip if unstable inode numbers detected.

2 years agoinstall: support stripping files with a leading hyphen
Pádraig Brady [Fri, 21 Apr 2023 18:07:02 +0000 (19:07 +0100)] 
install: support stripping files with a leading hyphen

* src/install.c (strip): Prepend "./" to file names with a leading "-".
* tests/install/strip-program.sh: Add a test case.
* NEWS: Mention the bug fix.
Reported in https://bugs.debian.org/1034429

2 years agomaint: post-release administrivia
Pádraig Brady [Tue, 18 Apr 2023 14:32:53 +0000 (15:32 +0100)] 
maint: post-release administrivia

* NEWS: Add header line for next release.
* .prev-version: Record previous version.
* cfg.mk (old_NEWS_hash): Auto-update.

2 years agoversion 9.3 v9.3
Pádraig Brady [Tue, 18 Apr 2023 14:08:11 +0000 (15:08 +0100)] 
version 9.3

* NEWS: Record release date.

2 years agotests: avoid allocation checks on ZFS
Pádraig Brady [Sat, 15 Apr 2023 21:19:06 +0000 (22:19 +0100)] 
tests: avoid allocation checks on ZFS

* tests/du/basic.sh: Allocation of files was seen to change
asynchronously on ZFS, so avoid allocation comparisons there.

2 years agotests: tty-eof: fix various issues
Pádraig Brady [Tue, 11 Apr 2023 12:02:21 +0000 (13:02 +0100)] 
tests: tty-eof: fix various issues

* tests/misc/tty-eof.pl: Ensure we don't erroneously
skip commands with parameters.
Comment as to why cut(1) is treated differently.
Adjust expect calls to not wait needlessly for cut output.

2 years agotests: avoid dependence on file layout for cp sparse check
Pádraig Brady [Wed, 12 Apr 2023 13:37:00 +0000 (14:37 +0100)] 
tests: avoid dependence on file layout for cp sparse check

* tests/cp/sparse-2.sh: Don't depend on the copy taking
<= allocation of the source.  Instead leverage --debug
to check that zero detection is being enabled.

2 years agocopy: --debug: indicate if NUL detection is used with SEEK_HOLE
Pádraig Brady [Thu, 13 Apr 2023 12:15:31 +0000 (13:15 +0100)] 
copy: --debug: indicate if NUL detection is used with SEEK_HOLE

* src/copy.c (sparse_copy): With --sparse=always we also detect
NULs in extents we're copying, so indicate this with --debug.

2 years agodoc: update re 32-bit builds
Paul Eggert [Mon, 10 Apr 2023 18:55:54 +0000 (11:55 -0700)] 
doc: update re 32-bit builds

* README-install: Mention how to build on 32-bit-only hosts.
This builds on a previous patch by Pádraig Brady.

2 years agobuild: fix _Noreturn compilation failure
Pádraig Brady [Mon, 10 Apr 2023 18:36:23 +0000 (19:36 +0100)] 
build: fix _Noreturn compilation failure

Fix a build failure seen on gcc 3.4 on Solaris 10 at least.

* src/crctab.c: Ensure we include config.h for all compilation units.
This is now required for new _Noreturn usage in gnulib for stdint.h.
* src/cksum.c: Update generation code to ensure config.h included.
* cfg.mk: Remove crctab.c exclusion from the config.h check.

2 years agotests: avoid non portable brace expansion
Pádraig Brady [Mon, 10 Apr 2023 17:51:34 +0000 (18:51 +0100)] 
tests: avoid non portable brace expansion

* tests/cp/backup-dir.sh: Avoid non portable brace expansion
which is not supported by FreeBSD or Solaris shells at least.

2 years agomaint: require support for post-2038 timestamps
Paul Eggert [Mon, 10 Apr 2023 02:18:57 +0000 (19:18 -0700)] 
maint: require support for post-2038 timestamps

* bootstrap.conf (gnulib_modules): Replace year2038 with
year2038-required.

2 years agobuild: update gnulib submodule to latest
Paul Eggert [Mon, 10 Apr 2023 01:30:00 +0000 (18:30 -0700)] 
build: update gnulib submodule to latest

2 years agowc: ensure we update file offset
Pádraig Brady [Sun, 5 Feb 2023 19:52:31 +0000 (19:52 +0000)] 
wc: ensure we update file offset

* src/wc.c (wc): Update the offset when not reading,
and do read if we can't update the offset.
* tests/misc/wc-proc.sh: Add a test case.
* NEWS: Mention the bug fix.
Fixes https://bugs.gnu.org/61300

2 years agocp,mv: issue "skipped" messages when skipping files
Pádraig Brady [Fri, 7 Apr 2023 09:25:41 +0000 (10:25 +0100)] 
cp,mv: issue "skipped" messages when skipping files

* NEWS: Mention the change in behavior to issue a "not replaced"
error diagnostic with -n, and the "skipped" message with -v.
* src/copy.c (copy_internal): Adjust to output the "skipped" messages
depending on -i, -n, -u.
* tests/cp/cp-i.sh: Adjust accordingly.
* tests/mv/mv-n.sh: Likewise.

2 years agocp,mv: add --update=none to always skip existing files
Pádraig Brady [Sat, 1 Apr 2023 15:27:52 +0000 (16:27 +0100)] 
cp,mv: add --update=none to always skip existing files

Add --update=none which is equivalent to the --no-clobber behavior
from before coreutils 9.2.  I.e. existing files are unconditionally
skipped, and them not being replaced does not affect the exit status.

* src/copy.h [enum Update_type]: A new type to support parameters
to the --update command line option.
[enum Interactive]: Add I_ALWAYS_SKIP.
* src/copy.c: Treat I_ALWAYS_SKIP like I_ALWAYS_NO (-n),
except that we don't fail when skipping.
* src/system.h (emit_update_parameters_note): A new function
to output the description of the new --update parameters.
* src/cp.c (main): Parse --update arguments, ensuring that
-n takes precedence if specified.
(usage): Describe the new option.  Also allude that
-u is related in the -n description.
* src/mv.c: Accept the new --update parameters and
update usage() accordingly.
* doc/coreutils.texi (cp invocation): Describe the new --update
parameters.  Also reference --update from the --no-clobber description.
(mv invocation): Likewise.
* tests/mv/update.sh: Test the new parameters.
* NEWS: Mention the new feature.
Addresses https://bugs.gnu.org/62572

2 years agocp: fix --backup with subdirectories
Pádraig Brady [Mon, 3 Apr 2023 17:12:33 +0000 (18:12 +0100)] 
cp: fix --backup with subdirectories

* gnulib: Reference the latest gnulib including the
fix to the backupfile module in commit 94496522.
* tests/cp/backup-dir.sh: Add a test to ensure
we rename appropriately when backing up through subdirs.
* NEWS: Mention the bug fix.
Fixes https://bugs.gnu.org/62607

2 years agotests: tee: avoid false failure due to fifo usage
Pádraig Brady [Thu, 30 Mar 2023 14:49:26 +0000 (15:49 +0100)] 
tests: tee: avoid false failure due to fifo usage

* tests/misc/tee.sh: Call cleanup_ in all cases to ensure
there are no overlapping interactions on the fifo that
might impact later parts of the test.  This was seen to
cause issue with dash on musl libc.
Addresses https://bugs.gnu.org/62542

2 years agotests: adjust csplit VM limit
Pádraig Brady [Thu, 30 Mar 2023 13:28:03 +0000 (14:28 +0100)] 
tests: adjust csplit VM limit

* tests/misc/csplit-heap.sh: More memory is required to avoid
a false failure on some systems.  Noticed with musl libc
with bash as the shell.  This is confirmed to still easily
trigger with the original memory leak being tested.
Addresses https://bugs.gnu.org/62542

2 years agowc: diagnose overflow of total counts
Pádraig Brady [Wed, 29 Mar 2023 14:29:52 +0000 (15:29 +0100)] 
wc: diagnose overflow of total counts

* src/wc.c (wc): Use INT_ADD_WRAPV() to detect overflow.
(main): Upon overflow, saturate the total, print a diagnostic,
and set exit status.
* tests/misc/wc-total.sh: Add a test case, which operates
on BTRFS and 64 bit systems at least.
Reported at https://bugs.debian.org/1027100

2 years agodircolors: diagnose read errors
Pádraig Brady [Tue, 28 Mar 2023 13:24:29 +0000 (14:24 +0100)] 
dircolors: diagnose read errors

* NEWS: Mention the fix.
* src/dircolors.c: Fail upon read error from getline().
* tests/misc/dircolors.sh: Add a new test.
* tests/local.mk: Reference the new test.

2 years agotests: add a test case for the previous date fix
Pádraig Brady [Tue, 28 Mar 2023 12:38:52 +0000 (13:38 +0100)] 
tests: add a test case for the previous date fix

* NEWS: Also mention this bug fix.
* tests/misc/date-f.sh: Add a new test.
* tests/local.mk: Reference the new test.

2 years agodate: diagnose -f read errors
Paul Eggert [Tue, 28 Mar 2023 08:52:43 +0000 (01:52 -0700)] 
date: diagnose -f read errors

* src/date.c (batch_convert): Diagnose read errors, fixing Bug#62497.

2 years agocp: clarify commentary
Paul Eggert [Sat, 25 Mar 2023 16:30:22 +0000 (09:30 -0700)] 
cp: clarify commentary

* src/copy.c: Make comments a bit clearer.

2 years agocopy: fix --reflink=auto to fallback in more cases
Pádraig Brady [Thu, 23 Mar 2023 13:19:04 +0000 (13:19 +0000)] 
copy: fix --reflink=auto to fallback in more cases

On restricted systems like android or some containers,
FICLONE could return EPERM, EACCES, or ENOTTY,
which would have induced the command to fail to copy
rather than falling back to a more standard copy.

* src/copy.c (is_terminal_failure): A new function refactored
from handle_clone_fail().
(is_CLONENOTSUP): Merge in the handling of EACCES, ENOTTY, EPERM
as they also pertain to determination of whether cloning is supported
if we ever use this function in that context.
(handle_clone_fail): Use is_terminal_failure() in all cases,
so that we assume a terminal failure in less errno cases.
* NEWS: Mention the bug fix.
Addresses https://bugs.gnu.org/62404

2 years agodoc: add a NEWS entry for the previous fix
Pádraig Brady [Fri, 24 Mar 2023 12:44:50 +0000 (12:44 +0000)] 
doc: add a NEWS entry for the previous fix

* NEWS: Mention the previous cksum --check fix.

2 years agocksum: fix reporting of failed checks
Pádraig Brady [Thu, 23 Mar 2023 12:31:24 +0000 (12:31 +0000)] 
cksum: fix reporting of failed checks

This applies to all checksumming utilities,
where we incorrectly report all subsequent files as checking 'OK'
once any file has passed a digest check.
The exit status was not impacted, only the printed status.

* src/digest.c (digest_check): Use the correct state variable
to determine if the _current_ file has passed or not.
* tests/misc/md5sum.pl: Add a test case.
Fixes https://bugs.gnu.org/62403

2 years agotests: skip some parts of tests/misc/tee.sh if run as root
Nick Alcock [Tue, 21 Mar 2023 12:54:02 +0000 (12:54 +0000)] 
tests: skip some parts of tests/misc/tee.sh if run as root

Similarly to the fix to tests/rmdir/ignore.sh in c0e5f8c59,
tee should not be expected to fail when run with read-only outputs
when run as root.

* tests/misc/tee.sh: Add uid_is_privileged_ guard around test for
read-only outputs.

2 years agomaint: post-release administrivia
Pádraig Brady [Mon, 20 Mar 2023 14:08:46 +0000 (14:08 +0000)] 
maint: post-release administrivia

* NEWS: Add header line for next release.
* .prev-version: Record previous version.
* cfg.mk (old_NEWS_hash): Auto-update.

2 years agoversion 9.2 v9.2
Pádraig Brady [Mon, 20 Mar 2023 13:44:36 +0000 (13:44 +0000)] 
version 9.2

* NEWS: Record release date.

2 years agotests: avoid false failure on systems without statx
Pádraig Brady [Sun, 19 Mar 2023 23:35:12 +0000 (23:35 +0000)] 
tests: avoid false failure on systems without statx

* tests/ls/stat-free-symlinks.sh: Filter out syscalls that
return ENOSYS, as that was seen with statx() on Debian 10.13
on mips64, and resulted in overcounting of stat calls.

2 years agostty: ensure arbitrary data is not displayed
Pádraig Brady [Sun, 19 Mar 2023 22:22:18 +0000 (22:22 +0000)] 
stty: ensure arbitrary data is not displayed

* src/stty.c (main): Use static structures to ensure
they're initialized (to zero), so that random data is
not displayed, or compared resulting in a inaccurate
failure reported to users.  This was seen on musl libc
where some parts of the termios c_cc array were
not initialized by tcgetattr().
Reported by Bruno Haible.

2 years agotests: df: avoid false failure on systems with multiple roots
Pádraig Brady [Sat, 18 Mar 2023 21:44:56 +0000 (21:44 +0000)] 
tests: df: avoid false failure on systems with multiple roots

* tests/df/df-symlink.sh: Skip the test on systems
with multiple file system roots.

2 years agodoc: uniq: revert previous man page adjustment
Pádraig Brady [Sat, 18 Mar 2023 14:58:20 +0000 (14:58 +0000)] 
doc: uniq: revert previous man page adjustment

* src/uniq.c (usage): -D doesn't take an argument
so should be separated in the description.

2 years agodoc: uniq: use more standard description of -D long option
Pádraig Brady [Sat, 18 Mar 2023 11:35:46 +0000 (11:35 +0000)] 
doc: uniq: use more standard description of -D long option

* src/uniq.c: Describe -D and --all-repeated together,
as with all other long options.
Fixes https://bugs.gnu.org/62249

2 years agotests: aix: avoid unsupported functionality
Pádraig Brady [Fri, 17 Mar 2023 19:57:18 +0000 (19:57 +0000)] 
tests: aix: avoid unsupported functionality

* tests/misc/tee.sh: AIX doesn't support detecting
closed outputs either with poll() or select() so avoid
testing that functionality.
* tests/tail-2/pipe-f.sh: Likewise.

2 years agomaint: avoid discarded-qualifiers warnings with SELinux 3.5
Bernhard Voelker [Thu, 16 Mar 2023 22:11:47 +0000 (23:11 +0100)] 
maint: avoid discarded-qualifiers warnings with SELinux 3.5

Since SELinux version 3.5, the return value of context_str(3) is
declared as const; see:
  https://github.com/SELinuxProject/selinux/commit/dd98fa322766
Therefore, GCC complains (here with -Werror):
  src/selinux.c: In function 'defaultcon':
  src/selinux.c:152:16: error: assignment discards 'const' qualifier \
    from pointer target type [-Werror=discarded-qualifiers]
    152 |   if (!(constr = context_str (tcontext)))
        |                ^
  src/selinux.c: In function 'restorecon_private':
  src/selinux.c:252:16: error: assignment discards 'const' qualifier \
    from pointer target type [-Werror=discarded-qualifiers]
    252 |   if (!(constr = context_str (tcontext)))
      |                ^

* src/selinux.c (defaultcon): Define CONSTR as const.
(restorecon_private): Likewise.

2 years agotest: avoid a test hang on Hurd
Pádraig Brady [Wed, 15 Mar 2023 18:11:00 +0000 (18:11 +0000)] 
test: avoid a test hang on Hurd

* tests/cp/sparse-to-pipe.sh: Protect the cp call seen to
hang on Hurd/i686 with a timeout.
Reported By: Bruno Haible

2 years agocksum: fix --raw on 64 bit big endian systems
Pádraig Brady [Wed, 15 Mar 2023 13:57:37 +0000 (13:57 +0000)] 
cksum: fix --raw on 64 bit big endian systems

* src/sum.c (output_bsd): On sparc64 for example,
a crc of 0 was output due to casting an int variable
to uint16_t and thus operating on the wrong end of the variable.
Instead use explicit assignment to the narrower type
to ensure we get the appropriate data.
(output_sysv): Likewise.
Reported by Bruno Haible.

2 years agobuild: avoid -Wsometimes-uninitialized on macOS 12
Bruno Haible [Wed, 15 Mar 2023 13:15:11 +0000 (13:15 +0000)] 
build: avoid -Wsometimes-uninitialized on macOS 12

* src/pr.c (integer_overflow): Mark as _Noreturn.
* src/test.c (beyond): Likewise.

2 years agodoc: remove older ChangeLog items
Pádraig Brady [Mon, 13 Mar 2023 21:45:50 +0000 (21:45 +0000)] 
doc: remove older ChangeLog items

* Makefile.am: Update the oldest documented version
to 8.29 which is now about 5 years old.

2 years agotee: avoid undefined behavior after fclose()
Pádraig Brady [Mon, 13 Mar 2023 21:26:21 +0000 (21:26 +0000)] 
tee: avoid undefined behavior after fclose()

* iopoll.c (fclose_wait): Rename from confusing fclose_nonblock name.
Also adjust to do no operations on the stream after fclose()
as this is undefined. Instead use fflush() to determine EAGAIN status.
(fwrite_wait): Renamed from confusing fwrite_nonblock name.

2 years agodoc: dircolors: better separate the sections in the database
Pádraig Brady [Mon, 5 Sep 2022 13:31:04 +0000 (14:31 +0100)] 
doc: dircolors: better separate the sections in the database

* src/dircolors.hin: Make the separate sections of the self
documenting dircolors database more apparent,
by adding heading comments, and appropriate separation.

2 years agols: --color: honor separate sequences for extension cases
Pádraig Brady [Sun, 4 Sep 2022 18:59:25 +0000 (19:59 +0100)] 
ls: --color: honor separate sequences for extension cases

Following on from commit v8.29-45-g24053fbd8 which unconditionally
used case insensitive extension matching, support selective
case sensitive matching when there are separate extension cases
defined with different display sequences.

* src/dircolors.hin: Document how file name suffixes are matched.
Note this is displayed with `dircolors --print-database` which
the texi info recommends to use for details.
* src/ls.c (parse_ls_color): Postprocess the list to
mark entries for case sensitive matching,
and also adjust so that unmatchable entries are more quickly ignored.
(get_color_indicator): Use exact matching rather than
case insensitive matching if so marked.
* tests/ls/color-ext.sh: Add test cases.
* NEWS: Mention the change in behavior.
Addresses https://bugs.gnu.org/33123

2 years agotests: adjust du test for recent apparent size change
Pádraig Brady [Mon, 13 Mar 2023 15:11:27 +0000 (15:11 +0000)] 
tests: adjust du test for recent apparent size change

* tests/du/threshold.sh: Directories are assumed to be
of size 0 with --apparent since commit v9.1-187-g110bcd283
so remove --apparent cases from this test.

2 years agotee: support non blocking outputs
Pádraig Brady [Sun, 5 Mar 2023 15:51:32 +0000 (15:51 +0000)] 
tee: support non blocking outputs

Non blocking outputs can be seen for example
when piping telnet through tee to a terminal.
In that case telnet sets its input to nonblocking mode,
which results in tee's output being nonblocking,
in which case in may receive an EAGAIN error upon write().
The same issue was seen with mpirun.
The following can be used to reproduce this
locally at a terminal (in most invocations):

  $ { dd iflag=nonblock count=0 status=none;
      dd bs=10K count=10 if=/dev/zero status=none; } |
    tee || echo fail >/dev/tty

* src/iopoll.c (iopoll_internal): A new function refactored from
iopoll(), to also support a mode where we check the output
descriptor is writeable.
(iopoll): Now refactored to just call iopoll_internal().
(fwait_for_nonblocking_write): A new internal function which
uses iopoll_internal() to wait for writeable output
if an EAGAIN or EWOULDBLOCK was received.
(fwrite_nonblock): An fwrite() wrapper which uses
fwait_for_nonblocking_write() to handle EAGAIN.
(fclose_nonblock): Likewise.
src/iopoll.h: Add fclose_nonblock, fwrite_nonblock.
src/tee.c: Call fclose_nonblock() and fwrite_nonblock wrappers,
instead of the standard functions.
* tests/misc/tee.sh: Add a test case.
* NEWS: Mention the improvement.

The idea was suggested by Kamil Dudka in
https://bugzilla.redhat.com/1615467

2 years agodoc: remove redundant NEWS entry
Pádraig Brady [Wed, 8 Mar 2023 18:28:06 +0000 (18:28 +0000)] 
doc: remove redundant NEWS entry

* NEWS: There was no bug on macOS,
and the split -n new feature is documented already.

2 years agosplit: support split -n on larger pipe input
Paul Eggert [Tue, 7 Mar 2023 20:58:12 +0000 (12:58 -0800)] 
split: support split -n on larger pipe input

* bootstrap.conf (gnulib_modules): Add free-posix, tmpfile.
* src/split.c (copy_to_tmpfile): New function.
(input_file_size): Use it to split larger files when sizes cannot
easily be determined via fstat or lseek.  See Bug#61386#235.
* tests/split/l-chunk.sh: Mark tests of /dev/zero as
very expensive since they exhaust /tmp.

2 years agotee: fix a crash with unwriteable files
Pádraig Brady [Tue, 7 Mar 2023 01:12:12 +0000 (01:12 +0000)] 
tee: fix a crash with unwriteable files

This was introduced recently with commit v9.1-166-g6b12e62d9

* src/tee.c (tee_files): Check the return from fopen()
before passing to fileno() etc.
* tests/misc/tee.sh: Add a test case.

2 years agomaint: pacify ‘make syntax-check’
Paul Eggert [Mon, 6 Mar 2023 23:37:45 +0000 (15:37 -0800)] 
maint: pacify ‘make syntax-check’

Problem reported by Pádraig Brady (Bug#61386#226).
* src/split.c (parse_chunk): Use die instead of error.
(main): Quote a string.
* tests/local.mk (all_root_tests): Move du/apparent.sh from here ...
(all_tests): ... to here.

2 years agotail,tee: avoid issues with many files on systems without poll
Pádraig Brady [Mon, 6 Mar 2023 13:01:26 +0000 (13:01 +0000)] 
tail,tee: avoid issues with many files on systems without poll

* src/iopoll.c (iopoll): Protect the call to select against
passing in a descriptor larger than FD_SETSIZE.

2 years agodu: --apparent counts only symlinks and regular
Paul Eggert [Sun, 5 Mar 2023 00:51:11 +0000 (16:51 -0800)] 
du: --apparent counts only symlinks and regular

Problem reported by Christoph Anton Mitterer (Bug#61884).
* src/du.c (process_file): When counting apparent sizes, count
only usable st_size members.
* tests/du/apparent.sh: New file.
* tests/local.mk (all_root_tests): Add it.

2 years agosplit: tune for when creating output files
Paul Eggert [Sat, 4 Mar 2023 21:40:28 +0000 (13:40 -0800)] 
split: tune for when creating output files

* src/split.c (create): Avoid fstat + ftruncate in the usual case
where the output file does not already exist, by trying
to create it with O_EXCL first.  This costs a failed open
in the unusual case where the output file already exists,
but that’s OK.

2 years agosplit: style fix
Paul Eggert [Sat, 4 Mar 2023 19:42:16 +0000 (11:42 -0800)] 
split: style fix

* src/split.c (ofile_open): Avoid ‘if (! (a = b))’ style.

2 years agosplit: prefer signed integers to size_t
Paul Eggert [Sat, 4 Mar 2023 19:42:16 +0000 (11:42 -0800)] 
split: prefer signed integers to size_t

This allows for better runtime checking with gcc
-fsanitize=undefined.
* src/split.c: Include idx.h.
(open_pipes_alloc, n_open_pipes, suffix_length)
(set_suffix_length, input_file_size, sufindex, outbase_length)
(outfile_length, addsuf_length, create, cwrite, bytes_split)
(lines_split, line_bytes_split, lines_chunk_split)
(bytes_chunk_extract, ofile_open, lines_rr, main):
Prefer signed integers (typically idx_t) to size_t.

2 years agosplit: handle large numbers better
Paul Eggert [Sat, 4 Mar 2023 19:42:16 +0000 (11:42 -0800)] 
split: handle large numbers better

Prefer signed types to uintmax_t, as this allows for better
runtime checking with gcc -fsanitize=undefined.
Also, when an integer overflows just use the maximal value
when the code will do the right thing anyway.
* src/split.c (set_suffix_length, bytes_split, lines_split)
(line_bytes_split, lines_chunk_split, bytes_chunk_extract)
(lines_rr, parse_chunk, main):
Prefer a signed type (typically intmax_t) to uintmax_t.
(strtoint_die): New function.
(OVERFLOW_OK): New macro.  Use it elsewhere, where we now allow
LONGINT_OVERFLOW because the code then does the right thing on all
practical platforms (they have int wide enough so that it cannot
be practically exhausted).  We can do this now that we can safely
assume intmax_t has at least 64 bits.
(parse_n_units): New function.
(parse_chunk, main): Use it.
(main): Do not worry about integer overflow when the code
will do the right thing anyway with the extreme value.
Just use the extreme value.
* tests/split/fail.sh: Adjust to match new behavior.

2 years agosplit: prefer ssize_t for read result
Paul Eggert [Sat, 4 Mar 2023 19:42:16 +0000 (11:42 -0800)] 
split: prefer ssize_t for read result

* src/split.c (bytes_split, lines_chunk_split)
(bytes_chunk_extract, main): Prefer ssize_t to size_t when
representing the return value of ‘read’.  Use a negative value
instead of SIZE_MAX to indicate a missing value.

2 years agosplit: be more careful about buffer sizes
Paul Eggert [Sat, 4 Mar 2023 19:42:16 +0000 (11:42 -0800)] 
split: be more careful about buffer sizes

* src/split.c: Include sys-limits.h, not safe-read.h.
(input_file_size, bytes_split, lines_split, line_bytes_split)
(lines_chunk_split, bytes_chunk_extract, lines_rr): Call read, not
safe_read, since safe_read no longer buys us anything.
(main): Reject outlandish buffer sizes right away,
rather than allocating huge buffers and never using them.

2 years agosplit: minor -1 / 0 refactor
Paul Eggert [Sat, 4 Mar 2023 19:42:16 +0000 (11:42 -0800)] 
split: minor -1 / 0 refactor

* src/split.c (create, bytes_split, ofile_open):
Prefer comparing to 0 to comparing to -1.

2 years agosplit: don’t worry about ECHILD
Paul Eggert [Sat, 4 Mar 2023 19:42:16 +0000 (11:42 -0800)] 
split: don’t worry about ECHILD

* src/split.c (closeout): There should be no need for a special
case for ECHILD, since we never wait for the same child twice.
Simplify with this in mind.

2 years agosplit: don’t assume pid_t fits in int
Paul Eggert [Sat, 4 Mar 2023 19:42:16 +0000 (11:42 -0800)] 
split: don’t assume pid_t fits in int

* src/split.c (filter_pid): Now pid_t, not int.
(of_t): opid member is now pid_t, not int.

2 years agosplit: simplify SIGPIPE handling
Paul Eggert [Sat, 4 Mar 2023 19:42:16 +0000 (11:42 -0800)] 
split: simplify SIGPIPE handling

Ignore and default SIGPIPE, rather than blocking and unblocking it.
* src/split.c (default_SIGPIPE):
New static var, replacing oldblocked and newblocked.
(create): Use it.
(main): Set it.

2 years agosplit: port ‘split -n N /dev/null’ better to macOS
Paul Eggert [Sat, 4 Mar 2023 19:42:16 +0000 (11:42 -0800)] 
split: port ‘split -n N /dev/null’ better to macOS

* src/split.c (input_file_size): Do not bother with lseek if the
initial read probe reaches EOF, since the file size is known then.
This works better on macOS, which doesn’t allow lseek on /dev/null.
Do not special-case size-zero files, as the issue can occur
with any size file (though /proc files are the most common).
If the current position is past end of file, treat this as
size zero regardless of whether the file has a usable st_size.
Pass through lseek -1 return values rather than using ‘return -1’;
this makes the code a bit easier to analyze (and a bit faster).
Avoid undefined behavior if the size calculation overflows.
(lines_chunk_split): Do not bother with lseek if it would have
no effect if successful.  This works better on macOS, which
doesn’t allow lseek on /dev/null.
* tests/split/l-chunk.sh: Adjust to match fixed behavior.

2 years agomaint: fix NEWS quoting
Paul Eggert [Sat, 4 Mar 2023 19:42:16 +0000 (11:42 -0800)] 
maint: fix NEWS quoting

* NEWS: Use English-language quoting in recent news.

2 years agosplit: split more evenly with -n
Paul Eggert [Sat, 4 Mar 2023 19:41:03 +0000 (11:41 -0800)] 
split: split more evenly with -n

* src/split.c (bytes_split): New arg REM_BYTES.
Use this to split more evenly.  All callers changed.
(lines_chunk_split, bytes_chunk_extract):
Be consistent with new byte_split.
* tests/split/b-chunk.sh, tests/split/l-chunk.sh: Test new behavior.

2 years agosplit: small -n lines simplification
Paul Eggert [Sat, 4 Mar 2023 19:41:02 +0000 (11:41 -0800)] 
split: small -n lines simplification

* src/split.c (lines_chunk_split):
Rewrite while as if-while for clarity.

2 years agosplit: refactor lines_chunk_split
Paul Eggert [Sat, 4 Mar 2023 19:41:02 +0000 (11:41 -0800)] 
split: refactor lines_chunk_split

* src/split.c (lines_chunk_split): Simplify by having chunk_end
point to the first byte after the chunk, rather than to the last
byte of the chunk.  This will reduce confusion once we allow
chunks to be empty.

2 years agotee: tune when later -p overrides earlier
Paul Eggert [Sat, 4 Mar 2023 20:18:18 +0000 (12:18 -0800)] 
tee: tune when later -p overrides earlier

* src/tee.c (pipe_check): Make this a local var instead
of a static var.  This suppresses a -Wmaybe-uninitialized
diagnostic with gcc 12.2.1 20221121 (Red Hat 12.2.1-4).
(main): Don’t set pipe_check unnecessarily if a later
-p option overrides an earlier one that wants pipe_check.
Problem discovered when I investigated the GCC warning.

2 years agomaint: refactor tail.c to use iopoll
Pádraig Brady [Tue, 28 Feb 2023 18:36:02 +0000 (18:36 +0000)] 
maint: refactor tail.c to use iopoll

* src/tail.c (check_output_alive): Reuse iopoll()
rather than directly calling poll() or select().
* src/iopoll.c (iopoll): Refactor to support non blocking operation,
or ignoring descriptors by passing a negative value.
* src/iopoll.h (iopoll): Adjust to support a BLOCK parameter.
* src/tee.c (tee_files): Adjust iopoll() call to explicitly block.
* src/local.mk: Have tail depend on iopoll.c.

2 years agotail: avoid undefined behavior when polling outputs
Pádraig Brady [Tue, 28 Feb 2023 13:34:31 +0000 (13:34 +0000)] 
tail: avoid undefined behavior when polling outputs

* src/tail.c (check_output_alive): Only check the returned
events from poll() when it indicates there are events to check.

2 years agodoc: tee -p: clarify operation
Pádraig Brady [Mon, 27 Feb 2023 18:07:06 +0000 (18:07 +0000)] 
doc: tee -p: clarify operation

* src/tee.c (usage): Change from describing one (non pipe) aspect
to the more general point of being the option to use if working with
pipes, and referencing the more detailed info below.
* doc/coreutils.texi (tee invocation): s/standard/appropriate/ since
the standard operation with pipes is to exit immediately upon write
error.  s/early/immediately/ as it's ambiguous as to what "early"
is in relation to.

2 years agotests: tee -p: add test for early exit with closed pipes
Pádraig Brady [Tue, 3 Jan 2023 17:06:45 +0000 (18:06 +0100)] 
tests: tee -p: add test for early exit with closed pipes

* tests/misc/tee.sh: Add a test for the new iopoll logic
to detect closed outputs and exit early without needing
further input.

2 years agotee: enhance -p mode using iopoll() to detect broken pipe outputs
Carl Edquist [Thu, 15 Dec 2022 18:32:49 +0000 (12:32 -0600)] 
tee: enhance -p mode using iopoll() to detect broken pipe outputs

If input is intermittent (a tty, pipe, or socket), and all remaining
outputs are pipes (eg, >(cmd) process substitutions), exit early when
they have all become broken pipes (and thus future writes will fail),
without waiting for more input to become available, as future write
attempts to these outputs will fail (SIGPIPE/EPIPE).

Only provide this enhancement when pipe errors are ignored (-p mode).

Note that only one output needs to be monitored at a time with iopoll(),
as we only want to exit early if _all_ outputs have been removed.

* src/tee.c (pipe_check): New global for iopoll mode.
(main): enable pipe_check for -p, as long as output_error ignores EPIPE,
and input is suitable for iopoll().
(get_next_out): Helper function for finding next valid output.
(fail_output, tee_files): Break out write failure/output removal logic
to helper function.
(tee_files): Add out_pollable array to track which outputs are suitable
for iopoll() (ie, that are pipes); track first output index that is
still valid; add iopoll() broken pipe detection before calling read(),
removing an output that becomes a broken pipe.
* src/local.mk (src_tee_SOURCES): include src/iopoll.c.
* NEWS: Mention tee -p enhancement in Improvements.
* doc/coreutils.texi: Mention the new early exit behavior in the nopipe
modes for the tee -p option.

Suggested-by: Arsen Arsenović <arsen@aarsen.me>
2 years agoall: add broken pipe detection while waiting for input
Carl Edquist [Thu, 15 Dec 2022 12:10:33 +0000 (06:10 -0600)] 
all: add broken pipe detection while waiting for input

When a program's output becomes a broken pipe, future attempts to write
to that ouput will fail (SIGPIPE/EPIPE).  Once it is known that all
future write attepts will fail (due to broken pipes), in many cases it
becomes pointless to wait for further input for slow devices like ttys.
Ideally, a program could use this information to exit early once it is
known that future writes will fail.

Introduce iopoll() to wait on a pair of fds (input & output) for input
to become ready or output to become a broken pipe.

This is relevant when input is intermittent (a tty, pipe, or socket);
but if input is always ready (a regular file or block device), then
a read() will not block, and write failures for a broken pipe will
happen normally.

Introduce iopoll_input_ok() to check whether an input fd is relevant
for iopoll().

Experimentally, broken pipes are only detectable immediately for pipes,
but not sockets.  Errors for other file types will be detected in the
usual way, on write failure.

Introduce iopoll_output_ok() to check whether an output fd is suitable
for iopoll() -- namely, whether it is a pipe.

iopoll() is best implemented with a native poll(2) where possible, but
fall back to a select(2)-based implementation platforms where there are
portability issues.  See also discussion in tail.c.

In general, adding a call to iopoll() before a read() in filter programs
also allows broken pipes to "propagate" backwards in a shell pipeline.

* src/iopoll.c, src/iopoll.h (iopoll): New function implementing broken
pipe detection on output while waiting for input.
(IOPOLL_BROKEN_OUTPUT, IOPOLL_ERROR): Return codes for iopoll().
(IOPOLL_USES_POLL): Macro for poll() vs select() implementation.
(iopoll_input_ok): New function to check whether an input fd is relevant
for iopoll().
(iopoll_output_ok): New function to check whether an input fd is
suitable for iopoll().
* src/local.mk (noinst_HEADERS): add src/iopoll.h.

2 years agobuild: update to latest gnulib
Pádraig Brady [Mon, 27 Feb 2023 12:00:24 +0000 (12:00 +0000)] 
build: update to latest gnulib

* NEWS: Mention the fts fix to avoid the following assert
in rm on mem pressure:
  Program terminated with signal SIGSEGV, Segmentation fault.
    at ../lib/cycle-check.c:60
    assure (state->magic == CC_MAGIC);
* gnulib: Update to the latest to pick up fts commit f17d3977.

2 years agotests: avoid hang in new test
Pádraig Brady [Sun, 26 Feb 2023 18:10:41 +0000 (18:10 +0000)] 
tests: avoid hang in new test

* tests/rm/empty-inacc.sh: Ensure we're not reading from stdin
when we're relying on no prompt to proceed.  Also change the
file being tested so that a failure in one test doesn't impact
following tests causing a framework failure.

2 years agotests: avoid gdb on macOS
Pádraig Brady [Fri, 24 Feb 2023 15:40:37 +0000 (15:40 +0000)] 
tests: avoid gdb on macOS

gdb was seen to hang intermittently on macOS 12.
Also gdb requires signing on newer macOS systems:
https://sourceware.org/gdb/wiki/PermissionsDarwin
So restrict its use on macOS systems for now.

* tests/rm/r-root.sh: Skip on darwin systems.
* tests/tail-2/inotify-race.sh: Restrict the test to
inotify capable systems to avoid the hang with some gdbs.
* tests/tail-2/inotify-race.sh: Likewise.

2 years agocp,install,mv: --debug: output debug info when reflinking
Pádraig Brady [Fri, 24 Feb 2023 15:15:20 +0000 (15:15 +0000)] 
cp,install,mv: --debug: output debug info when reflinking

* src/copy.c (copy_reg): Always check whether to output debug info.
(emit_debug): Restrict output with `cp --attributes-only`.

2 years agotests: determine if SEEK_HOLE is enabled
Pádraig Brady [Thu, 23 Feb 2023 20:28:51 +0000 (20:28 +0000)] 
tests: determine if SEEK_HOLE is enabled

Upcomming gnulib changes may disable SEEK_HOLE
even if the system supports it, so dynamically
check if we've SEEK_HOLE enabled.

* init.cfg (seek_data_capable_): SEEK_DATA may be disabled in the build
if the system support is deemed insufficient, so also use `cp --debug`
to determine if it's enabled.
* tests/cp/sparse-2.sh: Adjust to a more general diagnostic.
* tests/cp/sparse-extents-2.sh: Likewise.
* tests/cp/sparse-extents.sh: Likewise.
* tests/cp/sparse-perf.sh: Likewise.

2 years agocp,install,mv: add --debug to explain how a file is copied
Pádraig Brady [Fri, 17 Feb 2023 13:46:13 +0000 (13:46 +0000)] 
cp,install,mv: add --debug to explain how a file is copied

How a file is copied is dependent on the sparseness of the file,
what file system it is on, what file system the destination is on,
the attributes of the file, and whether they're being copied or not.
Also the --reflink and --sparse options directly impact the operation.

Given it's hard to reason about the combination of all of the above,
the --debug option is useful for users to directly identify if
copy offloading, reflinking, or sparse detection are being used.

It will also be useful for tests to directly query if
these operations are supported.

The new output looks as follows:

  $ src/cp --debug src/cp file.sparse
  'src/cp' -> 'file.sparse'
  copy offload: yes, reflink: unsupported, sparse detection: no

  $ truncate -s+1M file.sparse

  $ src/cp --debug file.sparse file.sparse.cp
  'file.sparse' -> 'file.sparse.cp'
  copy offload: yes, reflink: unsupported, sparse detection: SEEK_HOLE

  $ src/cp --reflink=never --debug file.sparse file.sparse.cp
  'file.sparse' -> 'file.sparse.cp'
  copy offload: avoided, reflink: no, sparse detection: SEEK_HOLE

* doc/coreutils.texi (cp invocation): Describe the --debug option.
(mv invocation): Likewise.
(install invocation): Likewise.
* src/copy.h: Add a new DEBUG member to cp_options, to control
whether to output debug info or not.
* src/copy.c (copy_debug): A new global structure to
unconditionally store debug into from the last copy_reg operations.
(copy_debug_string, emit_debug): New functions to print debug info.
* src/cp.c: if ("--debug") x->debug=true;
* src/install.c: Likewise.
* src/mv.c: Likewise.
* tests/cp/debug.sh: Add a new test.
* tests/local.mk: Reference the new test.
* NEWS: Mention the new feature.

2 years agobuild: update gnulib submodule to latest
Paul Eggert [Thu, 23 Feb 2023 19:18:32 +0000 (11:18 -0800)] 
build: update gnulib submodule to latest

2 years agodoc: chgrp,chmod,chown: state --reference always dereferences
Pádraig Brady [Thu, 23 Feb 2023 15:22:14 +0000 (15:22 +0000)] 
doc: chgrp,chmod,chown: state --reference always dereferences

* src/chgrp.c (usage): State that --reference always
dereferences symbolic links.
* src/chmod.c (usage): Likewise.
* src/chown.c (usage): Likewise.
Fixes https://bugs.gnu.org/61720

2 years agodoc: fix some spelling mistakes
ChuanGang Jiang [Tue, 21 Feb 2023 14:18:52 +0000 (14:18 +0000)] 
doc: fix some spelling mistakes

* doc/coreutils.texi: s/functionalty/functionality/,
   s/sychronize/synchronize/, s/millsecond/millisecond/
   s/paramter/parameters/
* init.cfg: s/parmeters/parameters/
* scripts/build-older-versions/README.older-versions: s/vesion/version/
* tests/misc/env-S-script.sh: s/paramaters/parameters/
Fixes https://bugs.gnu.org/61681

2 years agomaint: avoid -Wmaybe-uninitialized warning from GCC13
Pádraig Brady [Tue, 21 Feb 2023 16:14:44 +0000 (16:14 +0000)] 
maint: avoid -Wmaybe-uninitialized warning from GCC13

* src/copy.c (infer_scantype): Always set scan_inference.ext_start,
as per commit 6c03e8fb which was inadvertently reverted by d374d32c.

2 years agotests: initialize a variable
Jim Meyering [Mon, 20 Feb 2023 16:37:18 +0000 (08:37 -0800)] 
tests: initialize a variable

* tests/rm/interactive-once.sh (write_prot_msg1): Initialize it,
so an envvar setting cannot perturb the test.

2 years agorm: --dir (-d): fix bugs in handling of empty, inaccessible directories
Jim Meyering [Mon, 6 Feb 2023 17:01:55 +0000 (09:01 -0800)] 
rm: --dir (-d): fix bugs in handling of empty, inaccessible directories

* src/remove.c (prompt, rm_fts): In the dir-handling code of both of
these functions, relax a "get_dir_status (...) == DS_EMPTY" condition
to instead test only "get_dir_status (...) != 0", enabling flow control
to reach the prompt function also for unreadable directories. However,
that function itself also needed special handling for this case:
(prompt): Handle empty, inaccessible directories properly,
deleting them with -d (--dir), and prompting about whether to delete
with -i (--interactive).
* tests/rm/empty-inacc.sh: Add tests for the new code.
Reported by наб <nabijaczleweli@nabijaczleweli.xyz> in
bugs.debian.org/1015273
* NEWS (Bug fixes): Mention this.

2 years agotests: port chmod/setgid.sh to macOS 12
Paul Eggert [Sat, 18 Feb 2023 21:29:41 +0000 (13:29 -0800)] 
tests: port chmod/setgid.sh to macOS 12

* tests/chmod/setgid.sh: Try all the groups you’re a member of,
in case id -g returns 4294967295 (nogroup) which is special
and does not let you chgrp a file to it.

2 years agotests: port better to macOS group numbers
Paul Eggert [Sat, 18 Feb 2023 21:27:45 +0000 (13:27 -0800)] 
tests: port better to macOS group numbers

* init.cfg (groups): Port better to macOS 12, where
group 4294967295 (nogroup) is special: you can be a member
without being able to chgrp files to the group.

2 years agobuild: update gnulib submodule to latest
Paul Eggert [Sat, 18 Feb 2023 20:02:11 +0000 (12:02 -0800)] 
build: update gnulib submodule to latest

2 years agocp: fclonefileat security fix + CLONE_ACL + fixups
Paul Eggert [Fri, 10 Feb 2023 21:34:54 +0000 (13:34 -0800)] 
cp: fclonefileat security fix + CLONE_ACL + fixups

* src/copy.c: Some changes if HAVE_FCLONEFILEAT && !USE_XATTR.
(fd_has_acl): New function.
(CLONE_ACL): Default to 0.
(copy_reg): Use CLONE_NOFOLLOW to avoid races like CVE-2021-30995
<https://www.trendmicro.com/en_us/research/22/a/
analyzing-an-old-bug-and-discovering-cve-2021-30995-.html>.
Use CLONE_ACL if available and working, falling back to cloning
without it if it fails due to EINVAL.
If the only problem with fclonefileat is that it would create the
file with the wrong timestamp, or with too few permissions,
do that but fix the timestamp and permissions afterwards,
rather than falling back on a traditional copy.

2 years agomaint: fix some typos in comments
ChuanGang Jiang [Fri, 10 Feb 2023 15:41:33 +0000 (15:41 +0000)] 
maint: fix some typos in comments

* NEWS: s/commmand/command/
* cfg.mk: Adjust old_NEWS_hash with `make update-NEWS-hash`.
* src/expand-common.c: s/specifed/specified/
* src/pr.c: s/e.g/e.g./
* tests/misc/comm.pl: s/ouput/output/
Fixes https://bugs.gnu.org/61405

2 years agocp: simplify infer_scantype
Paul Eggert [Fri, 10 Feb 2023 03:10:47 +0000 (19:10 -0800)] 
cp: simplify infer_scantype

* src/copy.c (infer_scantype): Do not set *SCAN_INFERENCE
when returning a value other than LSEEK_SCANTYPE.
This is just minor refactoring; it simplifies the code a bit.
Callers are uneffected.

doc: document --preserve=mode better

2 years agotail: improve --follow=name with single non regular files
Pádraig Brady [Wed, 1 Feb 2023 20:41:31 +0000 (20:41 +0000)] 
tail: improve --follow=name with single non regular files

* src/tail (tail_forever): Attempt to read() from non blocking
single non regular file, which shouldn't block, but also
read data even when the mtime doesn't change.
* NEWS: Mention the improvement.
* THANKS.in: Thanks for detailed testing.

2 years agotail: fix support for -F with non seekable files
Pádraig Brady [Mon, 30 Jan 2023 21:44:10 +0000 (21:44 +0000)] 
tail: fix support for -F with non seekable files

This was seen to be an issue when following a
symlink that was being updated to point to
different underlying devices.

* src/tail.c (recheck): Guard the lseek() call to only
be performed for regular files.
* NEWS: Mention the bug fix.

2 years agocksum: add --raw option to output a binary digest
Pádraig Brady [Fri, 3 Feb 2023 16:34:18 +0000 (16:34 +0000)] 
cksum: add --raw option to output a binary digest

--raw output is the most composable format, and also is a
robust way to discard the file name without parsing (escaped) output.

Examples:

  $ cksum --raw -a crc "$afile" | basenc --base16
  4ACFC4F0

  $ cksum --raw -a crc "$afile" | basenc --base2msbf
  01001010110011111100010011110000

  $ cksum --raw -a sha256 "$bfile" | basenc --base32
  AAAAAAAADHLGRHAILLQWLAY6SNH7OY5OI2RKNQLSWPY3MCUM4JXQ====

* doc/coreutils.texi (cksum invocation): Describe the new feature.
* src/digest.c (output_file): Inspect the new RAW_DIGEST global,
and output the bytes directly if set.
* src/cksum.c (output_crc): Likewise.
* src/sum.c (output_bsd, output_sysv): Likewise.
* tests/misc/cksum-raw.sh: A new test.
* tests/local.mk: Reference the new test.
* NEWS: Mention the new feature.

2 years agobuild: uptime: avoid issues on systems without utmp.h
Pádraig Brady [Sun, 5 Feb 2023 13:51:20 +0000 (13:51 +0000)] 
build: uptime: avoid issues on systems without utmp.h

* src/uptime.c (print_uptime): Following gnulib commit 9041103
HAVE_UTMP_H will always be defined.  Therefore key on whether
the utmp.ut_type member is present.
* boottime.m4 (GNULIB_BOOT_TIME): Assume utmp.h is present.

2 years agomaint: use alignasof, not stdalign
Paul Eggert [Sat, 4 Feb 2023 22:42:21 +0000 (14:42 -0800)] 
maint: use alignasof, not stdalign

* .gitignore: Update accordingly.
* bootstrap.conf (gnulib_modules): Replace obsolescent stdalign
with alignasof.
* gl/modules/randread (Depends-on): Depend on alignasof, not stdalign.

2 years agomaint: prefer https: to git:
Paul Eggert [Sat, 4 Feb 2023 19:53:50 +0000 (11:53 -0800)] 
maint: prefer https: to git:

The idea is to defend against some adversary-in-the-middle attacks.