]> git.ipfire.org Git - thirdparty/git.git/commitdiff
git_connect(): fix corner cases in downgrading v2 to v0
authorJeff King <peff@peff.net>
Fri, 17 Mar 2023 19:08:51 +0000 (15:08 -0400)
committerJunio C Hamano <gitster@pobox.com>
Fri, 17 Mar 2023 22:15:59 +0000 (15:15 -0700)
There's code in git_connect() that checks whether we are doing a push
with protocol_v2, and if so, drops us to protocol_v0 (since we know
how to do v2 only for fetches). But it misses some corner cases:

  1. it checks the "prog" variable, which is actually the path to
     receive-pack on the remote side. By default this is just
     "git-receive-pack", but it could be an arbitrary string (like
     "/path/to/git receive-pack", etc). We'd accidentally stay in v2
     mode in this case.

  2. besides "receive-pack" and "upload-pack", there's one other value
     we'd expect: "upload-archive" for handling "git archive --remote".
     Like receive-pack, this doesn't understand v2, and should use the
     v0 protocol.

In practice, neither of these causes bugs in the real world so far. We
do send a "we understand v2" probe to the server, but since no server
implements v2 for anything but upload-pack, it's simply ignored. But
this would eventually become a problem if we do implement v2 for those
endpoints, as older clients would falsely claim to understand it,
leading to a server response they can't parse.

We can fix (1) by passing in both the program path and the "name" of the
operation. I treat the name as a string here, because that's the pattern
set in transport_connect(), which is one of our callers (we were simply
throwing away the "name" value there before).

We can fix (2) by allowing only known-v2 protocols ("upload-pack"),
rather than blocking unknown ones ("receive-pack" and "upload-archive").
That will mean whoever eventually implements v2 push will have to adjust
this list, but that's reasonable. We'll do the safe, conservative thing
(sticking to v0) by default, and anybody working on v2 will quickly
realize this spot needs to be updated.

The new tests cover the receive-pack and upload-archive cases above, and
re-confirm that we allow v2 with an arbitrary "--upload-pack" path (that
already worked before this patch, of course, but it would be an easy
thing to break if we flipped the allow/block logic without also handling
"name" separately).

Here are a few miscellaneous implementation notes, since I had to do a
little head-scratching to understand who calls what:

  - transport_connect() is called only for git-upload-archive. For
    non-http git remotes, that resolves to the virtual connect_git()
    function (which then calls git_connect(); confused yet?). So
    plumbing through "name" in connect_git() covers that.

  - for regular fetches and pushes, callers use higher-level functions
    like transport_fetch_refs(). For non-http git remotes, that means
    calling git_connect() under the hood via connect_setup(). And that
    uses the "for_push" flag to decide which name to use.

  - likewise, plumbing like fetch-pack and send-pack may call
    git_connect() directly; they each know which name to use.

  - for remote helpers (including http), we already have separate
    parameters for "name" and "exec" (another name for "prog"). In
    process_connect_service(), we feed the "name" to the helper via
    "connect" or "stateless-connect" directives.

    There's also a "servpath" option, which can be used to tell the
    helper about the "exec" path. But no helpers we implement support
    it! For http it would be useless anyway (no reasonable server
    implementation will allow you to send a shell command to run the
    server). In theory it would be useful for more obscure helpers like
    remote-ext, but even there it is not implemented.

    It's tempting to get rid of it simply to reduce confusion, but we
    have publicly documented it since it was added in fa8c097cc9
    (Support remote helpers implementing smart transports, 2009-12-09),
    so it's possible some helper in the wild is using it.

  - So for v2, helpers (again, including http) are mainly used via
    stateless-connect, driven by the main program. But they do still
    need to decide whether to do a v2 probe. And so there's similar
    logic in remote-curl.c's discover_refs() that looks for
    "git-receive-pack". But it's not buggy in the same way. Since it
    doesn't support servpath, it is always dealing with a "service"
    string like "git-receive-pack". And since it doesn't support
    straight "connect", it can't be used for "upload-archive".

    So we could leave that spot alone. But I've updated it here to match
    the logic we're changing in connect_git(). That seems like the least
    confusing thing for somebody who has to touch both of these spots
    later (say, to add v2 push support). I didn't add a new test to make
    sure this doesn't break anything; we already have several tests (in
    t5551 and elsewhere) that make sure we are using v2 over http.

Signed-off-by: Jeff King <peff@peff.net>
Signed-off-by: Junio C Hamano <gitster@pobox.com>
builtin/fetch-pack.c
builtin/send-pack.c
connect.c
connect.h
remote-curl.c
t/t5702-protocol-v2.sh
transport.c

index afe679368deec2a0288de1606259b73847ce434b..a71dbc9988d78b92f68e8bdff078169963fbd7ec 100644 (file)
@@ -211,8 +211,8 @@ int cmd_fetch_pack(int argc, const char **argv, const char *prefix)
                int flags = args.verbose ? CONNECT_VERBOSE : 0;
                if (args.diag_url)
                        flags |= CONNECT_DIAG_URL;
-               conn = git_connect(fd, dest, args.uploadpack,
-                                  flags);
+               conn = git_connect(fd, dest, "git-upload-pack",
+                                  args.uploadpack, flags);
                if (!conn)
                        return args.diag_url ? 0 : 1;
        }
index 64962be016825a47acddf374cd6ebf80db163af0..21c3cb9b51271066629bb5a92396ec903132b253 100644 (file)
@@ -274,7 +274,7 @@ int cmd_send_pack(int argc, const char **argv, const char *prefix)
                fd[0] = 0;
                fd[1] = 1;
        } else {
-               conn = git_connect(fd, dest, receivepack,
+               conn = git_connect(fd, dest, "git-receive-pack", receivepack,
                        args.verbose ? CONNECT_VERBOSE : 0);
        }
 
index 5ea53deda23527ded642449fa9d803cc12e34477..a0957986c922829e0ab7cb2abdfc04f4d95b406a 100644 (file)
--- a/connect.c
+++ b/connect.c
@@ -1359,6 +1359,7 @@ static void fill_ssh_args(struct child_process *conn, const char *ssh_host,
  * the connection failed).
  */
 struct child_process *git_connect(int fd[2], const char *url,
+                                 const char *name,
                                  const char *prog, int flags)
 {
        char *hostandport, *path;
@@ -1368,10 +1369,11 @@ struct child_process *git_connect(int fd[2], const char *url,
 
        /*
         * NEEDSWORK: If we are trying to use protocol v2 and we are planning
-        * to perform a push, then fallback to v0 since the client doesn't know
-        * how to push yet using v2.
+        * to perform any operation that doesn't involve upload-pack (i.e., a
+        * fetch, ls-remote, etc), then fallback to v0 since we don't know how
+        * to do anything else (like push or remote archive) via v2.
         */
-       if (version == protocol_v2 && !strcmp("git-receive-pack", prog))
+       if (version == protocol_v2 && strcmp("git-upload-pack", name))
                version = protocol_v0;
 
        /* Without this we cannot rely on waitpid() to tell
index c53586e929e8b6f11194d9aeb9934e0fbecd5983..23165fb9172353fb5efe4face1014106503e89d6 100644 (file)
--- a/connect.h
+++ b/connect.h
@@ -7,7 +7,7 @@
 #define CONNECT_DIAG_URL      (1u << 1)
 #define CONNECT_IPV4          (1u << 2)
 #define CONNECT_IPV6          (1u << 3)
-struct child_process *git_connect(int fd[2], const char *url, const char *prog, int flags);
+struct child_process *git_connect(int fd[2], const char *url, const char *name, const char *prog, int flags);
 int finish_connect(struct child_process *conn);
 int git_connection_is_socket(struct child_process *conn);
 int server_supports(const char *feature);
index a76b6405eb2fc443ff22b93b1598892d02508e20..812e940f10a04814dc393eb6544c941b93aafb43 100644 (file)
@@ -472,10 +472,11 @@ static struct discovery *discover_refs(const char *service, int for_push)
 
        /*
         * NEEDSWORK: If we are trying to use protocol v2 and we are planning
-        * to perform a push, then fallback to v0 since the client doesn't know
-        * how to push yet using v2.
+        * to perform any operation that doesn't involve upload-pack (i.e., a
+        * fetch, ls-remote, etc), then fallback to v0 since we don't know how
+        * to do anything else (like push or remote archive) via v2.
         */
-       if (version == protocol_v2 && !strcmp("git-receive-pack", service))
+       if (version == protocol_v2 && strcmp("git-upload-pack", service))
                version = protocol_v0;
 
        /* Add the extra Git-Protocol header */
index 5d42a355a8b81b0f2087eeb8302eb7859c04553c..5d5947ba7353657670448b8d8cc5bcd4d1387000 100755 (executable)
@@ -728,6 +728,33 @@ test_expect_success 'file:// --negotiate-only with protocol v0' '
        test_i18ngrep "negotiate-only requires protocol v2" err
 '
 
+test_expect_success 'push with custom path does not request v2' '
+       rm -f env.trace &&
+       git -C client push \
+               --receive-pack="env >../env.trace; git-receive-pack" \
+               origin HEAD:refs/heads/custom-push-test &&
+       test_path_is_file env.trace &&
+       ! grep ^GIT_PROTOCOL env.trace
+'
+
+test_expect_success 'fetch with custom path does request v2' '
+       rm -f env.trace &&
+       git -C client fetch \
+               --upload-pack="env >../env.trace; git-upload-pack" \
+               origin HEAD &&
+       grep ^GIT_PROTOCOL=version=2 env.trace
+'
+
+test_expect_success 'archive with custom path does not request v2' '
+       rm -f env.trace &&
+       git -C client archive \
+               --exec="env >../env.trace; git-upload-archive" \
+               --remote=origin \
+               HEAD >/dev/null &&
+       test_path_is_file env.trace &&
+       ! grep ^GIT_PROTOCOL env.trace
+'
+
 # Test protocol v2 with 'http://' transport
 #
 . "$TEST_DIRECTORY"/lib-httpd.sh
index 70e9c188a398db37d316becb9f8393a46ab350c5..212e9e0a7c815b20282cbd949fb50157a6b678bc 100644 (file)
@@ -275,8 +275,12 @@ static int connect_setup(struct transport *transport, int for_push)
        }
 
        data->conn = git_connect(data->fd, transport->url,
-                                for_push ? data->options.receivepack :
-                                data->options.uploadpack,
+                                for_push ?
+                                       "git-receive-pack" :
+                                       "git-upload-pack",
+                                for_push ?
+                                       data->options.receivepack :
+                                       data->options.uploadpack,
                                 flags);
 
        return 0;
@@ -877,7 +881,7 @@ static int connect_git(struct transport *transport, const char *name,
 {
        struct git_transport_data *data = transport->data;
        data->conn = git_connect(data->fd, transport->url,
-                                executable, 0);
+                                name, executable, 0);
        fd[0] = data->fd[0];
        fd[1] = data->fd[1];
        return 0;