]> git.ipfire.org Git - thirdparty/haproxy.git/commitdiff
[BUG] do not dequeue the backend's pending connections on a dead server
authorWilly Tarreau <w@1wt.eu>
Thu, 4 Dec 2008 08:33:58 +0000 (09:33 +0100)
committerWilly Tarreau <w@1wt.eu>
Thu, 4 Dec 2008 08:33:58 +0000 (09:33 +0100)
Kai Krueger found that previous patch was incomplete, because there is
an unconditionnal call to process_srv_queue() in session_free() which
still causes a dead server to consume pending connections from the
backend.

This call was made unconditionnal so that we don't leave unserved
connections in the server queue, for instance connections coming
in with "option persist" which can bypass the server status check.
However, the server must not touch the backend's queue if it is down.

Another fear was that some connections might remain unserved when
the server is using a dynamic maxconn if the number of connections
to the backend is too low. Right now, srv_dynamic_maxconn() ensures
this cannot happen, so the call can remain conditionnal.

The fix consists in allowing a server to process it own queue whatever
its state, but not to touch the backend's queue if it is down. Its
queue should normally be empty when the server is down because it is
redistributed when the server goes down. The only remaining cases are
precisely the persistent connections with "option persist" set, coming
in after the queue has been redispatched. Those ones must still be
processed when a connection terminates.

include/proto/queue.h
src/queue.c
src/session.c

index be78b535612ced7d2b873fede759eafb4f8be653..77964feb3783167ae01f5b1f1dfb41997ce8f4b1 100644 (file)
@@ -64,11 +64,11 @@ static inline struct pendconn *pendconn_from_px(const struct proxy *px) {
 }
 
 /* returns 0 if nothing has to be done for server <s> regarding queued connections,
- * and non-zero otherwise. If the server is down, we always return zero. Suited for
- * and if/else usage.
+ * and non-zero otherwise. If the server is down, we only check its own queue. Suited
+ * for and if/else usage.
  */
 static inline int may_dequeue_tasks(const struct server *s, const struct proxy *p) {
-       return (s && (s->state & SRV_RUNNING) && (s->nbpend || p->nbpend) &&
+       return (s && (s->nbpend || (p->nbpend && (s->state & SRV_RUNNING))) &&
                (!s->maxconn || s->cur_sess < srv_dynamic_maxconn(s)));
 }
 
index 905994abba579e9c435b3f040d7f044f9e9f2445..c5ea0bb21ad15c7cd4128033643a9f631872fe1c 100644 (file)
@@ -89,6 +89,10 @@ void process_srv_queue(struct server *s)
  * returned. Note that neither <srv> nor <px> may be NULL.
  * Priority is given to the oldest request in the queue if both <srv> and <px>
  * have pending requests. This ensures that no request will be left unserved.
+ * The <px> queue is not considered if the server is not RUNNING. The <srv>
+ * queue is still considered in this case, because if some connections remain
+ * there, it means that some requests have been forced there after it was seen
+ * down (eg: due to option persist).
  * The session is immediately marked as "assigned", and both its <srv> and
  * <srv_conn> are set to <srv>,
  */
@@ -100,7 +104,7 @@ struct session *pendconn_get_next_sess(struct server *srv, struct proxy *px)
        ps = pendconn_from_srv(srv);
        pp = pendconn_from_px(px);
        /* we want to get the definitive pendconn in <ps> */
-       if (!pp) {
+       if (!pp || !(srv->state & SRV_RUNNING)) {
                if (!ps)
                        return NULL;
        } else {
index e3a736d2bcca7cd4a95ab564807b6952ac9fec54..0d6ad8db7fdceb07b1b7c6a0f41bec99d4ee4eb9 100644 (file)
@@ -41,8 +41,9 @@ void session_free(struct session *s)
 
        if (s->pend_pos)
                pendconn_free(s->pend_pos);
-       if (s->srv)  /* there may be requests left pending in queue */
+       if (s->srv && may_dequeue_tasks(s->srv, s->be))  /* there may be requests left pending in queue */
                process_srv_queue(s->srv);
+
        if (unlikely(s->srv_conn)) {
                /* the session still has a reserved slot on a server, but
                 * it should normally be only the same as the one above,