dnsdist: Compute backend latency earlier, to avoid internal latency

author Remi Gacogne <remi.gacogne@powerdns.com>

Fri, 17 Jun 2022 15:03:53 +0000 (17:03 +0200)

committer Remi Gacogne <remi.gacogne@powerdns.com>

Fri, 17 Jun 2022 15:03:53 +0000 (17:03 +0200)
author Remi Gacogne <remi.gacogne@powerdns.com>
Fri, 17 Jun 2022 15:03:53 +0000 (17:03 +0200)
committer Remi Gacogne <remi.gacogne@powerdns.com>
Fri, 17 Jun 2022 15:03:53 +0000 (17:03 +0200)
diff --git a/pdns/dnsdist-tcp.cc b/pdns/dnsdist-tcp.cc

index a5b02e19a654a2456ac7b01a67d370995f99f3bd..11de6df4538ca4f524a1b7002b15dbcab189d8a1 100644 (file)
--- a/pdns/dnsdist-tcp.cc
+++ b/pdns/dnsdist-tcp.cc
@@ -238,11 +238,6 @@ static IOState sendQueuedResponses(std::shared_ptr<IncomingTCPConnectionState>&
    return IOState::Done;
  }
  
-static void updateTCPLatency(const std::shared_ptr<DownstreamState>& ds, double udiff)
-{
-  ds->latencyUsecTCP = (127.0 * ds->latencyUsecTCP / 128.0) + udiff/128.0;
-}
-
  static void handleResponseSent(std::shared_ptr<IncomingTCPConnectionState>& state, const TCPResponse& currentResponse)
  {
    if (currentResponse.d_idstate.qtype == QType::AXFR || currentResponse.d_idstate.qtype == QType::IXFR) {
@@ -262,8 +257,6 @@ static void handleResponseSent(std::shared_ptr<IncomingTCPConnectionState>& stat
        backendProtocol = dnsdist::Protocol::DoTCP;
      }
      ::handleResponseSent(ids, udiff, state->d_ci.remote, ds->d_config.remote, static_cast<unsigned int>(currentResponse.d_buffer.size()), currentResponse.d_cleartextDH, backendProtocol);
-
-    updateTCPLatency(ds, udiff);
    }
  }
  
diff --git a/pdns/dnsdist-web.cc b/pdns/dnsdist-web.cc

index c0f2ece9d82bf05d2ebb7d6bc9dc9042ed229128..4eb6492795dab9aadab6a0151d14179e3bd98e40 100644 (file)
--- a/pdns/dnsdist-web.cc
+++ b/pdns/dnsdist-web.cc
@@ -548,6 +548,8 @@ static void handlePrometheus(const YaHTTP::Request& req, YaHTTP::Response& resp)
    output << "# TYPE " << statesbase << "tcpavgconnduration "          << "gauge"                                                             << "\n";
    output << "# HELP " << statesbase << "tlsresumptions "              << "The number of times a TLS session has been resumed"                << "\n";
    output << "# TYPE " << statesbase << "tlsersumptions "              << "counter"                                                           << "\n";
+  output << "# HELP " << statesbase << "tcplatency "                  << "Server's latency when answering TCP questions in milliseconds"     << "\n";
+  output << "# TYPE " << statesbase << "tcplatency "                  << "gauge"                                                             << "\n";
  
    for (const auto& state : *states) {
      string serverName;
@@ -568,8 +570,10 @@ static void handlePrometheus(const YaHTTP::Request& req, YaHTTP::Response& resp)
      output << statesbase << "queries"                      << label << " " << state->queries.load()              << "\n";
      output << statesbase << "responses"                    << label << " " << state->responses.load()            << "\n";
      output << statesbase << "drops"                        << label << " " << state->reuseds.load()              << "\n";
-    if (state->isUp())
-        output << statesbase << "latency"                  << label << " " << state->latencyUsec/1000.0          << "\n";
+    if (state->isUp()) {
+      output << statesbase << "latency"                    << label << " " << state->latencyUsec/1000.0          << "\n";
+      output << statesbase << "tcplatency"                 << label << " " << state->latencyUsecTCP/1000.0       << "\n";
+    }
      output << statesbase << "senderrors"                   << label << " " << state->sendErrors.load()           << "\n";
      output << statesbase << "outstanding"                  << label << " " << state->outstanding.load()          << "\n";
      output << statesbase << "order"                        << label << " " << state->d_config.order              << "\n";
@@ -996,12 +1000,14 @@ static void addServerToJSON(Json::array& servers, int id, const std::shared_ptr<
      {"tcpAvgQueriesPerConnection", (double)a->tcpAvgQueriesPerConnection},
      {"tcpAvgConnectionDuration", (double)a->tcpAvgConnectionDuration},
      {"tlsResumptions", (double)a->tlsResumptions},
+    {"tcpLatency", (double)(a->latencyUsecTCP/1000.0)},
      {"dropRate", (double)a->dropRate}
    };
  
    /* sending a latency for a DOWN server doesn't make sense */
    if (a->d_config.availability == DownstreamState::Availability::Down) {
      server["latency"] = nullptr;
+    server["tcpLatency"] = nullptr;
    }
  
    servers.push_back(std::move(server));
diff --git a/pdns/dnsdist.cc b/pdns/dnsdist.cc

index 6e11a4c8ce5e3593e4eed8088989bd5b39f34830..e67d7a7a6beb743a525e2f609b978eb24b1402c6 100644 (file)
--- a/pdns/dnsdist.cc
+++ b/pdns/dnsdist.cc
@@ -654,6 +654,11 @@ void responderThread(std::shared_ptr<DownstreamState> dss)
          dh->id = ids->origID;
          ++dss->responses;
  
+        double udiff = ids->sentTime.udiff();
+        // do that _before_ the processing, otherwise it's not fair to the backend
+        cerr<<"udiff is "<<(udiff/1000.0)<<endl;
+        dss->latencyUsec = (127.0 * dss->latencyUsec / 128.0) + udiff / 128.0;
+
          /* don't call processResponse for DOH */
          if (du) {
  #ifdef HAVE_DNS_OVER_HTTPS
@@ -686,14 +691,12 @@ void responderThread(std::shared_ptr<DownstreamState> dss)
            sendUDPResponse(origFD, response, dr.delayMsec, ids->hopLocal, ids->hopRemote);
          }
  
-        double udiff = ids->sentTime.udiff();
+        udiff = ids->sentTime.udiff();
          vinfolog("Got answer from %s, relayed to %s, took %f usec", dss->d_config.remote.toStringWithPort(), ids->origRemote.toStringWithPort(), udiff);
  
          handleResponseSent(*ids, udiff, *dr.remote, dss->d_config.remote, static_cast<unsigned int>(got), cleartextDH, dss->getProtocol());
          dss->releaseState(queryId);
  
-        dss->latencyUsec = (127.0 * dss->latencyUsec / 128.0) + udiff/128.0;
-
          doLatencyStats(udiff);
        }
      }
@@ -1384,8 +1387,6 @@ public:
  
      handleResponseSent(ids, udiff, *dr.remote, d_ds->d_config.remote, response.d_buffer.size(), cleartextDH, d_ds->getProtocol());
  
-    d_ds->latencyUsec = (127.0 * d_ds->latencyUsec / 128.0) + udiff/128.0;
-
      doLatencyStats(udiff);
    }
  
diff --git a/pdns/dnsdistdist/dnsdist-tcp-downstream.cc b/pdns/dnsdistdist/dnsdist-tcp-downstream.cc

index 1dbf7cc96c9450316c1164f363c88cd322f2cd59..64f731eb2333a14db19e95288ed64e217bf26363 100644 (file)
--- a/pdns/dnsdistdist/dnsdist-tcp-downstream.cc
+++ b/pdns/dnsdistdist/dnsdist-tcp-downstream.cc
@@ -659,6 +659,9 @@ IOState TCPConnectionToBackend::handleResponse(std::shared_ptr<TCPConnectionToBa
  
    --conn->d_ds->outstanding;
    auto ids = std::move(it->second.d_query.d_idstate);
+  const double udiff = ids.sentTime.udiff();
+  conn->d_ds->latencyUsecTCP = (127.0 * conn->d_ds->latencyUsecTCP / 128.0) + udiff / 128.0;
+
    d_pendingResponses.erase(it);
    /* marking as idle for now, so we can accept new queries if our queues are empty */
    if (d_pendingQueries.empty() && d_pendingResponses.empty()) {
author	Remi Gacogne <remi.gacogne@powerdns.com>
	Fri, 17 Jun 2022 15:03:53 +0000 (17:03 +0200)
committer	Remi Gacogne <remi.gacogne@powerdns.com>
	Fri, 17 Jun 2022 15:03:53 +0000 (17:03 +0200)
pdns/dnsdist-tcp.cc		patch \| blob \| blame \| history
pdns/dnsdist-web.cc		patch \| blob \| blame \| history
pdns/dnsdist.cc		patch \| blob \| blame \| history
pdns/dnsdistdist/dnsdist-tcp-downstream.cc		patch \| blob \| blame \| history