Document counter-intuitive round-robin cache_dir selection bias; decrease it.

author Alex Rousskov <rousskov@measurement-factory.com>

Sat, 26 Apr 2014 17:30:33 +0000 (11:30 -0600)

committer Alex Rousskov <rousskov@measurement-factory.com>

Sat, 26 Apr 2014 17:30:33 +0000 (11:30 -0600)
author Alex Rousskov <rousskov@measurement-factory.com>
Sat, 26 Apr 2014 17:30:33 +0000 (11:30 -0600)
committer Alex Rousskov <rousskov@measurement-factory.com>
Sat, 26 Apr 2014 17:30:33 +0000 (11:30 -0600)
diff --git a/src/cf.data.pre b/src/cf.data.pre

index 194ee1696a2e9c7301e97d89dbd10a1ed7e12c85..07851c60e7662acad7ea028dbbe42b02bf57079d 100644 (file)
--- a/src/cf.data.pre
+++ b/src/cf.data.pre
@@ -3583,6 +3583,19 @@ DOC_START
         disks. This algorithm does not spread objects by size, so any
         I/O loading per-disk may appear very unbalanced and volatile.
  
+       If several cache_dirs use similar min-size, max-size, or other
+       limits to to reject certain responses, then do not group such
+       cache_dir lines together, to avoid round-robin selection bias
+       towards the first cache_dir after the group. Instead, interleave
+       cache_dir lines from different groups. For example:
+
+               store_dir_select_algorithm round-robin
+               cache_dir rock /hdd1 ... min-size=100000
+               cache_dir rock /ssd1 ... max-size=99999
+               cache_dir rock /hdd2 ... min-size=100000
+               cache_dir rock /ssd2 ... max-size=99999
+               cache_dir rock /hdd3 ... min-size=100000
+               cache_dir rock /ssd3 ... max-size=99999
  DOC_END
  
  NAME: max_open_disk_fds
diff --git a/src/store_dir.cc b/src/store_dir.cc

index 8d124736b88af5bacc18478722dfa7d5dadc4cf5..28d1c32a1f44b538b5a55b9f67d7a7f713b8aa6b 100644 (file)
--- a/src/store_dir.cc
+++ b/src/store_dir.cc
@@ -207,22 +207,22 @@ SwapDir::objectSizeIsAcceptable(int64_t objsize) const
  static int
  storeDirSelectSwapDirRoundRobin(const StoreEntry * e)
  {
-    static int dirn = 0;
-    int i;
-    int load;
-    RefCount<SwapDir> sd;
-
      // e->objectLen() is negative at this point when we are still STORE_PENDING
      ssize_t objsize = e->mem_obj->expectedReplySize();
      if (objsize != -1)
          objsize += e->mem_obj->swap_hdr_sz;
  
-    for (i = 0; i < Config.cacheSwap.n_configured; ++i) {
-        if (++dirn >= Config.cacheSwap.n_configured)
-            dirn = 0;
+    // Increment the first candidate once per selection (not once per
+    // iteration) to reduce bias when some disk(s) attract more entries.
+    static int firstCandidate = 0;
+    if (++firstCandidate >= Config.cacheSwap.n_configured)
+        firstCandidate = 0;
  
-        sd = dynamic_cast<SwapDir *>(INDEXSD(dirn));
+    for (int i = 0; i < Config.cacheSwap.n_configured; ++i) {
+        const int dirn = (firstCandidate + i) % Config.cacheSwap.n_configured;
+        const SwapDir *sd = dynamic_cast<SwapDir*>(INDEXSD(dirn));
  
+        int load = 0;
          if (!sd->canStore(*e, objsize, load))
              continue;
author	Alex Rousskov <rousskov@measurement-factory.com>
	Sat, 26 Apr 2014 17:30:33 +0000 (11:30 -0600)
committer	Alex Rousskov <rousskov@measurement-factory.com>
	Sat, 26 Apr 2014 17:30:33 +0000 (11:30 -0600)
src/cf.data.pre		patch \| blob \| blame \| history
src/store_dir.cc		patch \| blob \| blame \| history