[cover] Small compression ratio improvement

author Nick Terrell <terrelln@fb.com>

Fri, 18 May 2018 22:25:10 +0000 (15:25 -0700)

committer Nick Terrell <terrelln@fb.com>

Fri, 18 May 2018 23:15:27 +0000 (16:15 -0700)
author Nick Terrell <terrelln@fb.com>
Fri, 18 May 2018 22:25:10 +0000 (15:25 -0700)
committer Nick Terrell <terrelln@fb.com>
Fri, 18 May 2018 23:15:27 +0000 (16:15 -0700)
diff --git a/lib/dictBuilder/cover.c b/lib/dictBuilder/cover.c

index 6d473624d2993f42e34a79c1593fc72231b4017b..448f713720fa04fa8c0454759b5f9196b5727843 100644 (file)
--- a/lib/dictBuilder/cover.c
+++ b/lib/dictBuilder/cover.c
@@ -620,7 +620,7 @@ static size_t COVER_buildDictionary(const COVER_ctx_t *ctx, U32 *freqs,
    /* Divide the data up into epochs of equal size.
     * We will select at least one segment from each epoch.
     */
-  const U32 epochs = (U32)(dictBufferCapacity / parameters.k);
+  const U32 epochs = MAX(1, (U32)(dictBufferCapacity / parameters.k / 4));
    const U32 epochSize = (U32)(ctx->suffixSize / epochs);
    size_t epoch;
    DISPLAYLEVEL(2, "Breaking content into %u epochs of size %u\n", epochs,
author	Nick Terrell <terrelln@fb.com>
	Fri, 18 May 2018 22:25:10 +0000 (15:25 -0700)
committer	Nick Terrell <terrelln@fb.com>
	Fri, 18 May 2018 23:15:27 +0000 (16:15 -0700)