]> git.ipfire.org Git - thirdparty/vectorscan.git/commitdiff
Corpus generator: fix random char value of UTF-8.
authorChang, Harry <harry.chang@intel.com>
Thu, 12 May 2022 02:15:07 +0000 (02:15 +0000)
committerKonstantinos Margaritis <konstantinos@vectorcamp.gr>
Mon, 29 Aug 2022 12:03:26 +0000 (15:03 +0300)
fixes github issue #184

util/ng_corpus_generator.cpp

index 145a0ab8ee5c365ad53611fd0740897091a956eb..6c3f613d214ae957170cbd754a60133cfedeb483 100644 (file)
@@ -476,14 +476,14 @@ void CorpusGeneratorUtf8::generateCorpus(vector<string> &data) {
  * that we've been asked for. */
 unichar CorpusGeneratorUtf8::getRandomChar() {
     u32 range = MAX_UNICODE + 1
-                - (UNICODE_SURROGATE_MAX + UNICODE_SURROGATE_MIN + 1);
+                - (UNICODE_SURROGATE_MAX - UNICODE_SURROGATE_MIN + 1);
     range = min(cProps.alphabetSize, range);
     assert(range);
 
     unichar c = 'a' + cProps.rand(0, range - 1);
 
     if (c >= UNICODE_SURROGATE_MIN) {
-        c =+ UNICODE_SURROGATE_MAX + 1;
+        c += UNICODE_SURROGATE_MAX - UNICODE_SURROGATE_MIN + 1;
     }
 
     return c % (MAX_UNICODE + 1);