]> git.ipfire.org Git - thirdparty/sqlite.git/commitdiff
Fix comments in generated file fts3_unicode2.c.
authordan <dan@noemail.net>
Fri, 25 May 2012 18:48:48 +0000 (18:48 +0000)
committerdan <dan@noemail.net>
Fri, 25 May 2012 18:48:48 +0000 (18:48 +0000)
FossilOrigin-Name: 3dc567ef4702d9a63d78d11ff705cb7f7359f7a6

ext/fts3/fts3_unicode2.c
ext/fts3/unicode/mkunicode.tcl
manifest
manifest.uuid

index 89bb292dbd68ab53f19621ab5ea754f85e787276..51d60549b7b64bdd1a417cca7dc484ea04d1d141 100644 (file)
@@ -1,10 +1,41 @@
+/*
+** 2012 May 25
+**
+** The author disclaims copyright to this source code.  In place of
+** a legal notice, here is a blessing:
+**
+**    May you do good and not evil.
+**    May you find forgiveness for yourself and forgive others.
+**    May you share freely, never taking more than you give.
+**
+******************************************************************************
+*/
+
 /*
 ** DO NOT EDIT THIS MACHINE GENERATED FILE.
 */
 
 #include <assert.h>
 
+/*
+** Return true if the argument corresponds to a unicode codepoint
+** classified as either a letter or a number. Otherwise false.
+**
+** The results are undefined if the value passed to this function
+** is less than zero.
+*/
 int sqlite3FtsUnicodeIsalnum(int c){
+  /* Each unsigned integer in the following array corresponds to a contiguous
+  ** range of unicode codepoints that are not either letters or numbers (i.e.
+  ** codepoints for which this function should return 0).
+  **
+  ** The most significant 22 bits in each 32-bit value contain the first 
+  ** codepoint in the range. The least significant 10 bits are used to store
+  ** the size of the range (always at least 1). In other words, the value 
+  ** ((C<<22) + N) represents a range of N codepoints starting with codepoint 
+  ** C. It is not possible to represent a range larger than 1023 codepoints 
+  ** using this format.
+  */
   const static unsigned int aEntry[] = {
     0x00000030, 0x0000E807, 0x00016C06, 0x0001EC2F, 0x0002AC07,
     0x0002D001, 0x0002D803, 0x0002EC01, 0x0002FC01, 0x00035C01,
@@ -113,6 +144,15 @@ int sqlite3FtsUnicodeIsalnum(int c){
 }
 
 
+/*
+** Interpret the argument as a unicode codepoint. If the codepoint
+** is an upper case character that has a lower case equivalent,
+** return the codepoint corresponding to the lower case version.
+** Otherwise, return a copy of the argument.
+**
+** The results are undefined if the value passed to this function
+** is less than zero.
+*/
 int sqlite3FtsUnicodeTolower(int c){
   /* Each entry in the following array defines a rule for folding a range
   ** of codepoints to lower case. The rule applies to a range of nRange
index 8e130ed9406ea01ed1ef7f822a2253f12b914ad5..7e93a531b25246f4aa942c94d542ee7e81f04acf 100644 (file)
@@ -77,6 +77,20 @@ proc an_print_range_array {lRange} {
   if {$iFirstMax >= (1<<22)} {error "first-max is too large for format"}
   if {$nRangeMax >= (1<<10)} {error "range-max is too large for format"}
 
+  puts -nonewline "  "
+  puts [string trim {
+  /* Each unsigned integer in the following array corresponds to a contiguous
+  ** range of unicode codepoints that are not either letters or numbers (i.e.
+  ** codepoints for which this function should return 0).
+  **
+  ** The most significant 22 bits in each 32-bit value contain the first 
+  ** codepoint in the range. The least significant 10 bits are used to store
+  ** the size of the range (always at least 1). In other words, the value 
+  ** ((C<<22) + N) represents a range of N codepoints starting with codepoint 
+  ** C. It is not possible to represent a range larger than 1023 codepoints 
+  ** using this format.
+  */
+  }]
   puts -nonewline "  const static unsigned int aEntry\[\] = \{"
   set i 0
   foreach range $lRange {
@@ -92,6 +106,13 @@ proc an_print_range_array {lRange} {
 }
 
 proc print_isalnum {zFunc lRange} {
+  puts "/*"
+  puts "** Return true if the argument corresponds to a unicode codepoint"
+  puts "** classified as either a letter or a number. Otherwise false."
+  puts "**"
+  puts "** The results are undefined if the value passed to this function"
+  puts "** is less than zero."
+  puts "*/"
   puts "int ${zFunc}\(int c)\{"
   an_print_range_array $lRange
   puts {
@@ -321,6 +342,15 @@ proc print_tolower {zFunc} {
   set lRecord [tl_create_records]
 
   set lHigh [list]
+  puts "/*"
+  puts "** Interpret the argument as a unicode codepoint. If the codepoint"
+  puts "** is an upper case character that has a lower case equivalent,"
+  puts "** return the codepoint corresponding to the lower case version."
+  puts "** Otherwise, return a copy of the argument."
+  puts "**"
+  puts "** The results are undefined if the value passed to this function"
+  puts "** is less than zero."
+  puts "*/"
   puts "int ${zFunc}\(int c)\{"
   tl_print_table_header
   foreach entry $lRecord { 
@@ -397,6 +427,19 @@ proc print_tolower_test {zFunc} {
 
 proc print_fileheader {} {
   puts [string trim {
+/*
+** 2012 May 25
+**
+** The author disclaims copyright to this source code.  In place of
+** a legal notice, here is a blessing:
+**
+**    May you do good and not evil.
+**    May you find forgiveness for yourself and forgive others.
+**    May you share freely, never taking more than you give.
+**
+******************************************************************************
+*/
+
 /*
 ** DO NOT EDIT THIS MACHINE GENERATED FILE.
 */
@@ -462,5 +505,3 @@ if {$::generate_test_code} {
   print_test_main 
 }
 
-
-
index 0d95fce755192d13ec84eefd455a673188258386..c55da8cba4e6fe035ad01d457ecd853aeb9eb8d8 100644 (file)
--- a/manifest
+++ b/manifest
@@ -1,5 +1,5 @@
-C Add\san\sexperimental\stokenizer\sto\sfts4\s-\s"unicode".\sThis\stokenizer\sworks\sin\sthe\ssame\sway\sexcept\sthat\sit\sunderstands\sunicode\s"simple\scase\sfolding"\sand\srecognizes\sall\scharacters\snot\sclassified\sas\s"Letters"\sor\s"Numbers"\sby\sunicode\sas\stoken\sseparators.
-D 2012-05-25T17:50:19.893
+C Fix\scomments\sin\sgenerated\sfile\sfts3_unicode2.c.
+D 2012-05-25T18:48:48.456
 F Makefile.arm-wince-mingw32ce-gcc d6df77f1f48d690bd73162294bbba7f59507c72f
 F Makefile.in 2f37e468503dbe79d35c9f6dffcf3fae1ae9ec20
 F Makefile.linux-gcc 91d710bdc4998cb015f39edf3cb314ec4f4d7e23
@@ -71,14 +71,14 @@ F ext/fts3/fts3_tokenizer.c 3da7254a9881f7e270ab28e2004e0d22b3212bce
 F ext/fts3/fts3_tokenizer.h 66dec98e365854b6cd2d54f1a96bb6d428fc5a68
 F ext/fts3/fts3_tokenizer1.c 5c98225a53705e5ee34824087478cf477bdb7004
 F ext/fts3/fts3_unicode.c 033ee5d10d1a69613890d892829e6d3cf7177e40
-F ext/fts3/fts3_unicode2.c 83ad4e6a2e5ef96d89d0822810be74748a91b94f
+F ext/fts3/fts3_unicode2.c 6989db92aff500ae9795c1b16720ff5a17bfbf0f
 F ext/fts3/fts3_write.c cd4af00b3b0512b4d76177a267fcaafab44cbce4
 F ext/fts3/fts3speed.tcl b54caf6a18d38174f1a6e84219950d85e98bb1e9
 F ext/fts3/mkfts3amal.tcl 252ecb7fe6467854f2aa237bf2c390b74e71f100
 F ext/fts3/tool/fts3view.c 6cfc5b67a5f0e09c0d698f9fd012c784bfaa9197
 F ext/fts3/unicode/CaseFolding.txt 8c678ca52ecc95e16bc7afc2dbf6fc9ffa05db8c
 F ext/fts3/unicode/UnicodeData.txt cd07314edb62d49fde34debdaf92fa2aa69011e7
-F ext/fts3/unicode/mkunicode.tcl 1f50ed0021cb7415b3d24505512996037b2e5ec4
+F ext/fts3/unicode/mkunicode.tcl 3ff244e41222fa5e43c60739c501131a2395b310
 F ext/icu/README.txt bf8461d8cdc6b8f514c080e4e10dc3b2bbdfefa9
 F ext/icu/icu.c eb9ae1d79046bd7871aa97ee6da51eb770134b5a
 F ext/icu/sqliteicu.h 728867a802baa5a96de7495e9689a8e01715ef37
@@ -1004,10 +1004,7 @@ F tool/tostr.awk e75472c2f98dd76e06b8c9c1367f4ab07e122d06
 F tool/vdbe-compress.tcl d70ea6d8a19e3571d7ab8c9b75cba86d1173ff0f
 F tool/warnings-clang.sh a8a0a3babda96dfb1ff51adda3cbbf3dfb7266c2
 F tool/warnings.sh fbc018d67fd7395f440c28f33ef0f94420226381
-P 6d326d44fd1d626aae0e8456e5fa2049f1ce0789
-R cf548df9de4c764e0b1e09fe3f006b01
-T *branch * fts4-unicode
-T *sym-fts4-unicode *
-T -sym-trunk *
+P 0c13570ec78c6887103dc99b81b470829fa28385
+R 9b33e64eb6dd16074aa14c4bbd40c221
 U dan
-Z 9e1fccc2ef84e29acb91c1b6fba69301
+Z a6323715198787ea389cc785d187a551
index ed0143c30ff7f1d46536c0157a4eb9e788a49770..327ad0f2db0d0e6a5fb804464921902c498a1082 100644 (file)
@@ -1 +1 @@
-0c13570ec78c6887103dc99b81b470829fa28385
\ No newline at end of file
+3dc567ef4702d9a63d78d11ff705cb7f7359f7a6
\ No newline at end of file