update_unicode.sh: move it into contrib/update-unicode

author Beat Bolli <dev+git@drbeat.li>

Tue, 13 Dec 2016 23:31:39 +0000 (00:31 +0100)

committer Junio C Hamano <gitster@pobox.com>

Wed, 14 Dec 2016 00:12:47 +0000 (16:12 -0800)
author Beat Bolli <dev+git@drbeat.li>
Tue, 13 Dec 2016 23:31:39 +0000 (00:31 +0100)
committer Junio C Hamano <gitster@pobox.com>
Wed, 14 Dec 2016 00:12:47 +0000 (16:12 -0800)
diff --git a/.gitignore b/.gitignore

index a05241916c9c9a3760a6e98670a7f6427d553d77..203703a4929f5ade65f77889e1055c1c979b9d14 100644 (file)
--- a/.gitignore
+++ b/.gitignore
@@ -231,7 +231,6 @@
  /config.mak.autogen
  /config.mak.append
  /configure
-/unicode
  /tags
  /TAGS
  /cscope*
diff --git a/contrib/update-unicode/.gitignore b/contrib/update-unicode/.gitignore

new file mode 100644 (file)

index 0000000..b0ebc6a
--- /dev/null
+++ b/contrib/update-unicode/.gitignore
@@ -0,0 +1,3 @@
+uniset/
+UnicodeData.txt
+EastAsianWidth.txt
diff --git a/contrib/update-unicode/README b/contrib/update-unicode/README

new file mode 100644 (file)

index 0000000..b9e2fc8
--- /dev/null
+++ b/contrib/update-unicode/README
@@ -0,0 +1,20 @@
+TL;DR: Run update_unicode.sh after the publication of a new Unicode
+standard and commit the resulting unicode_widths.h file.
+
+The long version
+================
+
+The Git source code ships the file unicode_widths.h which contains
+tables of zero and double width Unicode code points, respectively.
+These tables are generated using update_unicode.sh in this directory.
+update_unicode.sh itself uses a third-party tool, uniset, to query two
+Unicode data files for the interesting code points.
+
+On first run, update_unicode.sh clones uniset from Github and builds it.
+This requires a current-ish version of autoconf (2.69 works per December
+2016).
+
+On each run, update_unicode.sh checks whether more recent Unicode data
+files are available from the Unicode consortium, and rebuilds the header
+unicode_widths.h with the new data. The new header can then be
+committed.
diff --git a/update_unicode.sh b/contrib/update-unicode/update_unicode.sh

similarity index 90%

rename from update_unicode.sh

rename to contrib/update-unicode/update_unicode.sh

index 27af77c7df63f8a9039d77b332ebb06d69f02f65..7b901266c4dd94d29463320a3eb2afa0ea737012 100755 (executable)
--- a/update_unicode.sh
+++ b/contrib/update-unicode/update_unicode.sh
@@ -5,11 +5,9 @@
  #Mn Nonspacing_Mark a nonspacing combining mark (zero advance width)
  #Cf Format          a format control character
  #
-UNICODEWIDTH_H=../unicode_width.h
-if ! test -d unicode; then
-       mkdir unicode
-fi &&
-( cd unicode &&
+cd "$(dirname "$0")"
+UNICODEWIDTH_H=$(git rev-parse --show-toplevel)/unicode_width.h
+(
         if ! test -f UnicodeData.txt; then
                 wget http://www.unicode.org/Public/UCD/latest/ucd/UnicodeData.txt
         fi &&
author	Beat Bolli <dev+git@drbeat.li>
	Tue, 13 Dec 2016 23:31:39 +0000 (00:31 +0100)
committer	Junio C Hamano <gitster@pobox.com>
	Wed, 14 Dec 2016 00:12:47 +0000 (16:12 -0800)
.gitignore		patch \| blob \| blame \| history
contrib/update-unicode/.gitignore	[new file with mode: 0644]	patch \| blob
contrib/update-unicode/README	[new file with mode: 0644]	patch \| blob
contrib/update-unicode/update_unicode.sh	[moved from update_unicode.sh with 90% similarity]	patch \| blob \| blame \| history