]> git.ipfire.org Git - thirdparty/glibc.git/commit
Update to Unicode 17.0.0 [BZ #33289]
authorMike FABIAN <mfabian@redhat.com>
Mon, 18 Aug 2025 07:24:06 +0000 (09:24 +0200)
committerMike FABIAN <mfabian@redhat.com>
Thu, 11 Sep 2025 07:42:18 +0000 (09:42 +0200)
commit88dc93cb400b832d2478c6c70bc4cf8c5b37432d
treeb15a7238347630068b2a43460c4121b549fa4163
parente20ca759af46fbb7eae20c52b857e7636eb50e1b
Update to Unicode 17.0.0 [BZ #33289]

Unicode 17.0.0 Support: Character encoding, character type info, and
transliteration tables are all updated to Unicode 17.0.0, using
the generator scripts contributed by Mike FABIAN (Red Hat).

Changes in CHARMAP and WIDTH:

    Total added characters in newly generated CHARMAP: 4803
    Total removed characters in newly generated WIDTH: 0
    Total changed characters in newly generated WIDTH: 0
    Total added characters in newly generated WIDTH: 4512

Some combining characters and other non-spacing marks have been added
with WIDTH 0. Lots of characters have been added with WIDTH 2, most of
them are CJK Ideographs plus a few Tangut characters and 7 emoji.

Changes in ctype:

    alpha: Added 4672 characters in new ctype which were not in old ctype
    combining: Added 42 characters in new ctype which were not in old ctype
    combining_level3: Added 8 characters in new ctype which were not in old ctype
    graph: Added 4803 characters in new ctype which were not in old ctype
    lower: Missing: ʕ 0x295 LATIN LETTER PHARYNGEAL VOICED FRICATIVE
    lower: Added 27 characters in new ctype which were not in old ctype
    print: Added 4803 characters in new ctype which were not in old ctype
    punct: Added 131 characters in new ctype which were not in old ctype
    tolower: Added 28 characters in new ctype which were not in old ctype
    totitle: Added 28 characters in new ctype which were not in old ctype
    toupper: Added 28 characters in new ctype which were not in old ctype
    upper: Added 28 characters in new ctype which were not in old ctype

Nothing suspicious in the additions.

About the character removed from lower:

ʕ 0x295 LATIN LETTER PHARYNGEAL VOICED FRICATIVE

In UnicodeData.txt it changed from 'Ll' (Letter Lowercase) to 'Lo' (Letter Other):

-0295;LATIN LETTER PHARYNGEAL VOICED FRICATIVE;Ll;0;L;;;;;N;LATIN LETTER REVERSED GLOTTAL STOP;;;;
+0295;LATIN LETTER PHARYNGEAL VOICED FRICATIVE;Lo;0;L;;;;;N;LATIN LETTER REVERSED GLOTTAL STOP;;;;

Resolves: BZ #33289

Reviewed-by: Collin Funk <collin.funk1@gmail.com>
15 files changed:
localedata/charmaps/UTF-8
localedata/locales/i18n_ctype
localedata/locales/tr_TR
localedata/locales/translit_circle
localedata/locales/translit_cjk_compat
localedata/locales/translit_combining
localedata/locales/translit_compat
localedata/locales/translit_font
localedata/locales/translit_fraction
localedata/unicode-gen/DerivedCoreProperties.txt
localedata/unicode-gen/EastAsianWidth.txt
localedata/unicode-gen/HangulSyllableType.txt
localedata/unicode-gen/Makefile
localedata/unicode-gen/UnicodeData.txt
localedata/unicode-gen/unicode-license.txt