]>
Commit | Line | Data |
---|---|---|
ef416fc2 | 1 | UTF-8 encoded sample plain-text file |
2 | ‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾ | |
3 | ||
4 | Markus Kuhn [ˈmaʳkʊs kuːn] <mkuhn@acm.org> — 2002-07-25 | |
5 | ||
6 | ||
7 | The ASCII compatible UTF-8 encoding used in this plain-text file | |
8 | is defined in Unicode, ISO 10646-1, and RFC 2279. | |
9 | ||
10 | ||
11 | Using Unicode/UTF-8, you can write in emails and source code things such as | |
12 | ||
13 | Mathematics and sciences: | |
14 | ||
15 | ∮ E⋅da = Q, n → ∞, ∑ f(i) = ∏ g(i), ⎧⎡⎛┌─────┐⎞⎤⎫ | |
16 | ⎪⎢⎜│a²+b³ ⎟⎥⎪ | |
17 | ∀x∈ℝ: ⌈x⌉ = −⌊−x⌋, α ∧ ¬β = ¬(¬α ∨ β), ⎪⎢⎜│───── ⎟⎥⎪ | |
18 | ⎪⎢⎜⎷ c₈ ⎟⎥⎪ | |
19 | ℕ ⊆ ℕ₀ ⊂ ℤ ⊂ ℚ ⊂ ℝ ⊂ ℂ, ⎨⎢⎜ ⎟⎥⎬ | |
20 | ⎪⎢⎜ ∞ ⎟⎥⎪ | |
21 | ⊥ < a ≠ b ≡ c ≤ d ≪ ⊤ ⇒ (⟦A⟧ ⇔ ⟪B⟫), ⎪⎢⎜ ⎲ ⎟⎥⎪ | |
22 | ⎪⎢⎜ ⎳aⁱ-bⁱ⎟⎥⎪ | |
23 | 2H₂ + O₂ ⇌ 2H₂O, R = 4.7 kΩ, ⌀ 200 mm ⎩⎣⎝i=1 ⎠⎦⎭ | |
24 | ||
25 | Linguistics and dictionaries: | |
26 | ||
27 | ði ıntəˈnæʃənəl fəˈnɛtık əsoʊsiˈeıʃn | |
28 | Y [ˈʏpsilɔn], Yen [jɛn], Yoga [ˈjoːgɑ] | |
29 | ||
30 | APL: | |
31 | ||
32 | ((V⍳V)=⍳⍴V)/V←,V ⌷←⍳→⍴∆∇⊃‾⍎⍕⌈ | |
33 | ||
34 | Nicer typography in plain text files: | |
35 | ||
36 | ╔══════════════════════════════════════════╗ | |
37 | ║ ║ | |
38 | ║ • ‘single’ and “double” quotes ║ | |
39 | ║ ║ | |
40 | ║ • Curly apostrophes: “We’ve been here” ║ | |
41 | ║ ║ | |
42 | ║ • Latin-1 apostrophe and accents: '´` ║ | |
43 | ║ ║ | |
44 | ║ • ‚deutsche‘ „Anführungszeichen“ ║ | |
45 | ║ ║ | |
46 | ║ • †, ‡, ‰, •, 3–4, —, −5/+5, ™, … ║ | |
47 | ║ ║ | |
48 | ║ • ASCII safety test: 1lI|, 0OD, 8B ║ | |
49 | ║ ╭─────────╮ ║ | |
50 | ║ • the euro symbol: │ 14.95 € │ ║ | |
51 | ║ ╰─────────╯ ║ | |
52 | ╚══════════════════════════════════════════╝ | |
53 | ||
54 | Combining characters: | |
55 | ||
56 | STARGΛ̊TE SG-1, a = v̇ = r̈, a⃑ ⊥ b⃑ | |
57 | ||
58 | Greek (in Polytonic): | |
59 | ||
60 | The Greek anthem: | |
61 | ||
62 | Σὲ γνωρίζω ἀπὸ τὴν κόψη | |
63 | τοῦ σπαθιοῦ τὴν τρομερή, | |
64 | σὲ γνωρίζω ἀπὸ τὴν ὄψη | |
65 | ποὺ μὲ βία μετράει τὴ γῆ. | |
66 | ||
67 | ᾿Απ᾿ τὰ κόκκαλα βγαλμένη | |
68 | τῶν ῾Ελλήνων τὰ ἱερά | |
69 | καὶ σὰν πρῶτα ἀνδρειωμένη | |
70 | χαῖρε, ὦ χαῖρε, ᾿Ελευθεριά! | |
71 | ||
72 | From a speech of Demosthenes in the 4th century BC: | |
73 | ||
74 | Οὐχὶ ταὐτὰ παρίσταταί μοι γιγνώσκειν, ὦ ἄνδρες ᾿Αθηναῖοι, | |
75 | ὅταν τ᾿ εἰς τὰ πράγματα ἀποβλέψω καὶ ὅταν πρὸς τοὺς | |
76 | λόγους οὓς ἀκούω· τοὺς μὲν γὰρ λόγους περὶ τοῦ | |
77 | τιμωρήσασθαι Φίλιππον ὁρῶ γιγνομένους, τὰ δὲ πράγματ᾿ | |
78 | εἰς τοῦτο προήκοντα, ὥσθ᾿ ὅπως μὴ πεισόμεθ᾿ αὐτοὶ | |
79 | πρότερον κακῶς σκέψασθαι δέον. οὐδέν οὖν ἄλλο μοι δοκοῦσιν | |
80 | οἱ τὰ τοιαῦτα λέγοντες ἢ τὴν ὑπόθεσιν, περὶ ἧς βουλεύεσθαι, | |
81 | οὐχὶ τὴν οὖσαν παριστάντες ὑμῖν ἁμαρτάνειν. ἐγὼ δέ, ὅτι μέν | |
82 | ποτ᾿ ἐξῆν τῇ πόλει καὶ τὰ αὑτῆς ἔχειν ἀσφαλῶς καὶ Φίλιππον | |
83 | τιμωρήσασθαι, καὶ μάλ᾿ ἀκριβῶς οἶδα· ἐπ᾿ ἐμοῦ γάρ, οὐ πάλαι | |
84 | γέγονεν ταῦτ᾿ ἀμφότερα· νῦν μέντοι πέπεισμαι τοῦθ᾿ ἱκανὸν | |
85 | προλαβεῖν ἡμῖν εἶναι τὴν πρώτην, ὅπως τοὺς συμμάχους | |
86 | σώσομεν. ἐὰν γὰρ τοῦτο βεβαίως ὑπάρξῃ, τότε καὶ περὶ τοῦ | |
87 | τίνα τιμωρήσεταί τις καὶ ὃν τρόπον ἐξέσται σκοπεῖν· πρὶν δὲ | |
88 | τὴν ἀρχὴν ὀρθῶς ὑποθέσθαι, μάταιον ἡγοῦμαι περὶ τῆς | |
89 | τελευτῆς ὁντινοῦν ποιεῖσθαι λόγον. | |
90 | ||
91 | Δημοσθένους, Γ´ ᾿Ολυνθιακὸς | |
92 | ||
93 | Georgian: | |
94 | ||
95 | From a Unicode conference invitation: | |
96 | ||
97 | გთხოვთ ახლავე გაიაროთ რეგისტრაცია Unicode-ის მეათე საერთაშორისო | |
98 | კონფერენციაზე დასასწრებად, რომელიც გაიმართება 10-12 მარტს, | |
99 | ქ. მაინცში, გერმანიაში. კონფერენცია შეჰკრებს ერთად მსოფლიოს | |
100 | ექსპერტებს ისეთ დარგებში როგორიცაა ინტერნეტი და Unicode-ი, | |
101 | ინტერნაციონალიზაცია და ლოკალიზაცია, Unicode-ის გამოყენება | |
102 | ოპერაციულ სისტემებსა, და გამოყენებით პროგრამებში, შრიფტებში, | |
103 | ტექსტების დამუშავებასა და მრავალენოვან კომპიუტერულ სისტემებში. | |
104 | ||
105 | Russian: | |
106 | ||
107 | From a Unicode conference invitation: | |
108 | ||
109 | Зарегистрируйтесь сейчас на Десятую Международную Конференцию по | |
110 | Unicode, которая состоится 10-12 марта 1997 года в Майнце в Германии. | |
111 | Конференция соберет широкий круг экспертов по вопросам глобального | |
112 | Интернета и Unicode, локализации и интернационализации, воплощению и | |
113 | применению Unicode в различных операционных системах и программных | |
114 | приложениях, шрифтах, верстке и многоязычных компьютерных системах. | |
115 | ||
116 | Thai (UCS Level 2): | |
117 | ||
118 | Excerpt from a poetry on The Romance of The Three Kingdoms (a Chinese | |
119 | classic 'San Gua'): | |
120 | ||
121 | [----------------------------|------------------------] | |
122 | ๏ แผ่นดินฮั่นเสื่อมโทรมแสนสังเวช พระปกเกศกองบู๊กู้ขึ้นใหม่ | |
123 | สิบสองกษัตริย์ก่อนหน้าแลถัดไป สององค์ไซร้โง่เขลาเบาปัญญา | |
124 | ทรงนับถือขันทีเป็นที่พึ่ง บ้านเมืองจึงวิปริตเป็นนักหนา | |
125 | โฮจิ๋นเรียกทัพทั่วหัวเมืองมา หมายจะฆ่ามดชั่วตัวสำคัญ | |
126 | เหมือนขับไสไล่เสือจากเคหา รับหมาป่าเข้ามาเลยอาสัญ | |
127 | ฝ่ายอ้องอุ้นยุแยกให้แตกกัน ใช้สาวนั้นเป็นชนวนชื่นชวนใจ | |
128 | พลันลิฉุยกุยกีกลับก่อเหตุ ช่างอาเพศจริงหนาฟ้าร้องไห้ | |
129 | ต้องรบราฆ่าฟันจนบรรลัย ฤๅหาใครค้ำชูกู้บรรลังก์ ฯ | |
130 | ||
131 | (The above is a two-column text. If combining characters are handled | |
132 | correctly, the lines of the second column should be aligned with the | |
133 | | character above.) | |
134 | ||
135 | Ethiopian: | |
136 | ||
137 | Proverbs in the Amharic language: | |
138 | ||
139 | ሰማይ አይታረስ ንጉሥ አይከሰስ። | |
140 | ብላ ካለኝ እንደአባቴ በቆመጠኝ። | |
141 | ጌጥ ያለቤቱ ቁምጥና ነው። | |
142 | ደሀ በሕልሙ ቅቤ ባይጠጣ ንጣት በገደለው። | |
143 | የአፍ ወለምታ በቅቤ አይታሽም። | |
144 | አይጥ በበላ ዳዋ ተመታ። | |
145 | ሲተረጉሙ ይደረግሙ። | |
146 | ቀስ በቀስ፥ ዕንቁላል በእግሩ ይሄዳል። | |
147 | ድር ቢያብር አንበሳ ያስር። | |
148 | ሰው እንደቤቱ እንጅ እንደ ጉረቤቱ አይተዳደርም። | |
149 | እግዜር የከፈተውን ጉሮሮ ሳይዘጋው አይድርም። | |
150 | የጎረቤት ሌባ፥ ቢያዩት ይስቅ ባያዩት ያጠልቅ። | |
151 | ሥራ ከመፍታት ልጄን ላፋታት። | |
152 | ዓባይ ማደሪያ የለው፥ ግንድ ይዞ ይዞራል። | |
153 | የእስላም አገሩ መካ የአሞራ አገሩ ዋርካ። | |
154 | ተንጋሎ ቢተፉ ተመልሶ ባፉ። | |
155 | ወዳጅህ ማር ቢሆን ጨርስህ አትላሰው። | |
156 | እግርህን በፍራሽህ ልክ ዘርጋ። | |
157 | ||
158 | Runes: | |
159 | ||
160 | ᚻᛖ ᚳᚹᚫᚦ ᚦᚫᛏ ᚻᛖ ᛒᚢᛞᛖ ᚩᚾ ᚦᚫᛗ ᛚᚪᚾᛞᛖ ᚾᚩᚱᚦᚹᛖᚪᚱᛞᚢᛗ ᚹᛁᚦ ᚦᚪ ᚹᛖᛥᚫ | |
161 | ||
162 | (Old English, which transcribed into Latin reads 'He cwaeth that he | |
163 | bude thaem lande northweardum with tha Westsae.' and means 'He said | |
164 | that he lived in the northern land near the Western Sea.') | |
165 | ||
166 | Braille: | |
167 | ||
168 | ⡌⠁⠧⠑ ⠼⠁⠒ ⡍⠜⠇⠑⠹⠰⠎ ⡣⠕⠌ | |
169 | ||
170 | ⡍⠜⠇⠑⠹ ⠺⠁⠎ ⠙⠑⠁⠙⠒ ⠞⠕ ⠃⠑⠛⠔ ⠺⠊⠹⠲ ⡹⠻⠑ ⠊⠎ ⠝⠕ ⠙⠳⠃⠞ | |
171 | ⠱⠁⠞⠑⠧⠻ ⠁⠃⠳⠞ ⠹⠁⠞⠲ ⡹⠑ ⠗⠑⠛⠊⠌⠻ ⠕⠋ ⠙⠊⠎ ⠃⠥⠗⠊⠁⠇ ⠺⠁⠎ | |
172 | ⠎⠊⠛⠝⠫ ⠃⠹ ⠹⠑ ⠊⠇⠻⠛⠹⠍⠁⠝⠂ ⠹⠑ ⠊⠇⠻⠅⠂ ⠹⠑ ⠥⠝⠙⠻⠞⠁⠅⠻⠂ | |
173 | ⠁⠝⠙ ⠹⠑ ⠡⠊⠑⠋ ⠍⠳⠗⠝⠻⠲ ⡎⠊⠗⠕⠕⠛⠑ ⠎⠊⠛⠝⠫ ⠊⠞⠲ ⡁⠝⠙ | |
174 | ⡎⠊⠗⠕⠕⠛⠑⠰⠎ ⠝⠁⠍⠑ ⠺⠁⠎ ⠛⠕⠕⠙ ⠥⠏⠕⠝ ⠰⡡⠁⠝⠛⠑⠂ ⠋⠕⠗ ⠁⠝⠹⠹⠔⠛ ⠙⠑ | |
175 | ⠡⠕⠎⠑ ⠞⠕ ⠏⠥⠞ ⠙⠊⠎ ⠙⠁⠝⠙ ⠞⠕⠲ | |
176 | ||
177 | ⡕⠇⠙ ⡍⠜⠇⠑⠹ ⠺⠁⠎ ⠁⠎ ⠙⠑⠁⠙ ⠁⠎ ⠁ ⠙⠕⠕⠗⠤⠝⠁⠊⠇⠲ | |
178 | ||
179 | ⡍⠔⠙⠖ ⡊ ⠙⠕⠝⠰⠞ ⠍⠑⠁⠝ ⠞⠕ ⠎⠁⠹ ⠹⠁⠞ ⡊ ⠅⠝⠪⠂ ⠕⠋ ⠍⠹ | |
180 | ⠪⠝ ⠅⠝⠪⠇⠫⠛⠑⠂ ⠱⠁⠞ ⠹⠻⠑ ⠊⠎ ⠏⠜⠞⠊⠊⠥⠇⠜⠇⠹ ⠙⠑⠁⠙ ⠁⠃⠳⠞ | |
181 | ⠁ ⠙⠕⠕⠗⠤⠝⠁⠊⠇⠲ ⡊ ⠍⠊⠣⠞ ⠙⠁⠧⠑ ⠃⠑⠲ ⠔⠊⠇⠔⠫⠂ ⠍⠹⠎⠑⠇⠋⠂ ⠞⠕ | |
182 | ⠗⠑⠛⠜⠙ ⠁ ⠊⠕⠋⠋⠔⠤⠝⠁⠊⠇ ⠁⠎ ⠹⠑ ⠙⠑⠁⠙⠑⠌ ⠏⠊⠑⠊⠑ ⠕⠋ ⠊⠗⠕⠝⠍⠕⠝⠛⠻⠹ | |
183 | ⠔ ⠹⠑ ⠞⠗⠁⠙⠑⠲ ⡃⠥⠞ ⠹⠑ ⠺⠊⠎⠙⠕⠍ ⠕⠋ ⠳⠗ ⠁⠝⠊⠑⠌⠕⠗⠎ | |
184 | ⠊⠎ ⠔ ⠹⠑ ⠎⠊⠍⠊⠇⠑⠆ ⠁⠝⠙ ⠍⠹ ⠥⠝⠙⠁⠇⠇⠪⠫ ⠙⠁⠝⠙⠎ | |
185 | ⠩⠁⠇⠇ ⠝⠕⠞ ⠙⠊⠌⠥⠗⠃ ⠊⠞⠂ ⠕⠗ ⠹⠑ ⡊⠳⠝⠞⠗⠹⠰⠎ ⠙⠕⠝⠑ ⠋⠕⠗⠲ ⡹⠳ | |
186 | ⠺⠊⠇⠇ ⠹⠻⠑⠋⠕⠗⠑ ⠏⠻⠍⠊⠞ ⠍⠑ ⠞⠕ ⠗⠑⠏⠑⠁⠞⠂ ⠑⠍⠏⠙⠁⠞⠊⠊⠁⠇⠇⠹⠂ ⠹⠁⠞ | |
187 | ⡍⠜⠇⠑⠹ ⠺⠁⠎ ⠁⠎ ⠙⠑⠁⠙ ⠁⠎ ⠁ ⠙⠕⠕⠗⠤⠝⠁⠊⠇⠲ | |
188 | ||
189 | (The first couple of paragraphs of "A Christmas Carol" by Dickens) | |
190 | ||
191 | Compact font selection example text: | |
192 | ||
193 | ABCDEFGHIJKLMNOPQRSTUVWXYZ /0123456789 | |
194 | abcdefghijklmnopqrstuvwxyz £©µÀÆÖÞßéöÿ | |
195 | –—‘“”„†•…‰™œŠŸž€ ΑΒΓΔΩαβγδω АБВГДабвгд | |
196 | ∀∂∈ℝ∧∪≡∞ ↑↗↨↻⇣ ┐┼╔╘░►☺♀ fi?⑀₂ἠḂӥẄɐː⍎אԱა | |
197 | ||
198 | Greetings in various languages: | |
199 | ||
200 | Hello world, Καλημέρα κόσμε, コンニチハ | |
201 | ||
202 | Box drawing alignment tests: █ | |
203 | ▉ | |
204 | ╔══╦══╗ ┌──┬──┐ ╭──┬──╮ ╭──┬──╮ ┏━━┳━━┓ ┎┒┏┑ ╷ ╻ ┏┯┓ ┌┰┐ ▊ ╱╲╱╲╳╳╳ | |
205 | ║┌─╨─┐║ │╔═╧═╗│ │╒═╪═╕│ │╓─╁─╖│ ┃┌─╂─┐┃ ┗╃╄┙ ╶┼╴╺╋╸┠┼┨ ┝╋┥ ▋ ╲╱╲╱╳╳╳ | |
206 | ║│╲ ╱│║ │║ ║│ ││ │ ││ │║ ┃ ║│ ┃│ ╿ │┃ ┍╅╆┓ ╵ ╹ ┗┷┛ └┸┘ ▌ ╱╲╱╲╳╳╳ | |
207 | ╠╡ ╳ ╞╣ ├╢ ╟┤ ├┼─┼─┼┤ ├╫─╂─╫┤ ┣┿╾┼╼┿┫ ┕┛┖┚ ┌┄┄┐ ╎ ┏┅┅┓ ┋ ▍ ╲╱╲╱╳╳╳ | |
208 | ║│╱ ╲│║ │║ ║│ ││ │ ││ │║ ┃ ║│ ┃│ ╽ │┃ ░░▒▒▓▓██ ┊ ┆ ╎ ╏ ┇ ┋ ▎ | |
209 | ║└─╥─┘║ │╚═╤═╝│ │╘═╪═╛│ │╙─╀─╜│ ┃└─╂─┘┃ ░░▒▒▓▓██ ┊ ┆ ╎ ╏ ┇ ┋ ▏ | |
210 | ╚══╩══╝ └──┴──┘ ╰──┴──╯ ╰──┴──╯ ┗━━┻━━┛ ▗▄▖▛▀▜ └╌╌┘ ╎ ┗╍╍┛ ┋ ▁▂▃▄▅▆▇█ | |
211 | ▝▀▘▙▄▟ | |
212 | ||
213 |