Changes between Version 1 and Version 2 of Unicode-Normalformen
- Timestamp:
- 28/04/09 16:14:25 (17 years ago)
Legend:
- Unmodified
- Added
- Removed
- Modified
-
Unicode-Normalformen
v1 v2 2 2 3 3 = Unicode-Normalformen = 4 Es gibt viele Zeichen, die auf unterschiedliche Art und Weise im Unicode kodiert werden werden.4 Viele Zeichen können auf unterschiedliche Art und Weise im Unicode abgespeichert werden. Dies betrifft insbesondere diakritische Zeichen, aber bspw. auch Ligaturen oder japanische Katakana. 5 5 6 Im Unicode können viele diakritische Zeichen als eigenständiges (wie z.B. ä, é, …) oder als zusammengesetztes Zeichen (»a+¨«, »e+´«, …) gesendet werden. Mehrfache Akzente können (in der Mehrzahl der Fälle) nur über zusammengesetztes Zeichen realisiert werden. Genauere Angaben finden sich unter [Unicode-Normalformen]. 6 7 8 7 9 8 10 warum ´e≠e´´ ist« steht noch nicht im Wiki. … … 18 20 19 21 == Diakritische Zeichen == 20 Im Unicode können viele diakritische Zeichen als eigenständiges (wie z.B. ä, é, …) oder als zusammengesetztes Zeichen (»a+¨«, »e+´«, …) gesendet werden. Soll jedoch eine Zahl mit einem diakritschen Zeichen versehen werden, oder ein Buchstabe mit mehreren Diakritika, so ist dies (in der Mehrzahl der Fälle) nur über zusammengesetztes Zeichen (Combining Characters) möglich. 22 Im Unicode können viele diakritische Zeichen als eigenständiges (wie z.B. ä, é, …) oder als zusammengesetztes Zeichen (»a+¨«, »e+´«, …) gesendet werden. 23 24 Soll jedoch eine Zahl mit einem diakritschen Zeichen versehen werden, oder ein Buchstabe mit mehreren Diakritika, so ist dies (in der Mehrzahl der Fälle) nur über zusammengesetztes Zeichen (Combining Characters) möglich. Diese Methode ist also deutlich flexibler, da Diakritika quasi beliebig kombiniert werden können und nicht jede seltene Kombination einzeln im Unicode aufgeführt werden muss. Infolgedessen wird diese Methode vom Unicode-Konsortium vorgezogen und ''sollte'' eigentlich Standard sein. 25 26 In der Praxis wird diese Empfehlung jedoch nur von Apple-Rechnern umgesetzt. Unter Linux und Windows werden meist die eigenständigen Zeichen bevorzugt, da diese aus älteren (wie den [http://de.wikipedia.org/wiki/ISO_8859-1 ISO 8859-) Zeichensätzen aus Kompatibilitätsgründen in den Unicode übernommen wurden. Deshalb können viele Programme auch heute noch nicht mit zusammengesetzen Zeichen umgehen; die Diakritika werden dann als Kasten angezeigt, oder verrutschen auf andere Buchstaben, … 21 27 22 28 == Normalformen == 23 29 30 NFC und NFD 24 31 == Weiterführende Information == 25 Für weiteregehende Informationen, insbesondere NFC und NFD, siehe [http://en.wikipedia.org/wiki/Unicode_equivalence Unicode equivalence] in der englischen Wikipedia oder denausführlicheren Artikel des Unicode-Konsortiums über die [http://unicode.org/reports/tr15/ Unicode Normalization Forms].32 Weiteregehende Informationen finden sich in der [http://en.wikipedia.org/wiki/Unicode_equivalence englischen Wikipedia (Unicode equivalence)] sowie im dem ausführlicheren Artikel des Unicode-Konsortiums über die [http://unicode.org/reports/tr15/ Unicode Normalization Forms].
