Changes between Initial Version and Version 1 of Unicode-Normalformen


Ignore:
Timestamp:
28/04/09 15:41:54 (17 years ago)
Author:
Dennis Heidsiek
Comment:

Initiale Version – wird gleich noch aufgeräumt!

Legend:

Unmodified
Added
Removed
Modified
  • Unicode-Normalformen

    v1 v1  
     1[[PageOutline(2-4, Übersicht)]]
     2
     3= Unicode-Normalformen =
     4Es gibt viele Zeichen, die auf unterschiedliche Art und Weise im Unicode kodiert werden werden.
     5
     6Im Unicode können viele diakritische Zeichen als eigenständiges (wie  z.B. ä, é, …) oder als zusammengesetztes Zeichen (»a+¨«, »e+´«, …) gesendet werden. Mehrfache Akzente können (in der Mehrzahl der Fälle) nur über zusammengesetztes Zeichen realisiert werden. Genauere Angaben finden sich unter [Unicode-Normalformen].
     7
     8warum ´e≠e´´ ist« steht noch nicht im Wiki.
     9
     10Für viele Kombinationen aus diakritischen Zeichen und Buchstaben existieren eigene Unicode-Einträge, einfache Beispiele sind z.B. ä, é (NFC).
     11
     12
     13Für viele Kombinationen aus diakritischen Zeichen und Buchstaben existieren eigene Unicode-Einträge, einfache Beispiele sind z.B. ä, é (NFC). Soll jedoch eine Zahl mit einem diakritschen Zeichen versehen werden, oder ein Buchstabe mit mehreren Diakritika, so ist dies (in der Mehrzahl der Fälle) nur über Combining Characters möglich. Hierbei werden alle „Bestandteile“ einzeln gespeichert (NFD).
     14
     15
     16== Ligaturen ==
     17Beispielsweise, ob eine Suche nach "fliegen" auch "fliegen" (mit fl-Ligatur) findet. Ich werde diesen Teil gleich mal ausgliedern.
     18
     19== Diakritische Zeichen ==
     20Im Unicode können viele diakritische Zeichen als eigenständiges (wie  z.B. ä, é, …) oder als zusammengesetztes Zeichen (»a+¨«, »e+´«, …) gesendet werden. Soll jedoch eine Zahl mit einem diakritschen Zeichen versehen werden, oder ein Buchstabe mit mehreren Diakritika, so ist dies (in der Mehrzahl der Fälle) nur über zusammengesetztes Zeichen (Combining Characters) möglich.
     21
     22== Normalformen ==
     23
     24== Weiterführende Information ==
     25Für weiteregehende Informationen, insbesondere NFC und NFD, siehe [http://en.wikipedia.org/wiki/Unicode_equivalence Unicode equivalence] in der englischen Wikipedia oder den ausführlicheren Artikel des Unicode-Konsortiums über die [http://unicode.org/reports/tr15/ Unicode Normalization Forms].