Changes between Version 1 and Version 2 of Unicode-Normalformen


Ignore:
Timestamp:
28/04/09 16:14:25 (17 years ago)
Author:
Dennis Heidsiek
Comment:

Nur ein Zwischenstand …

Legend:

Unmodified
Added
Removed
Modified
  • Unicode-Normalformen

    v1 v2  
    22
    33= Unicode-Normalformen =
    4 Es gibt viele Zeichen, die auf unterschiedliche Art und Weise im Unicode kodiert werden werden.
     4Viele Zeichen können auf unterschiedliche Art und Weise im Unicode abgespeichert werden. Dies betrifft insbesondere diakritische Zeichen, aber bspw. auch Ligaturen oder japanische Katakana.
    55
    6 Im Unicode können viele diakritische Zeichen als eigenständiges (wie  z.B. ä, é, …) oder als zusammengesetztes Zeichen (»a+¨«, »e+´«, …) gesendet werden. Mehrfache Akzente können (in der Mehrzahl der Fälle) nur über zusammengesetztes Zeichen realisiert werden. Genauere Angaben finden sich unter [Unicode-Normalformen].
     6
     7
     8
    79
    810warum ´e≠e´´ ist« steht noch nicht im Wiki.
     
    1820
    1921== Diakritische Zeichen ==
    20 Im Unicode können viele diakritische Zeichen als eigenständiges (wie  z.B. ä, é, …) oder als zusammengesetztes Zeichen (»a+¨«, »e+´«, …) gesendet werden. Soll jedoch eine Zahl mit einem diakritschen Zeichen versehen werden, oder ein Buchstabe mit mehreren Diakritika, so ist dies (in der Mehrzahl der Fälle) nur über zusammengesetztes Zeichen (Combining Characters) möglich.
     22Im Unicode können viele diakritische Zeichen als eigenständiges (wie  z.B. ä, é, …) oder als zusammengesetztes Zeichen (»a+¨«, »e+´«, …) gesendet werden.
     23
     24Soll jedoch eine Zahl mit einem diakritschen Zeichen versehen werden, oder ein Buchstabe mit mehreren Diakritika, so ist dies (in der Mehrzahl der Fälle) nur über zusammengesetztes Zeichen (Combining Characters) möglich. Diese Methode ist also deutlich flexibler, da Diakritika quasi beliebig kombiniert werden können und nicht jede seltene Kombination einzeln im Unicode aufgeführt werden muss. Infolgedessen wird diese Methode vom Unicode-Konsortium vorgezogen und ''sollte'' eigentlich Standard sein.
     25
     26In der Praxis wird diese Empfehlung jedoch nur von Apple-Rechnern umgesetzt. Unter Linux und Windows werden meist die eigenständigen Zeichen bevorzugt, da diese aus älteren (wie den [http://de.wikipedia.org/wiki/ISO_8859-1 ISO 8859-) Zeichensätzen aus Kompatibilitätsgründen in den Unicode übernommen wurden. Deshalb können viele Programme auch heute noch nicht mit zusammengesetzen Zeichen umgehen; die Diakritika werden dann als Kasten angezeigt, oder verrutschen auf andere Buchstaben, …
    2127
    2228== Normalformen ==
    2329
     30NFC und NFD
    2431== Weiterführende Information ==
    25 Für weiteregehende Informationen, insbesondere NFC und NFD, siehe [http://en.wikipedia.org/wiki/Unicode_equivalence Unicode equivalence] in der englischen Wikipedia oder den ausführlicheren Artikel des Unicode-Konsortiums über die [http://unicode.org/reports/tr15/ Unicode Normalization Forms].
     32Weiteregehende Informationen finden sich in der [http://en.wikipedia.org/wiki/Unicode_equivalence englischen Wikipedia (Unicode equivalence)] sowie im dem ausführlicheren Artikel des Unicode-Konsortiums über die [http://unicode.org/reports/tr15/ Unicode Normalization Forms].