| Version 30 (modified by , 17 years ago) ( diff ) |
|---|
Übersicht
Diakritische Zeichen
Diakritikum (mit Pl. Diakritika), aus dem Griechischen: um zu unterscheiden. Diakritika sind zu Buchstaben gehörige kleine Zeichen wie Punkte, Striche, Häkchen oder kleine Kreise, die eine besondere Aussprache oder Betonung markieren und unter oder über dem Buchstaben angebracht sind, in einigen Fällen auch durch den Buchstaben hindurch.
Zur Information, welche Zeichen mit den Toten Tasten der Neo-Tastatur erzeugbar sind, siehe Tote Tasten und Compose.
Reihenfolge der Eingabe: vorangestelltes Diakritikum
Handschriftlich wird meistens erst der Buchstabe geschrieben, das Diakritikum im Anschluss darüber gesetzt. Auf der Schreibmaschine wird zuerst das Diakritikum auf einer speziellen Taste ohne Zeichenvorschub (tote Taste, engl. dead key) geschrieben, der Buchstabe im Anschluss an die gleiche Position gesetzt. Diese umgekehrte Reihenfolge ist auch als Computerstandard etabliert.
- K: die von der Handschrift gewohnte (intuitive?) Reihenfolge ist das nachgesetzte Diakritikum
- P: das nachgestellte Diakritikum ist gleichbedeutend damit, dass der Buchstabe vorangestellt wird. Da im Moment der Eingabe dieses Buchstabens nicht klar ist, ob ein Diakritikum folgen wird oder nicht, müsste der Buchstabe vom Treiber bereits an die Applikation ausgegeben werden; nach Eingabe des Diakritikums wäre dann der Buchstabe wieder mittels Backspace zu löschen und schließlich durch das kombinierte Zeichen zu ersetzen. (Beispiel: Zur Eingabe von ä wäre a gefolgt von ¨ zu drücken; dem Programm wird vom Treiber die Zeichenfolge a BACKSPACE ä gesendet.) Die Applikation „sieht“ also einen nur technisch notwendigen Zwischenstand als reguläre Eingabe, was insbesondere bei tastaturgesteuerten Programmen zu nicht erwünschten Fehlfunktionen führen kann. (Beispiel: Bei gewünschter Eingabe des Befehles Ctrl+ä würde zunächst das Kommando Ctrl+a ausgeführt und müsste dann revidiert werden.) Beim vorangestellten Diakritikum wird der Zwischenzustand im Treiber gespeichert und nur das erwünschte Endergebnis an die Applikation weitergereicht, der also in jedem Fall nur ein eingegebenes Zeichen übermittelt wird.
Ergebnis:
- Deadkeys mit Diakritika sind vor dem Buchstaben zu drücken.
Ausgabe als ein Zeichen oder als Combining Characters
Der folgende Abschnitt setzt die Kenntnis des Artikels über die Unicode-Normalformen (insbesondere die Argumente im Teil über die Diakritischen Zeichen) voraus.
Diskutiert wurde, ob konsequent zusammengesetzte Zeichen gesendet werden sollten, als auch bei Kombinationen, die sich bereits als gemeinsames Zeichen darstellen lassen (wie z.B. ä, é, …). Der Kompromiss ist momentan folgender:
- Wird eine Tote Taste (z.B. `) einmal gedrückt, wartet sie auf die nächste Eingabe. Bei Eingabe eines passenden Buchstabens (a) wird dieser als ein Zeichen mit dem entsprechenden Diakritikum ausgegeben (à).
- Noch keine Einigung ist erfolgt, was bei Eingabe eines unpassenden Buchstabens (c) nach einer Toten Taste passieren soll: Das native, also betriebssystemsspezifische Verhalten wäre für Linux, beide zu „verschlucken“, also nichts auszugegeben (), während Windows beide einzeln nacheinander ausgibt (`c). Soll das native Verhalten beibehalten werden oder ist eine einheitliche Regelung sinnvoller?
- Wird eine Tote Taste zweimal gedrückt, so wird der entsprechende Combining Character ausgegeben, dieser wird getrennt gespeichert, erscheint aber (in „guten“ Programmen) über dem vorangehenden Zeichen (c̀).
- Dies gibt (unter Linux) die Kompatibilität zur Standard-Compose zum Teil auf, da dead_circumflex+dead_circumflex bislang ein normales »^« erzeugt. Da aber alle Sonderzeichen ohnehin auf der Neo-Tastatur vorhanden sind, erscheint das vertretbar, zumal ebenfalls dead_circumflex+space ein »^« erzeugt.
Doppelfunktion Toter Tasten
Sollen ähnliche Deadkeys, deren Funktion nicht überlappt, zusammengelegt werden? Wollen wir evt. auch Deadkeys mit überlappenden Funktionen zusammenlegen und in Kauf nehmen, dass seltenere Kombinationen aus Diakritikum und Buchstabe nur über Compose erreichbar sind?
- P: Reduziert die Anzahl der benötigten Tasten
- P: Reduziert die Anzahl der zu merkenden Tasten
- P: Reduziert die Verwechselungsgefahr
- K: Das System, doppelt gedrückte Tote Taste wird zu Combining Character, wird weniger mächtig
- K: Es ist „unschön“, ein „falsches“ Zeichen zu verwenden
Ergebnis: Sofern möglich, werden ähnliche Deadkeys zusammengelegt!
Welche Deadkeys können/sollen zusammengelegt werden?
- Ogonek (nur bei Vokalen), Cedilla (fast nur unter Konsonanten)
- angenommen! (Shift+T3,C → Ç und zugleich Shift+T3,A → Ą)
- Kollision: Ȩ und Ę – wir haben uns für Ę entschieden, Ȩ kann z. B. über E¸¸ → Ȩ erzeugt werden.
- Alternative zu Cedilla wäre Komma darunter (nur bei g k l n r s t → keine Kollision), aber Komma darunter ist eigentlich eh nur eine Unicode-Variante des Ogonek
- Querstrich und Schrägstrich, zum Erzeugen von Buchstaben, die irgendwie durchgestrichen sind.
- angenommen!
- Kollision: Ƚ „L with bar“ vs. Ł „L with stroke“. Erzeugt wird Ł.
Ƚ (und ƚ) lässt sich bislang nicht erzeugen. Für welche Sprache werden diese Zeichen benötigt? Eventuell könnte man die Standard-Coko ♫L- → £ oder ♫-L → £ löschen und dafür verwenden, da £ schon auf 6(E4) liegt.
- Unterstrich und Überstrich (Makron)
- Unterstriche gibt es bei ḆḎḴḺṈṞṮẔẖ.
- Schnittmenge gering
- Invertiertes Breve (Breve darunter): Da es kein h mit Breve drüber gibt, kann man eine gemeinsame tote Breve vergeben.
- Mittenpunkt und Punkt drüber
- Mittenpunkt wird eigentlich nicht benötigt, da er nur im Katalanischen vorkommt, und dort wird die getrennte Schreibweise l· bevorzugt
- · ist jedoch mit Neo auch nicht direkt verfügbar, nur über Compose
- Mittenpunkt und Punkt darüber ist ein Zeichen (eine tote Taste) (jedenfalls laut Herrn Kappenberg).
- Ergebnis: Mittenpunkt und Punkt drüber werden als Toter Punkt zusammengefasst
- Mittenpunkt wird eigentlich nicht benötigt, da er nur im Katalanischen vorkommt, und dort wird die getrennte Schreibweise l· bevorzugt
Belegung der drei Toten Tasten
Neo hat 3 Tasten, die mit Deadkeys belegt werden sollen, die als T1, T2 und T3 bezeichnet werden sollen. Bei 6 Ebenen ergeben sich damit maximal 18 Deadkeys (Falls doch mehr Ebenen belegt werden sollen, natürlich entsprechend mehr).
Einigung besteht darüber, dass die Deadkeys es ermöglichen sollten, die häufigsten in Europa vorkommenden Diakritika zu schreiben.
Strittig war lange, ob auch Zeichen, die fast ausschließlich in der Mathematik gebraucht werden (Strich darunter) oder griechische Akzente (behaucht, Knacklaut, iota subscriptum) über Tote Tasten oder nur über Compose erreichbar sein sollen. Durch das Zusammenlegen von Deadkeys konnten jedoch auch diese aufgenommen werden.
Wie sollen die Deadkeys auf den Tasten und Ebenen angeordnet werden?
- Erreichbarkeit: T3 > T2 > T1?
- leicht merkbar: Ähnliches Aussehen, gleicher Sprachraum etc. auf derselben Ebene
- häufige Akzente gut erreichbar, also hauptsächlich französische und spanische
- Also Akut und Gravis beide auf Ebene 1.
- Akut wichtiger, also auf T3
- Tilde oder Zirkumflex wichtiger?
- Tilde kommt im Spanischen und Portugiesischen vor, Spanisch hat sehr viele Sprecher
- Zirkumflex im Französischen und Portugiesischen, Französisch wird sehr viel in der Schule gelehrt
- Zirkumflex scheint im Französischen seltener vorzukommen als die Tilde im Spanischen
- Zirkumflex braucht man für hochgestellte Zahlen
- Im Zweifelsfall: So lassen wie bei qwertz (Paradigma 7), also Zirkumflex auf Ebene1, Tilde auf Ebene2
- Tilde ist mit Shift nicht wirklich schlecht erreichbar
Zur Auswahl stehen folgende Deadkeys, sortiert nach Ähnlichkeit. In Klammern die momentan nicht erreichbaren:
- Akut, Gravis
- Tilde
- Diaeresis/Trema, Doppelakut
- Ring/Kroužek
- Cédille + Ogonek, (Komma darunter)
- Zirkumflex, Caron/Hatschek, Breve + invertierte Breve
- Schrägstrich + Querstrich, Unterstrich + Überstrich/Makron
- Punkt darüber + Mittenpunkt, (Punkt darunter)
Für die momentan gültige Belegung wurde versucht, die Anordnung möglichst einfach memorierbar zu gestalten. Die zugrunde liegende Entwurfsidee ist: Einteilung der Zeichen thematisch-regional in Dreiergruppen, sowie Zuordnung einer graphischen Funktion zu jeder der drei toten Tasten.
| T1 („komplex“) | T2 („rückwärts“) | T3 („vorwärts“) | „Thema“ | |
| Ebene 1 (ohne Modifier) | ˆ Zirkumflex | ` Gravis | ´ Akut | Frankreich |
| Ebene 2 (Shift) | ˜ Tilde | ¸ Cedille+Ogonek | Süden | |
| Ebene 3 (mod3) | ˚̊ Ring | ¨ Diaerese,Trema | ̷ Quer-+Schrägstrich | Norden |
| Ebene 4 (mod4) | ˇ Caron/Hatschek | ˵ Doppelgravis | ˝ Doppelakut | Osten |
| Ebene 5 (mod3+Shift) | ˘ Breve | ῾ Spiritus asper | ᾿ Spiritus lenis | Griechisch |
| Ebene 6 (mod3+mod4) | ¯ Makron+Unterstrich | ˙ Punkt |
Neue Belegung der toten Tasten
Motivation
Seit dem das grundsätzliche Schema der toten Tasten festgelegt wurde, ist viel passiert. Es gibt zwei neue Belegungen der toten Tasten (↻, ˞), die vorher frei waren. Davon wirkt ↻ selbst auf andere tote Tasten, so z.B. für ↻˘a → ȃ. Mit dem Vorschlag, dass der seltene Doppelgravis durch ↻˝ ersetzt werden kann, ergibt sich eine neue freie Belegung und einige Möglichkeiten. So würde sich z.B. der untergesetzte Punkt gut integrieren lassen und tatsächlich sinnvoll, da er sehr viel in außereuropäischen Sprachen wie einige afrikanische Sprachen und Vietnamesich, sowie Umschriften für Hindi, Sanskrit und Arabisch verwendet wird. Außerdem zeigt dieser laut Wikipedia in deutschen Wörterbüchern unter einem Vokal die Betonung und die kurze Aussprache dieses Vokals an.
Auf der Mailingliste wurden dafür einige neue Vorschläge diskutiert, die im folgenden dokumentiert sind. Diese versuchen möglichst wenig zu verändern, sofern es nicht notwendig ist, damit die Idee wirkt. Bis auf den optionalen Appendix verändern diese Belegungen die ersten drei Ebenen nicht. Weiter werden die bisherigen Ziele (Effizienz, einfache Einprägsamkeit) verfolgt.
Häufigkeits-/Wichtigkeitsanalyse
- Der Hatschek kommt in sehr vielen überwiegend osteuropäischen vor: Tschechien (Nachbarland), Finnland, Estland, Lettland, Litauen, Slowakei, Slowenien, Kroatien, Bosnien-Herzegowina, Montenegro und Serbien. Er ist daher wirklich wichtig und sollte nicht schlechter gestellt werden, als Ebene 4.
- Der übergesetzte Punkt kommt im Türkischen (˙i → ı, ˙I → İ) sehr prominent vor, sodass Erik diese sogar über ♫ii/♫II abkürzt. Weiter wird er im Polnischen verwendet, auf Malta, und in Litauen, Andorra. Er ist deshalb verhältnismäßig wichtig.
- Der Doppelakut wird soweit ich weiß nur im Ungarischen verwendet.
- Der Makron wird in Lettland und Litauen verwendet und als Längenzeichen. Auch Außereuropäisch und in Transkriptionen wird er verwendet.
- Der Breve wird im Rumänien/Moldavien (In einem Text aus 6 Wörtern habe ich mindestens 7 ăs gesehen), sowie in der Türkei/Zypern (ğ) und in Esperanto verwendet.
Alle Vorschläge haben gemeinsam, dass ˞ auf Ebene 5 (T1) wandert, da so alle Haken (Spiritus, Vietnamesischer Haken = Spiritus auf lat. Vokale) und eben ˞ auf eine Ebene kommen und so einfach zu merken sind. Des Weiteren hatte die vorherige Belegung mit Breve keinen wirklichen Zusammenhang mit Griechisch und wurde vorangig wegen der Form gewählt.
Hier die alte Belegung
| T1 („komplex“) | T2 („rückwärts“) | T3 („vorwärts“) | „Thema“ | |
| Ebene 1 | ˆ | ` | ´ | Frankreich |
| Ebene 2 | ˜ | ↻ | ¸ | Süden |
| Ebene 3 | ˚ | ¨ | / | Norden |
| Ebene 4 | ˇ | ̏ | ˝ | Osten |
| Ebene 5 | ˘ | ῾ | ᾿ | Griechisch |
| Ebene 6 | ¯ | ˙ | ˞ | — |
Variante I (Aleχ)
| T1 („komplex“) | T2 („rückwärts“) | T3 („vorwärts“) | „Thema“ | |
| Ebene 4 | ¯ | ˇ | ˝ | Osten |
| Ebene 5 | ˞ | ῾ | ᾿ | Griechisch/Haken |
| Ebene 6 | ˘ | . | ˙ | Punkte |
Erklärung: Dieser Vorschlag legt besonderen Wert auf die „Symmetrie“ zwischen den beiden Tasten T2/T3.
Vorteile sind:
- Merkhilfe: Makron und Breve liegen auf der gleichen Taste (Mod3+¯ → ˘): Makron steht für lange Aussprache und Breve für kurze.
- Das Makron ist leichter einzugeben und passt auch ins Schema „Osten“, alle anderen Zeichen haben sich im Eingabekomfort nicht wirklich verschlechtert
- Das Schema der Tasten T2, T3 „nach rechts“ – „nach links“ ist wie früher beibehalten, wobei man sich in der Reihe ˇ ˝ es so vorstellen muss, als zeige nur der linke Teil nach rechts. Dies könnte evtl etwas unintuitiv sein.
- Weiter wird an T3 nichts verändert (→ siehe bisheriges Merkschema), ¯ und ˘ bleiben auf T1, damit bleibt hier auch das Schema „komplex“.
Nachteile sind:
- Der Makron passt nicht so in das Schema „Osten“ (außer Litauen, Lettland), wie z.B. der Breve oder der Punkt.
- Der Breve passt nicht so sehr zu den anderen Punkten.
Variante II (Peter)
| T1 („auf und ab“) | T2 („abwärts/punktig“) | T3 („aufwärts/strichig“) | „Thema“ | |
| Ebene 4 | ˇ | ˙ | ˝ | Osten |
| Ebene 5 | ˞ | ῾ | ᾿ | Griechisch/Haken |
| Ebene 6 | ˘ | . | ¯ | Vokallänge |
Erklärung: Da die Tasten (T1–T3) dem Aussehen des Diakritikums zugeordnet werden, werden ähnlich aussehende Diakritika unabhängig von ihrer Bedeutung auf diesselbe Taste gelegt. Da die Ebenen der Bedeutung des Diakritikums zugeordnet werden, kommen ähnlich funktionierende (in ähnlichen Regionen vorkommende, einem gemeinsamen Thema zugehörige) Diakritika auf die gleiche Ebene. Die drei Kriterien für die Tasten sind dabei: T1: Auf und ab (man könnte mit ein wenig guten Willen auch den Ring darunter zählen) T2: Abwärts oder punktig T3: Aufwärts oder strichig
Vorteile sind:
- Die Themen der Ebenen sind gut und möglichst passend.
- Makron ist weniger wichtig und daher auf Ebene 6. Außerdem passt der ˙ besser zum Schema Osten
Nachteile sind:
- Die Symmetrie zwischen T2/T3 wie z.B. `´, ˇ˝, ῾᾿, .˙ ist verletzt.
Kritik an Vorschlag I anhand der Sichtweise der Erklärung von Vorschlag II (dies ist ja eine komplett andere Sichtweise):
- Die Punkte unten und oben liegen auf verschiedenen Tasten, obwohl ihre Geometrie (Punkt) gleich ist. Der Punkt oben sollte auf T2.
- Gleiches gilt für Breve und Caron. Oder bin ich der einzige, der sie (vom Aussehen her) als ähnlich ansieht? Hans-Christoph schien eher den Gegensatz rund/eckig hervorzuheben.
- Das Thema „Punkte“ für die Ebene 6 wäre eines, das sich auf die Form der Zeichen bezieht und nicht auf deren Funktion und damit eine Ausnahme.
Variante III (Aleχ)
| T1 („auf und ab“) | T2 („abwärts/punktig“) | T3 („aufwärts/strichig“) | „Thema“ | |
| Ebene 4 | ˇ | ˙ | ˘ | Osten |
| Ebene 5 | ˞ | ῾ | ᾿ | Griechisch/Haken |
| Ebene 6 | ¯ | . | ˝ | ? |
Erklärung: Dieser Vorschlag legt besonderen Wert darauf, dass die häufigen Tasten auch wirklich gut liegen. Dafür werden allerdings im Vergleich zu den anderen Vorschlägen Merkhilfen zerstört. Ein paar bleiben dennoch erhalten und vielleicht können noch weitere bei näherer Betrachtung gefunden werden.
Vorteile sind:
- Breve und Punkt für das Türkische, Rumänische und Polnische liegen auf Ebene 4.
- Das seltenere Zeichen ˝ (nur Ungarn) wird schlechter gestellt, der Makron bleibt, wo er ist.
- Viele Vorteile von Vorschlag II bleiben erhalten
Nachteile sind:
- Die Merkhilfe mit ˘ und ¯ fällt weg.
- Die Merkhilfe mit „hoch und runter“ auf T1 hat eine Ausnahme auf Ebene 6.
- Ich habe mir noch kein Motto von Ebene 6 überlegen können. Vielleicht jemand anderes?
