Sprechen Sie Russisch?
The Answer Girl
Eine Frage der Kodierung
Nichtsdestotrotz hat man irgendwann den Dreh raus, den Text verfasst – und möchte ihn sich nun anschauen. Das klappt in den Kommandozeileneditoren bei entsprechend gesetztem Screenfont weiterhin, aber schon wer die Datei unter X mit demselben Editor anschaut, sieht nur noch "komische Zeichen". Ganz klar: Der durchschnittliche Texteditor geht davon aus, dass er ASCII-Text ohne Sonderzeichen serviert bekommt. (Wer schonmal einen deutschen ASCII-Text von einem nicht-kontinentalen Briten oder Amerikaner bearbeitet zurückbekommen hat, weiß spätestens jetzt, warum anschließend die Umlaute kaputt waren…)
Da der Datei schlicht nicht anzusehen ist, welche Kodierung verwendet wurde, stellen sich die meisten Programme reichlich dumm. Die schnellste und einfachste Variante, den Text abseits der Kommandozeile wieder korrekt zu Gesicht zu bekommen, geht über einen Web-Browser: Klar, wenn der http://www.linux.ru/ korrekt anzeigt, dann sollte er auch unseren Text fressen.
Zu diesem Zweck müssen wir allerdings wissen, welche Kodierung beim Schreiben des russischen Texts zum Einsatz kam: Windows-User werden meist Windows-1251 verwenden – in unserem Fall gibt das mapscrn-Kommando den entscheidenden Hinweis: Wir haben unseren Text in der koi8-Kodierung, und zwar ihrer russischen Form (koi8-r) (im Gegensatz zur ukrainischen koi8-u) geschrieben.
Bei Mozilla und Opera ist der Rest unproblematisch: Nach dem Laden der Textdatei zeigen die Browser erst einmal die falsche Kodierung (linke Seite in Abbildung 3 und 4). View / Character Coding / Auto-Detect / Russian (Mozilla) bzw. Ansicht / Kodierung / Kyrillisch / KOI8-R (Opera) sorgen jedoch dafür, dass der Text korrekt erscheint.
Beim Konqueror ist das nicht so einfach: Zwar bietet er für HTML-Seiten den Menüpunkt Ansicht / Kodierung festlegen / Kyrillisch (koi8-r), nicht jedoch im Dateibrowser-Modus oder wenn er eine Textdatei anzeigt. Glücklicherweise ist es nicht besonders schwer, aus der Textdatei ein HTML-File zu machen: Wir müssen den russischen Text einfach mit dem Gerüst aus Listing 3 umgeben, das in der Meta-Zeile die Kodierung, genauer den Zeichensatz ("character set"), festlegt.
Listing 3
Gerüst für HTML-Dateien in KOI8-R
<html> <head> <title>Hier steht der (lateinische) Titel </title> <meta http-equiv="content-type" content="text/html"; charset=koi8-r> </head> <body>Hier steht der KOI8-R-kodierte Text </body> </html>
Verschickt
Damit der anfangs intendierte Briefwechsel mit der russischen Brieffreundin überhaupt zustande kommt, gilt es, den KOI8-kodierten Text per Mail zu versenden. Am unproblematischsten geht das mit mutt, denn der erlaubt es, den Zeichensatz eines Mail-Parts von Hand zu ändern. Wir erstellen also wie gewohnt eine Mail, lesen die KOI8-kodierte Datei entweder in den Editor ein oder hängen sie einfach an.
In der Compose-Ansicht wählen wir mit den Cursortasten den Teil der Mail an, der die KOI8-Datei enthält. Mit [Strg-t] erlaubt es mutt nun, den Content-Type: ("Inhaltstyp") zu ändern. Was auch immer mutt vorschlägt,
text/plain; charset=koi8-r
ist (für einfache Textdateien) richtig. Manche mutt-Versionen fragen jetzt noch, ob sie den Text beim Versenden nach KOI8-R konvertieren sollen. Die richtige Antwort lautet nein, denn er liegt bereits in dieser Kodierung vor (ein Ja führt zu Datenmüll).
Die Empfängerin speichert den entsprechenden Textteil wieder ab, wechselt auf die Konsole, schaltet mit dem Skript aus Listing 1 in den russischen Modus und lädt die Datei in den Kommandozeilentexteditor. Der Aufruf des Skripts aus Listing 2 schaltet die Konsole wieder in den deutschen Modus. Wer dies vor dem Ausloggen vergisst, kann sich an dieser Textkonsole nur noch mit russischer (alias amerikanischer) Tastenbelegung anmelden – auch ein Grund gegen Umlaute im Passwort.



