Aufmacher

Yudit it!

Bidirektionaler und multilingualer Editor

01.08.2007
Wer multilinguale Texte korrekt erfassen und bearbeiten will, stößt mit herkömmlichen Texteditoren schnell an Grenzen. Yudit schafft Abhilfe.

Texteditoren gibt es unter Linux in so großer Zahl wie bei keinem anderen Betriebssystem. Die Palette reicht von einfachsten Editoren bis zu komplexen Textverarbeitungen, die funktional keine Wünsche mehr offen lassen und zudem mit ihrer grafischen Oberfläche auch dem Auge eine angenehme Atmosphäre bieten.

Bei allem Eyecandy und Leistungsumfang: In der Regel schaffen es weder die vielen Editoren noch die großen Textverarbeitsprogramme, innerhalb eines Dokumentes beliebig den Zeichensatz zu wechseln oder gar – wie zum Beispiel in arabischen Sprachen oder im Hebräischen üblich – das Schreiben von rechts nach links zu ermöglichen.

Ganz klar ein Fall für Yudit [1]. Der Unicode-Texteditor erlaubt – unter verschiedenen Betriebssystemen – sowohl bidirektionales Schreiben als auch das Arbeiten mit verschiedenen Zeichensätzen. So können Sie mit Yudit problemlos ein Dokument zunächst in deutscher Sprache verfassen und anschließend im gleichen Dokument einen in japanischem Katakana [2] geschriebenen Teil und schließlich noch einen Abschnitt in Sanskrit [3] anfügen.

Die wundersame Welt der Kodierung

Die Geschichte der so genannten Zeichensätze ist eng mit der Historie der modernen Datenverarbeitung verbunden. Als Pioniere auf diesem Gebiet gelten die beiden Amerikaner Samuel Morse und Herman Hollerith sowie der Franzose Jean-Maurice-Émile Baudot, die allesamt für ihre damals zeitgemäßen Kommunikationsmittel eigene Kodierungen ersannen. Auch die nachfolgenden, zunehmend elektronisch arbeitenden Rechenanlagen verwendeten proprietäre und damit untereinander vollständig inkompatible Zeichensätze. Das machte es irgendwann nötig, über einheitliche Zeichensätze nachzudenken.

Im Jahre 1963 erblickte der 7-Bit-ASCII-Zeichensatz (American Standard Code for Information Interchange) das Licht der Welt. Er konnte 128 unterschiedliche Zeichen darstellen. Schnell stellte sich aber heraus, dass der sieben Bit breite Zeichensatz zwar für die englische Sprache ausreichte, nicht aber für Europa mit seinen vielen Akzent- und Sonderzeichen. So wurde der Standard-ASCII-Zeichensatz um ein Bit verbreitert, was die Anzahl möglicher Zeichen immerhin auf 256 verdoppelte. Dieser erweiterte ASCII-Zeichensatz war international bis in die späten Achtzigerjahre des vergangenen Jahrhunderts gebräuchlich.

Trotz aller Versuche, im Rahmen der ISO-Normen 2022 und 8859 die Kodierungsschemen des ASCII-Zeichensatzes festzuschreiben, blieben die einzelnen Zeichensätze zueinander teilweise inkompatibel. Beide Normen hatten einen entscheidenden Konstruktionsfehler: Sie definierten nur die ersten 128 Zeichen des gesamten Satzes als verbindlich. Die zweite Hälfte des Zeichensatzes konnte dagegen jeder Anbieter ganz nach Belieben belegen. Die Folge: Allein für die ISO-Norm 8859 existieren 14 verschiedene Gruppen, die regionale Eigenheiten abbilden. Zeichensätze mit tausenden Einzelzeichen, etwa verschiedene ostasiatische Sprachen, waren damit dagegen überhaupt nicht darstellbar.

Diese unbefriedigende Situation änderte sich erst, als sich Mitte der Achtzigerjahre des vergangenen Jahrhunderts die International Standardization Organization (ISO) und das Unicode Consortium endlich zur Kooperation entschlossen und 1991 die Unicode-Norm in der ersten Version verabschiedeten. Der kontinuierlich weiterentwickelte Unicode-Standard (aktuell in Version 5) behebt die bisherigen Probleme weitgehend: Er lässt sich auf vielen Rechnersystemen einsetzen, vereinfacht den Datenaustausch durch einen einheitlichen Zeichensatz und bietet einen ausreichenden Zeichenvorrat, um auch ostasiatische Sprachen darzustellen.

Aber auch von Unicode existieren verschiedene Implementierungen. Im Verlauf seiner Geschichte kamen drei Zeichenkodierungsformate und sieben Kodierungsschemen auf den Markt. In Europa etwa ist meist die Variante UTF-8 im Einsatz, die dem alten ASCII-Format ähnelt. Moderne Betriebssysteme und die meisten Programmiersprachen unterstützen heute Unicode. Unter Linux etwa überprüfen Sie mit dem Befehl locale auf der Konsole, welcher Zeichensatz vorgegeben ist. Auch die gängigen Texteditoren wie Emacs oder Vim unterstützen Unicode, erlauben jedoch keine bidirektionale Funktionalität. Dies schafft nur einer: Yudit.

Installation

Yudit ist in vielen Distributionen bereits in der aktuellen Version 2.8.1 enthalten oder lässt sich wenigstens über Repositories nachinstallieren. Auf seiner Homepage stellt der in Japan lebende ungarische Entwickler Gaspar Sinai ein fertiges RPM-Paket für verschiedene Hardware-Architekturen zur Verfügung.

An gleicher Stelle sowie auf der Heft-CD finden Sie außerdem ein RPM-Quellarchiv [3] für jene Distributionen, die Yudit noch nicht kennen. Aus den Quellen generieren Sie über den Konsolenbefehl rpmbuild --rebuild yudit-Version.src.rpm ein herkömmliches RPM-Archiv, das Sie anschließend mit dem Befehl rpm -ivh /Pfad/yudit-Archiv.rpm installieren. Reichen die erwähnten Installationsmöglichkeiten nicht aus, so finden Sie bei Gaspar Sinai sowie auf der Heft-CD auch ein reines Sourcecode-Archiv, das sie selbst kompilieren und über den Dreisatz ./configure && make && make install einrichten.

Der Entwickler bietet auf seiner Homepage zusätzlich Links zu verschiedenen Font-Bibliotheken. Yudit arbeitet mit einer eigenen Rendering-Engine und hantiert problemlos auch mit X11- und TrueType-Fonts. Um die Funktionalität des Editors um eine Vorschau-Funktion zu erweitern, sollten Sie zudem das Paket gv installieren – besser bekannt unter dem Namen Ghostview und unter verschiedenen Aliasnamen für diverse Plattformen verfügbar [4]. Gv bietet zudem als grafisches Frontend für Ghostscript die Option, gängige PostScript- und PDF-Dokumente anzuzeigen.

Nach erfolgreicher Installation präsentiert sich der Editor zunächst in dunklen, wenig anheimelnden Farben. Eine Menüleiste existiert nicht; lediglich eine Schalterleiste ziert das Hauptfenster im oberen Bereich. Im unteren Abschnitt finden Sie eine Kommandozeile (Abbildung 1). Diese ungewöhnliche Zeile hängt mit der Fähigkeit von Yudit zusammen, aus dem Editor heraus Befehle aufzurufen und externe Programme einzubinden.

Abbildung 1: Yudit im Einsatz mit einer multilingualen Datei.

Um die Vorgaben des Programms den eigenen Wünschen anzupassen, modifizieren Sie die Textdatei ~/.yudit/yudit.properties. Hier ändern Sie nicht nur Pfade und Spracheinstellungen, sondern tragen Fonts und Keymaps ein, die Sie selbst definiert oder aus dem Internet geladen haben. Die entsprechenden Fontdateien finden Sie in den Verzeichnissen ~/.yudit/fonts und /usr/share/yudit/fonts. Die Keymaps, also speziell für bestimmte Sprachen definierte Tastaturdateien, liegen im Verzeichnis ~/.yudit/data oder – systemweit – /usr/share/yudit/data.

Um Text in der jeweiligen Sprache korrekt einzugeben, müssen Sie zunächst die sprachspezifische Tastaturbelegung einstellen. Von diesen so genannten Keymaps liefert Yudit bereits mehr als 100 vorgefertigte mit, die Sie in der Symbolleiste im zweiten Feld von rechts auswählen und in einer Dialogbox festlegen (Abbildung 2). Zwischen einzelnen Tastaturbelegungen schalten Sie mit [F1] bis [F12] hin und her.

Abbildung 2: Die Tastaturbelegung für fremde Zeichensätze stellen Sie hier ein.

Sollten Sie bei der Texteingabe unleserliche Zeichen im Editorfenster sehen, müssen Sie noch den korrekten Font einstellen. Das erledigen Sie über die Tastenkombinationen [Umschalt]+[F1] bis [Umschalt]+[F9]. Anschließend können Sie nach Lust und Laune mit dem Editor arbeiten, wobei Yudit bei arabischen und hebräischen Texten auch die umgekehrte Schreibrichtung berücksichtigt.

Um die Kompatibilität von Yudit-Texten mit anderen Editoren und Textprogrammen zu wahren, legt das Programm eigene Dateien nicht in einem proprietären Format ab, sondern als Textdatei unter Berücksichtigung des entsprechenden Zeichensatzes. Dazu haben Sie im Speicherdialog verschiedene Optionen zur Auswahl.

Fazit

Yudit erweist sich als schneller und einfach zu bedienender Editor für fremdsprachige Texte auch mit ungewöhnlichen Zeichensätzen. Das Programm zeichnet sich vor allem durch die Möglichkeit der bidirektionalen Texteingabe sowie durch die Option aus, in einem einzigen Dokument den Zeichensatz nach Belieben wechseln zu können. Durch das Einbinden von externen Programmen und die integrierte Befehlszeile lassen sich zudem einfache Such-, Druck- und Vorschaufunktionen realisieren.

Für anspruchsvollen Textsatz eignet sich die Software aber wegen der fehlenden Formatiermöglichkeiten nicht. Einen Rüffel verdient das Programm auch wegen des fehlenden Konfigurationsmenüs. Alle Einstellungen gilt es stattdessen umständlich in einer Skriptdatei vorzunehmen. Insbesondere bei Texten mit wenig gebräuchlichen Schriftzeichen ist es zudem unumgänglich, erst entsprechende Fontbibliotheken aus dem Internet zu laden und einzubinden, damit Yudit seine ganze Stärke ausspielen kann. Glücklicherweise bietet der Entwickler Gaspar Sinai zahlreiche Links dafür auf seiner Homepage bereit.

Ein interessanter Nebenaspekt der Vielsprachigkeit von Yudit: Auch Blinde können Ihre Texte mit dem Programm erfassen, da es auch Braille-Zeichen verarbeitet (Abbildung 3).

Abbildung 3: Barrierefrei arbeiten: Mit Yudit können Sie auch Blindenschrift ausgeben.

Nur auf dem Bildschirm macht die Braille-Schrift allerdings keinen Sinn. Unter Einsatz eines geeigneten Druckers ist es aber mit Yudit möglich, Dokumente in Blindenschrift auszudrucken. Damit könnte sich das Programm einen festen Platz als Hilfsmittel für das barrierefreie Arbeiten erobern [5].

Infos

[1] Homepage von Yudit: http://www.yudit.org

[2] Einführung in Katakana: http://de.wikipedia.org/wiki/Katakana

[3] Einführung in Sanskrit: http://de.wikipedia.org/wiki/Sanskrit

[4] Infos zu Ghostscript: http://www.cs.wisc.edu/~ghost/gv/

[5] Barrierefrei unter Linux arbeiten: Thomas Pelkmann, "Zugang für alle", EasyLinux 03/2007, S. 76

LinuxCommunity kaufen

Einzelne Ausgabe
 
Abonnements
 

Ähnliche Artikel

Kommentare

Infos zur Publikation

LU 11/2014: VIDEOS BEARBEITEN

Digitale Ausgabe: Preis € 4,95
(inkl. 19% MwSt.)

Mit der Zeitschrift LinuxUser sind Sie als Power-User, Shell-Guru oder Administrator im kleinen Unternehmen monatlich auf dem aktuelle Stand in Sachen Linux und Open Source.

Sie sind sich nicht sicher, ob die Themen Ihnen liegen? Im Probeabo erhalten Sie drei Ausgaben zum reduzierten Preis. Einzelhefte, Abonnements sowie digitale Ausgaben erwerben Sie ganz einfach in unserem Online-Shop.

NEU: DIGITALE AUSGABEN FÜR TABLET & SMARTPHONE

HINWEIS ZU PAYPAL: Die Zahlung ist auch ohne eigenes Paypal-Konto ganz einfach per Kreditkarte oder Lastschrift möglich!       

Tipp der Woche

Schnell Multi-Boot-Medien mit MultiCD erstellen
Schnell Multi-Boot-Medien mit MultiCD erstellen
Tim Schürmann, 24.06.2014 12:40, 0 Kommentare

Wer mehrere nützliche Live-Systeme auf eine DVD brennen möchte, kommt mit den Startmedienerstellern der Distributionen nicht besonders weit: Diese ...

Aktuelle Fragen

Artikelsuche
Erwin Ruitenberg, 09.10.2014 07:51, 1 Antworten
Ich habe seit einige Jahre ein Dugisub LinuxUser. Dann weiß ich das irgendwann ein bestimmtes Art...
Windows 8 startet nur mit externer Festplatte
Anne La, 10.09.2014 17:25, 6 Antworten
Hallo Leute, also, ich bin auf folgendes Problem gestoßen: Ich habe Ubuntu 14.04 auf meiner...
Videoüberwachung mit Zoneminder
Heinz Becker, 10.08.2014 17:57, 0 Antworten
Hallo, ich habe den ZONEMINDER erfolgreich installiert. Das Bild erscheint jedoch nicht,...
internes Wlan und USB-Wlan-Srick
Gerhard Blobner, 04.08.2014 15:20, 2 Antworten
Hallo Linux-Forum: ich bin ein neuer Linux-User (ca. 25 Jahre Windows) und bin von WIN 8 auf Mint...
Server antwortet mit falschem Namen
oin notna, 21.07.2014 19:13, 1 Antworten
Hallo liebe Community, Ich habe mit Apache einen Server aufgesetzt. Soweit, so gut. Im Heimnet...