Home / LinuxUser / 2007 / 08 / Yudit it!

Newsletter abonnieren

Lies uns auf...

Folge LinuxCommunity auf Twitter

Top-Beiträge

Mandriva gibt Distribution in die Hände der Community
(268 Punkte bei 24 Stimmen)
Neues vom Systemd
(161 Punkte bei 4 Stimmen)
Mandriva in Nöten
(161 Punkte bei 4 Stimmen)

Heftarchiv

LinuxUser Heftarchiv

EasyLinux Heftarchiv

Ubuntu User Heftarchiv

Ubuntu User Heftarchiv

Partner-Links:

Shopping
Topsuche
 
Yatego Deutschlands größte Shoppingmall. 10000 Shops,
3.5 Mio Artikel. Alle Bestseller, Servertechnik und Technik Themenwelten.

Notebooks und Netzwerkhardware bei Mercateo günstig kaufen.
Internet Telefonie mit VoIP Telefonen von Gigaset
Das B2B Portal www.Linx.de informiert über Produkte und Dienstleistungen.
Günstige Digitalkameras finden Sie im Preisvergleich.

Yudit it!

Bidirektionaler und multilingualer Editor

01.08.2007 Wer multilinguale Texte korrekt erfassen und bearbeiten will, stößt mit herkömmlichen Texteditoren schnell an Grenzen. Yudit schafft Abhilfe.

Texteditoren gibt es unter Linux in so großer Zahl wie bei keinem anderen Betriebssystem. Die Palette reicht von einfachsten Editoren bis zu komplexen Textverarbeitungen, die funktional keine Wünsche mehr offen lassen und zudem mit ihrer grafischen Oberfläche auch dem Auge eine angenehme Atmosphäre bieten.

Bei allem Eyecandy und Leistungsumfang: In der Regel schaffen es weder die vielen Editoren noch die großen Textverarbeitsprogramme, innerhalb eines Dokumentes beliebig den Zeichensatz zu wechseln oder gar – wie zum Beispiel in arabischen Sprachen oder im Hebräischen üblich – das Schreiben von rechts nach links zu ermöglichen.

Ganz klar ein Fall für Yudit [1]. Der Unicode-Texteditor erlaubt – unter verschiedenen Betriebssystemen – sowohl bidirektionales Schreiben als auch das Arbeiten mit verschiedenen Zeichensätzen. So können Sie mit Yudit problemlos ein Dokument zunächst in deutscher Sprache verfassen und anschließend im gleichen Dokument einen in japanischem Katakana [2] geschriebenen Teil und schließlich noch einen Abschnitt in Sanskrit [3] anfügen.

Die wundersame Welt der Kodierung

Die Geschichte der so genannten Zeichensätze ist eng mit der Historie der modernen Datenverarbeitung verbunden. Als Pioniere auf diesem Gebiet gelten die beiden Amerikaner Samuel Morse und Herman Hollerith sowie der Franzose Jean-Maurice-Émile Baudot, die allesamt für ihre damals zeitgemäßen Kommunikationsmittel eigene Kodierungen ersannen. Auch die nachfolgenden, zunehmend elektronisch arbeitenden Rechenanlagen verwendeten proprietäre und damit untereinander vollständig inkompatible Zeichensätze. Das machte es irgendwann nötig, über einheitliche Zeichensätze nachzudenken.

Im Jahre 1963 erblickte der 7-Bit-ASCII-Zeichensatz (American Standard Code for Information Interchange) das Licht der Welt. Er konnte 128 unterschiedliche Zeichen darstellen. Schnell stellte sich aber heraus, dass der sieben Bit breite Zeichensatz zwar für die englische Sprache ausreichte, nicht aber für Europa mit seinen vielen Akzent- und Sonderzeichen. So wurde der Standard-ASCII-Zeichensatz um ein Bit verbreitert, was die Anzahl möglicher Zeichen immerhin auf 256 verdoppelte. Dieser erweiterte ASCII-Zeichensatz war international bis in die späten Achtzigerjahre des vergangenen Jahrhunderts gebräuchlich.

Trotz aller Versuche, im Rahmen der ISO-Normen 2022 und 8859 die Kodierungsschemen des ASCII-Zeichensatzes festzuschreiben, blieben die einzelnen Zeichensätze zueinander teilweise inkompatibel. Beide Normen hatten einen entscheidenden Konstruktionsfehler: Sie definierten nur die ersten 128 Zeichen des gesamten Satzes als verbindlich. Die zweite Hälfte des Zeichensatzes konnte dagegen jeder Anbieter ganz nach Belieben belegen. Die Folge: Allein für die ISO-Norm 8859 existieren 14 verschiedene Gruppen, die regionale Eigenheiten abbilden. Zeichensätze mit tausenden Einzelzeichen, etwa verschiedene ostasiatische Sprachen, waren damit dagegen überhaupt nicht darstellbar.

Diese unbefriedigende Situation änderte sich erst, als sich Mitte der Achtzigerjahre des vergangenen Jahrhunderts die International Standardization Organization (ISO) und das Unicode Consortium endlich zur Kooperation entschlossen und 1991 die Unicode-Norm in der ersten Version verabschiedeten. Der kontinuierlich weiterentwickelte Unicode-Standard (aktuell in Version 5) behebt die bisherigen Probleme weitgehend: Er lässt sich auf vielen Rechnersystemen einsetzen, vereinfacht den Datenaustausch durch einen einheitlichen Zeichensatz und bietet einen ausreichenden Zeichenvorrat, um auch ostasiatische Sprachen darzustellen.

Aber auch von Unicode existieren verschiedene Implementierungen. Im Verlauf seiner Geschichte kamen drei Zeichenkodierungsformate und sieben Kodierungsschemen auf den Markt. In Europa etwa ist meist die Variante UTF-8 im Einsatz, die dem alten ASCII-Format ähnelt. Moderne Betriebssysteme und die meisten Programmiersprachen unterstützen heute Unicode. Unter Linux etwa überprüfen Sie mit dem Befehl locale auf der Konsole, welcher Zeichensatz vorgegeben ist. Auch die gängigen Texteditoren wie Emacs oder Vim unterstützen Unicode, erlauben jedoch keine bidirektionale Funktionalität. Dies schafft nur einer: Yudit.

Installation

Yudit ist in vielen Distributionen bereits in der aktuellen Version 2.8.1 enthalten oder lässt sich wenigstens über Repositories nachinstallieren. Auf seiner Homepage stellt der in Japan lebende ungarische Entwickler Gaspar Sinai ein fertiges RPM-Paket für verschiedene Hardware-Architekturen zur Verfügung.

An gleicher Stelle sowie auf der Heft-CD finden Sie außerdem ein RPM-Quellarchiv [3] für jene Distributionen, die Yudit noch nicht kennen. Aus den Quellen generieren Sie über den Konsolenbefehl rpmbuild --rebuild yudit-Version .src.rpm ein herkömmliches RPM-Archiv, das Sie anschließend mit dem Befehl rpm -ivh /Pfad/yudit-Archiv .rpm installieren. Reichen die erwähnten Installationsmöglichkeiten nicht aus, so finden Sie bei Gaspar Sinai sowie auf der Heft-CD auch ein reines Sourcecode-Archiv, das sie selbst kompilieren und über den Dreisatz ./configure && make && make install einrichten.

Der Entwickler bietet auf seiner Homepage zusätzlich Links zu verschiedenen Font-Bibliotheken. Yudit arbeitet mit einer eigenen Rendering-Engine und hantiert problemlos auch mit X11- und TrueType-Fonts. Um die Funktionalität des Editors um eine Vorschau-Funktion zu erweitern, sollten Sie zudem das Paket gv installieren – besser bekannt unter dem Namen Ghostview und unter verschiedenen Aliasnamen für diverse Plattformen verfügbar [4]. Gv bietet zudem als grafisches Frontend für Ghostscript die Option, gängige PostScript- und PDF-Dokumente anzuzeigen.

Nach erfolgreicher Installation präsentiert sich der Editor zunächst in dunklen, wenig anheimelnden Farben. Eine Menüleiste existiert nicht; lediglich eine Schalterleiste ziert das Hauptfenster im oberen Bereich. Im unteren Abschnitt finden Sie eine Kommandozeile (Abbildung 1). Diese ungewöhnliche Zeile hängt mit der Fähigkeit von Yudit zusammen, aus dem Editor heraus Befehle aufzurufen und externe Programme einzubinden.

Abbildung 1: Yudit im Einsatz mit einer multilingualen Datei.

Um die Vorgaben des Programms den eigenen Wünschen anzupassen, modifizieren Sie die Textdatei ~/.yudit/yudit.properties. Hier ändern Sie nicht nur Pfade und Spracheinstellungen, sondern tragen Fonts und Keymaps ein, die Sie selbst definiert oder aus dem Internet geladen haben. Die entsprechenden Fontdateien finden Sie in den Verzeichnissen ~/.yudit/fonts und /usr/share/yudit/fonts. Die Keymaps, also speziell für bestimmte Sprachen definierte Tastaturdateien, liegen im Verzeichnis ~/.yudit/data oder – systemweit – /usr/share/yudit/data.

Um Text in der jeweiligen Sprache korrekt einzugeben, müssen Sie zunächst die sprachspezifische Tastaturbelegung einstellen. Von diesen so genannten Keymaps liefert Yudit bereits mehr als 100 vorgefertigte mit, die Sie in der Symbolleiste im zweiten Feld von rechts auswählen und in einer Dialogbox festlegen (Abbildung 2). Zwischen einzelnen Tastaturbelegungen schalten Sie mit [F1] bis [F12] hin und her.

Abbildung 2: Die Tastaturbelegung für fremde Zeichensätze stellen Sie hier ein.

Sollten Sie bei der Texteingabe unleserliche Zeichen im Editorfenster sehen, müssen Sie noch den korrekten Font einstellen. Das erledigen Sie über die Tastenkombinationen [Umschalt]+[F1] bis [Umschalt]+[F9]. Anschließend können Sie nach Lust und Laune mit dem Editor arbeiten, wobei Yudit bei arabischen und hebräischen Texten auch die umgekehrte Schreibrichtung berücksichtigt.

Um die Kompatibilität von Yudit-Texten mit anderen Editoren und Textprogrammen zu wahren, legt das Programm eigene Dateien nicht in einem proprietären Format ab, sondern als Textdatei unter Berücksichtigung des entsprechenden Zeichensatzes. Dazu haben Sie im Speicherdialog verschiedene Optionen zur Auswahl.

Fazit

Yudit erweist sich als schneller und einfach zu bedienender Editor für fremdsprachige Texte auch mit ungewöhnlichen Zeichensätzen. Das Programm zeichnet sich vor allem durch die Möglichkeit der bidirektionalen Texteingabe sowie durch die Option aus, in einem einzigen Dokument den Zeichensatz nach Belieben wechseln zu können. Durch das Einbinden von externen Programmen und die integrierte Befehlszeile lassen sich zudem einfache Such-, Druck- und Vorschaufunktionen realisieren.

Für anspruchsvollen Textsatz eignet sich die Software aber wegen der fehlenden Formatiermöglichkeiten nicht. Einen Rüffel verdient das Programm auch wegen des fehlenden Konfigurationsmenüs. Alle Einstellungen gilt es stattdessen umständlich in einer Skriptdatei vorzunehmen. Insbesondere bei Texten mit wenig gebräuchlichen Schriftzeichen ist es zudem unumgänglich, erst entsprechende Fontbibliotheken aus dem Internet zu laden und einzubinden, damit Yudit seine ganze Stärke ausspielen kann. Glücklicherweise bietet der Entwickler Gaspar Sinai zahlreiche Links dafür auf seiner Homepage bereit.

Ein interessanter Nebenaspekt der Vielsprachigkeit von Yudit: Auch Blinde können Ihre Texte mit dem Programm erfassen, da es auch Braille-Zeichen verarbeitet (Abbildung 3).

Abbildung 3: Barrierefrei arbeiten: Mit Yudit können Sie auch Blindenschrift ausgeben.

Nur auf dem Bildschirm macht die Braille-Schrift allerdings keinen Sinn. Unter Einsatz eines geeigneten Druckers ist es aber mit Yudit möglich, Dokumente in Blindenschrift auszudrucken. Damit könnte sich das Programm einen festen Platz als Hilfsmittel für das barrierefreie Arbeiten erobern [5].

Infos

[1] Homepage von Yudit: http://www.yudit.org

[2] Einführung in Katakana: http://de.wikipedia.org/wiki/Katakana

[3] Einführung in Sanskrit: http://de.wikipedia.org/wiki/Sanskrit

[4] Infos zu Ghostscript: http://www.cs.wisc.edu/~ghost/gv/

[5] Barrierefrei unter Linux arbeiten: Thomas Pelkmann, "Zugang für alle", EasyLinux 03/2007, S. 76

Einem Freund empfehlen    Druckansicht Bookmark and Share
Kommentare

724 Hits
Wertung: 104 Punkte (4 Stimmen)

Schlecht Gut

Infos zur Publikation

Infos zur Publikation

LinuxUser 06/2012

Aktuelle Ausgabe kaufen:

Heft bestellen Heft als PDF kaufen

LinuxUser erscheint monatlich und kostet in der Nomedia-Ausgabe EUR 5,50 und mit DVD EUR 8,50. Weitere Informationen zum Heft finden Sie auf der LinuxUser-Homepage.

Im LinuxUser-Probeabo erhalten Sie drei Ausgaben für 3 Euro. Das Jahresabo (ab EUR 56,10) können Sie im LNM-Shop bestellen.

Tipp der Woche

Adobe AIR
Adobe-AIR-Programme installieren und (manuell) starten
Tim Schürmann, 14.05.2012 13:09, 0 Kommentare

Es gibt sie noch: neue Anwendungen, die Adobes Integrated Runtime voraussetzen. Aktuellstes und vermutlich auch größtes Beispiel ist das Adventure Botanicula

Aktuelle Fragen

gibt es ein Kommandozeilen Tool, um ein X11-Fenster in ein Anderes einzubetten?
GoaSkin , 21.05.2012 16:44, 0 Antworten
Das XEmbed-Protokoll ist u.A. dazu gedacht, dass man eine X11-Anwendung in eine andere wie ein Wi...
Apache2, Options -Indexes geht nicht
no no, 12.05.2012 19:01, 8 Antworten
Habe in apache2.conf folgendes stehen: Options -Indexes ...
LInux auf Dell LS H500
Andreas Endresl, 09.05.2012 08:54, 2 Antworten
Habe einen alten Dell Latitude LS H500 nur mit ext. Floppy und CD es geht nur immer eines von den...
Datenwiederherstellung unter Ubuntu 12.04 mit "Simple Backup" nach Umzug von Linux Mint
Christian Lottmann, 07.05.2012 13:33, 0 Antworten
Vor dem Umzug auf Ubuntu 12.04 habe ich unter Linux MInt mit "Simple Backup" voll (15.4.2012) und...
DKMS für den propritären NVIDIA-Treiber
Commander Data, 26.04.2012 22:02, 2 Antworten
Hallo an die Gemeinde. Ich habe hier ein interessantes Stück openSuSE gefunden. http://forums.op...