YAGF

YAGF startet ähnlich rasant und bietet auch eine gleichermaßen schnelle Texterkennung wie Cuneiform-Qt. Wie bei Cuneiform-Qt besteht der Arbeitsbereich von YAGF aus zwei großen, nebeneinander angeordneten Dokumentenrahmen für das zu erkennende Bild links und das OCR-Ergebnis rechts. Darüber befindet sich eine horizontal angeordnete Schalterleiste. Ganz oben im Programmfenster findet sich eine Menüleiste mit lediglich zwei Einträgen, die wiederum in sehr übersichtlich ausgestattete Untermenüs verzweigen (Abbildung 3).

Abbildung 3: Auch YAGF erlaubt eine intuitive Bedienung.

Bei YAGF nehmen Sie die relevanten Einstellungen wie Sprachversion und Ausgabeformat dank eingebetteter Auswahlmenüs bequem aus der Schalterleiste heraus vor. Aufgrund der Anbindung des Aspell-Wörterbuchs nimmt YAGF außerdem auf Wunsch eine Rechtschreibprüfung vor, die fehlerhaft erkannte Begriffe markiert. So sinkt insbesondere bei längeren Texten die Gefahr, bei der manuellen Korrektur etwas zu übersehen. Bei älteren deutschsprachigen Texten, die noch nach der alten Rechtschreibung entstanden sind, kann die orthographische Prüfung jedoch auch zu Problemen führen. Dies gilt insbesondere beim Bearbeiten von Zitaten aus wissenschaftlichen Texten, da es diese authentisch wiederzugeben gilt.

Durch die Einbindung von Xsane ermöglicht YAGF, Papiervorlagen direkt aus der Texterkennung heraus für das weitere Bearbeiten mithilfe der OCR-Engine einzuscannen. Sie starten Xsane einfach mit einem Klick auf das Scannersymbol in der Schalterleiste von YAGF oder stoßen den Scanvorgang über das Menü Datei | Bild einlesen an. Das eingescannte Bild erscheint im linken Fensterrahmen von YAGF. Anschließend startet ein Klick auf eine der beiden Schaltflächen mit Lupensymbol die Texterkennung.

Hier definieren Sie, ob Cuneiform das vorhandene Dokument seitenweise oder komplett einlesen soll. Bei querformatig eingescannten Bildern besteht die Möglichkeit, diese durch eine über dem linken Fensterrahmen eingeblendete Knopfleiste zu drehen. Das macht bei solchen im Rohzustand unbrauchbaren Vorlagen die Texterkennung erst möglich. Mithilfe der über dem linken Ansichtsbereich eingeblendeten Schalterleiste markieren Sie in der Vorlage den zur Texterkennung vorgesehenen Bereich. Diese Funktion erweist sich vor allem bei komplexen Dokumenten als nützlich, bei denen der Text die Grafik beidseitig umfließt. Bislang kommt keine Texterkennung bei solchen komplexen Layouts automatisch zu befriedigenden Ergebnissen. Die die manuelle Markierung in YAGF gestattet zumindest das Ausblenden mittig positionierter Abbildungen.

Ein weiteres Highlight von YAGF stellt die Möglichkeit dar, den erkannten Text – er erscheint im rechten Arbeitsbereich des Programmfensters – grundlegend zu bearbeiten. Sie können Textteile löschen, Absätze einfügen oder sogar zusätzlichen Text aus der Zwischenablage integrieren. Umgekehrt lässt sich auch im Arbeitsbereich markierter Text durch einen Klick auf die Schaltfläche Text in die Zwischenablage kopieren in diese übernehmen und in anderen Anwendungen weiterverarbeiten. In Kombination mit der Rechtschreibprüfung kontrollieren Sie so eingelesene Texte schnell und sicher auf orthographische Schwächen.

Linguistisches

Sowohl das Duo YAGF/Cuneiform als auch die Kombination Cuneiform-Qt/Cuneiform bietet die Möglichkeit, die Sprache der Texterkennung auszuwählen. Hierbei werden nicht nur romanische Sprachen mit Sonderzeichen berücksichtigt, sondern auch slawische Idiome und sogar mehrere Sprachen, die kyrillische Zeichensätze verwenden. In Cuneiform-Qt definieren Sie die Dokumentensprache im Menü Settings | Configure... | Language:; in YAGF wählen Sie die Erkennungssprache per Dropdown-Menü aus (Abbildung 4).

Abbildung 4: Mehrsprachigkeit? Für YAGF kein Problem.

Um Problemen aus dem Weg zu gehen, die bei Mischdokumenten mit mehreren Zeichensätzen entstehen, können Cuneiform-Qt wie YAGF zwei Zeichensätze simultan zur Texterkennung heranziehen. Diese Fähigkeit ist vor allem dann interessant, wenn Markennamen oder Bezeichnungen aus dem westeuropäischen oder angelsächsischen Raum den kyrillischen Text durchsetzen. Im Falle einer Erkennung ausschließlich mit kyrillischem Zeichensatz werden solche Bezeichnungen nicht korrekt wiedergegeben, was den Nachbearbeitungsaufwand eines Dokumentes drastisch erhöht. Cuneiform-Qt bietet lediglich die Option, gemischte russisch-englische Zeichensätze bei der Texterkennung zu nutzen, während YAGF auch die Kombination mit spanischen, deutschen und französischen Zeichensätzen anbietet. Letzteres deckt so gut wie alle in den verschiedenen westeuropäischen Sprachen genutzten Sonderzeichen ab.

LinuxCommunity kaufen

Einzelne Ausgabe
 
Abonnements
 
TABLET & SMARTPHONE APPS
Bald erhältlich
Get it on Google Play

Deutschland

Ähnliche Artikel

Kommentare
Unzulänglich
ich (unangemeldet), Donnerstag, 14. April 2011 18:50:49
Ein/Ausklappen

dieser Artikel lässt die wesentlichen Punkte bei der Installation weg. Mir es nicht gelungen die beschriebenen Programme zu installieren.

Früher konnte man mit den Artikeln etwas anfangen.



Bewertung: 176 Punkte bei 46 Stimmen.
Den Beitrag bewerten: Gut / Schlecht

Infos zur Publikation

LU 10/2016: Kryptographie

Digitale Ausgabe: Preis € 0,00
(inkl. 19% MwSt.)

LinuxUser erscheint monatlich und kostet 5,95 Euro (mit DVD 8,50 Euro). Weitere Infos zum Heft finden Sie auf der Homepage.

Das Jahresabo kostet ab 86,70 Euro. Details dazu finden Sie im Computec-Shop. Im Probeabo erhalten Sie zudem drei Ausgaben zum reduzierten Preis.

Bei Google Play finden Sie digitale Ausgaben für Tablet & Smartphone.

HINWEIS ZU PAYPAL: Die Zahlung ist ohne eigenes Paypal-Konto ganz einfach per Kreditkarte oder Lastschrift möglich!

Aktuelle Fragen

Probleme mit MPC/MPD
Matthias Göhlen, 27.09.2016 13:39, 2 Antworten
Habe gerade mein erstes Raspi Projekt angefangen, typisches Einsteigerding: Vom Raspi 3B zum Radi...
Soundkarte wird erkannt, aber kein Ton
H A, 25.09.2016 01:37, 6 Antworten
Hallo, Ich weiß, dass es zu diesem Thema sehr oft Fragen gestellt wurden. Aber da ich ein Linu...
Scannen nur schwarz-weiß möglich
Werner Hahn, 20.09.2016 13:21, 2 Antworten
Canon Pixma MG5450S, Dell Latitude E6510, Betriebssyteme Ubuntu 16.04 und Windows 7. Der Canon-D...
Meteorit NB-7 startet nicht
Thomas Helbig, 13.09.2016 02:03, 4 Antworten
Verehrte Community Ich habe vor Kurzem einen Netbook-Oldie geschenkt bekommen. Beim Start ersch...
windows bootloader bei instalation gelöscht
markus Schneider, 12.09.2016 23:03, 1 Antworten
Hallo alle zusammen, ich habe neben meinem Windows 10 ein SL 7.2 Linux installiert und musste...