Fazit

Cuneiform mit seinen beiden grafischen Oberflächen Cuneiform-Qt und YAGF ermöglicht bei optimierten Vorlagen Texterkennungsraten, wie sie ansonsten nur sehr kostspielige kommerzielle Programme erreichen. Die drei Applikationen erfreuen durch sehr schnelle Arbeitsweise und große Stabilität. Die beiden Frontends dienen als ohne lange Einarbeitungszeit sofort produktiv bedienbare Oberfläche.

Für professionelle Anwender, die in einem Arbeitsgang auch die Bilddatei einscannen und querformatige Vorlagen drehen wollen, stellt YAGF die optimale Lösung dar. Für Gelegenheitsnutzer, die weniger umfangreiche Scanvorlagen umsetzen, bietet sich dagegen Cuneiform-Qt an: Es gibt sich durch weniger Funktionen übersichtlicher und arbeitet auch schneller. Als Pluspunkt beider Frontends darf die multilinguale Erkennung gelten, die faktisch den gesamten europäischen und angelsächsischen Sprachraum abdeckt und somit die Texterkennung auch sprachenunabhängig deutlich flexibilisiert. 

Glossar

OCR

Optical Character Recognition. Texterkennung in einer Bilddatei anhand von Zeichenmustern. Dabei wertet ein OCR-Programm die vom Scanner eingelesenen Rastergrafiken aus und vergleicht diese mit den Zeichensätzen der internen Datenbank. Moderne OCR-Programme unterscheiden außerdem durch eine Kontextanalyse ähnliche Zeichen und Ziffern und erhöhen damit die Erkennungsrate.

Infos

[1] Cuneiform: https://launchpad.net/cuneiform-linux

[2] RPM-Pakete: http://rpm.pbone.net

[3] Cuneiform-Qt: http://sourceforge.net/projects/cuneiform-qt/

[4] Cuneiform-Qt für Mandriva: http://rpm.pbone.net

[5] YAGF: http://symmetrica.net/cuneiform-linux/yagf-en.html

[6] YAGF für Mandriva 2010: http://rpm.pbone.net

LinuxCommunity kaufen

Einzelne Ausgabe
 
Abonnements
 
TABLET & SMARTPHONE APPS
Bald erhältlich
Get it on Google Play

Deutschland

Ähnliche Artikel

  • Texterkennung mit Tesseract
    Schicke Frontends wollen beim Umgang mit der OCR-Engine Tesseract helfen. Wie gut das gelingt, zeigt ein Test.
  • Texte scannen und mit OCR nachbearbeiten
    Mit einem kleinen Skript verarbeiten Sie große Mengen an Textscans zu PDF-Dateien, die Sie dank OCR mit typischen Unix-Werkzeugen im Volltext durchsuchen.
  • Dokumente mit gscan2pdf scannen
    Um schnell ein Foto einzuscannen, reichen Programme wie XSane völlig aus. Ein mehrseitiges Dokument als PDF-Datei speichern können Sie damit aber nicht. Hier hift gscan2pdf.
  • Paperwork im Kampf gegen wachsende Aktenberge
    Der Traum ist so alt wie der PC auf dem Schreibtisch: Im papierlosen Büro sollen Akten nur noch digital im Rechner vorliegen. Für die Verwaltung des papierlosen Büros wurde Paperwork entwickelt.
  • Software
    Im Quartalsrhythmus erscheinen viele Programme in neuer Version. Eine Auswahl stellen wir regelmäßig vor. Auf der Heft-DVD finden Sie die passenden Pakete und Installationshinweise.
Kommentare
Unzulänglich
ich (unangemeldet), Donnerstag, 14. April 2011 18:50:49
Ein/Ausklappen

dieser Artikel lässt die wesentlichen Punkte bei der Installation weg. Mir es nicht gelungen die beschriebenen Programme zu installieren.

Früher konnte man mit den Artikeln etwas anfangen.



Bewertung: 213 Punkte bei 86 Stimmen.
Den Beitrag bewerten: Gut / Schlecht

Infos zur Publikation

LU 03/2018 NEUE DISTRIBUTIONEN

Digitale Ausgabe: Preis € 5,95
(inkl. 19% MwSt.)

LinuxUser erscheint monatlich und kostet 5,95 Euro (mit DVD 8,50 Euro). Weitere Infos zum Heft finden Sie auf der Homepage.

Das Jahresabo kostet ab 86,70 Euro. Details dazu finden Sie im Computec-Shop. Im Probeabo erhalten Sie zudem drei Ausgaben zum reduzierten Preis.

Bei Google Play finden Sie digitale Ausgaben für Tablet & Smartphone.

HINWEIS ZU PAYPAL: Die Zahlung ist ohne eigenes Paypal-Konto ganz einfach per Kreditkarte oder Lastschrift möglich!

Stellenmarkt

Aktuelle Fragen

Internet abschalten
Karl-Heinz Hauser, 20.02.2018 20:10, 2 Antworten
In der Symbolleiste kann man das Kabelnetzwerk ein und ausschalten. Wie sicher ist die Abschaltu...
JQuery-Script läuft nicht mit Linux-Browsern
Stefan Jahn, 16.02.2018 12:49, 2 Antworten
Hallo zusammen, ...folgender goldener Code (ein jQuery-Script als Ergebnis verschiedener Exper...
XSane-Fotokopie druckt nicht mehr
Wimpy *, 30.01.2018 13:29, 2 Antworten
openSuse 42.3 KDE 5.8.7 Seit einem Software-Update druckt XSane keine Fotokopie mehr aus. Fehler...
TOR-Browser stürzt wegen Wikipedia ab
Wimpy *, 27.01.2018 14:57, 0 Antworten
Tor-Browser 7.5 based on Mozilla Firefox 52.8.0 64-Bit. Bei Aufruf von http: oder https://de.wi...
Wifikarte verhindert Bootvorgang
Maik Kühn, 21.01.2018 22:23, 1 Antworten
iwlwifi-7265D -26 failed to load iwlwifi-7265D -25 failed to load iwlwifi-7265D -24 failed to l...