Fazit

Cuneiform mit seinen beiden grafischen Oberflächen Cuneiform-Qt und YAGF ermöglicht bei optimierten Vorlagen Texterkennungsraten, wie sie ansonsten nur sehr kostspielige kommerzielle Programme erreichen. Die drei Applikationen erfreuen durch sehr schnelle Arbeitsweise und große Stabilität. Die beiden Frontends dienen als ohne lange Einarbeitungszeit sofort produktiv bedienbare Oberfläche.

Für professionelle Anwender, die in einem Arbeitsgang auch die Bilddatei einscannen und querformatige Vorlagen drehen wollen, stellt YAGF die optimale Lösung dar. Für Gelegenheitsnutzer, die weniger umfangreiche Scanvorlagen umsetzen, bietet sich dagegen Cuneiform-Qt an: Es gibt sich durch weniger Funktionen übersichtlicher und arbeitet auch schneller. Als Pluspunkt beider Frontends darf die multilinguale Erkennung gelten, die faktisch den gesamten europäischen und angelsächsischen Sprachraum abdeckt und somit die Texterkennung auch sprachenunabhängig deutlich flexibilisiert. 

Glossar

OCR

Optical Character Recognition. Texterkennung in einer Bilddatei anhand von Zeichenmustern. Dabei wertet ein OCR-Programm die vom Scanner eingelesenen Rastergrafiken aus und vergleicht diese mit den Zeichensätzen der internen Datenbank. Moderne OCR-Programme unterscheiden außerdem durch eine Kontextanalyse ähnliche Zeichen und Ziffern und erhöhen damit die Erkennungsrate.

Infos

[1] Cuneiform: https://launchpad.net/cuneiform-linux

[2] RPM-Pakete: http://rpm.pbone.net

[3] Cuneiform-Qt: http://sourceforge.net/projects/cuneiform-qt/

[4] Cuneiform-Qt für Mandriva: http://rpm.pbone.net

[5] YAGF: http://symmetrica.net/cuneiform-linux/yagf-en.html

[6] YAGF für Mandriva 2010: http://rpm.pbone.net

LinuxCommunity kaufen

Einzelne Ausgabe
 
Abonnements
 
TABLET & SMARTPHONE APPS
Bald erhältlich
Get it on Google Play

Deutschland

Ähnliche Artikel

  • Texterkennung mit Tesseract
    Schicke Frontends wollen beim Umgang mit der OCR-Engine Tesseract helfen. Wie gut das gelingt, zeigt ein Test.
  • Texte scannen und mit OCR nachbearbeiten
    Mit einem kleinen Skript verarbeiten Sie große Mengen an Textscans zu PDF-Dateien, die Sie dank OCR mit typischen Unix-Werkzeugen im Volltext durchsuchen.
  • Dokumente mit gscan2pdf scannen
    Um schnell ein Foto einzuscannen, reichen Programme wie XSane völlig aus. Ein mehrseitiges Dokument als PDF-Datei speichern können Sie damit aber nicht. Hier hift gscan2pdf.
  • Paperwork im Kampf gegen wachsende Aktenberge
    Der Traum ist so alt wie der PC auf dem Schreibtisch: Im papierlosen Büro sollen Akten nur noch digital im Rechner vorliegen. Für die Verwaltung des papierlosen Büros wurde Paperwork entwickelt.
  • Software
    Im Quartalsrhythmus erscheinen viele Programme in neuer Version. Eine Auswahl stellen wir regelmäßig vor. Auf der Heft-DVD finden Sie die passenden Pakete und Installationshinweise.
Kommentare
Unzulänglich
ich (unangemeldet), Donnerstag, 14. April 2011 18:50:49
Ein/Ausklappen

dieser Artikel lässt die wesentlichen Punkte bei der Installation weg. Mir es nicht gelungen die beschriebenen Programme zu installieren.

Früher konnte man mit den Artikeln etwas anfangen.



Bewertung: 206 Punkte bei 76 Stimmen.
Den Beitrag bewerten: Gut / Schlecht

Infos zur Publikation

LU 08/2017: VIRTUALISIERUNG

Digitale Ausgabe: Preis € 5,95
(inkl. 19% MwSt.)

LinuxUser erscheint monatlich und kostet 5,95 Euro (mit DVD 8,50 Euro). Weitere Infos zum Heft finden Sie auf der Homepage.

Das Jahresabo kostet ab 86,70 Euro. Details dazu finden Sie im Computec-Shop. Im Probeabo erhalten Sie zudem drei Ausgaben zum reduzierten Preis.

Bei Google Play finden Sie digitale Ausgaben für Tablet & Smartphone.

HINWEIS ZU PAYPAL: Die Zahlung ist ohne eigenes Paypal-Konto ganz einfach per Kreditkarte oder Lastschrift möglich!

Aktuelle Fragen

Genivi for Raspberry Pi 3
Sebastian Ortmanns, 28.07.2017 10:37, 0 Antworten
I try to build a Genivi Development Platform for Rasberry Pi 3. But I always get the failures bel...
Bash awk Verständnis-Frage
Josef Federl, 22.07.2017 17:46, 2 Antworten
#!/bin/bash # Skriptdateiname = test.sh spaltennummer=10 wert=zehner awk '{ $'$spaltennummer'...
Bash - verschachtelte Variablenersetzung, das geht doch eleganter als meine Lösung?
Josef Federl, 18.07.2017 20:24, 2 Antworten
#!/bin/bash #Ziel des Skriptes wird sein die ID zu extrahieren hier nur als Consolentest: root@...
Speicherplatzfreigabe mit "sudo apt-get clean" scheitert
Siegfried Böttcher, 16.07.2017 21:16, 3 Antworten
Speicherplatzfreigabe mit "sudo apt-get clean" scheitert, weil aus mir unerfindlichen Gründen im...
Möchte Zattoo vom PC am Fernsehgerät sehen können
Ilona Nikoui, 15.07.2017 18:25, 3 Antworten
Hallo, ich habe mein Fernsehgerät, ein LG 26LE3300 mit dem PC verbunden per HDMI Kabel, wie empfo...