Lesekompetenz

Der Button Alles erkennen in der Mitte oben startet die Texterkennung. Haben Sie im Reiter Dateien mehrere Seiten ausgewählt, verarbeitet die Software diese in einem Rutsch. Das ist bei Vorlagen mit vielen Seiten praktisch, denn der Erkennungsvorgang kann über zehn Sekunden pro Seite dauern.

Der kleine Pfeil neben dem Button Alles erkennen öffnet das Menü für die Spracheinstellung. Die dort angezeigten Sprachen entsprechen den für Tesseract installierten Sprachpaketen. Das Programmpaket für Deutsch heißt unter OpenSuse tesseract-traineddata-german, unter Ubuntu tesseract-ocr-deu. Tesseract selbst müssen Sie ebenfalls installieren.

Nach der Umwandlung blendet das Programm rechts ein Unterfenster mit dem erkannten Text ein, den Sie entweder in eine Textdatei speichern (Diskettensymbol) oder in die Zwischenablage kopieren. Ein Ärgernis bei der maschinellen Texterkennung sind Silbentrennungen: Tesseract übernimmt Trennstriche und Zeilenumbrüche. Zum Glück gibt es in gImageReader die Funktion Zeilenumbrüche entfernen, die beides aus dem Text im Unterfenster löscht, Absatzumbrüche (doppelte Zeilenumbrüche) aber erhält.

Leider hat Tesseract im gedruckten EasyLinux-Artikel aus Abbildung 8 viele Bindestriche als längere Gedankenstriche erkannt und deshalb nicht entfernt. Das liegt aber wohl an der EasyLinux-Schriftart und sollte nicht bei allen Texten auftreten.

Leckere Sandwiches

Statt einfachen Textdateien erzeugt gImageReader auf Wunsch auch "Sandwich-PDFs" (Abbildung 8). Diese Dateien sind für das Archivieren von Dokumenten praktisch, denn dabei legt die Software den erkannten Text unsichtbar über die als Pixelgrafik eingebaute Originalseite. So konserviert die PDF-Datei die Originaloptik und lässt sich trotzdem nach Schlagworten durchsuchen. Auch die in KDE fest eingebaute Desktop-Suchmaschine oder das in diesen Software-News vorgestellte Programm DocFetcher verschlagworten den unsichtbaren Text.

Abbildung 8: Ein unsichtbar über dem Scan liegender Text macht "Sandwich-PDFs" trotz originalgetreu wiedergegebener Optik durchsuchbar.

Die Redaktion meint

gImageReader gibt sich handlich und übersichtlich. Besonders nützlich ist die Funktion zum Entfernen von Zeilenumbrüchen und Trennstrichen.

Bewertung

4 von 5 Sternen

LinuxCommunity kaufen

Einzelne Ausgabe
 
Abonnements
 
TABLET & SMARTPHONE APPS
Bald erhältlich
Get it on Google Play

Deutschland

Ähnliche Artikel

  • Mit Hugin Panoramafotos erstellen
    Gute Panoramaaufnahmen vermitteln beinahe dramatisch die Atmosphäre einer Landschaft. Mit Hugin und dem richtigen Ausgangsmaterial erstellen Sie diese auch ohne Weitwinkelobjektiv.
  • Nähkurs
    Nähen ist einfacher als gedacht! Zumindest das Aneinandernähen (stitchen) mehrerer Bilder oder Fotos zu einem Panorama gelingt mit Hugin in wenigen Schritten. Aber das Programm kann einiges mehr.
  • Zusammengenäht
    Der Aufnahmewinkel handelsüblicher Kameras ist bekanntlich beschränkt. Wie Sie damit trotzdem beeindruckende Panoramaaufnahmen erstellen, zeigt der Artikel.
  • Perfekte Panoramas mit Hugin, Enblend und Autopano-SIFT
    Landschafts- oder Stadtbilder gewinnen an Reiz, wenn man mehrere von ihnen zum Großformat montiert. Die einzelnen Fotos passen aber oft nicht so recht zusammen, was die Sache schwierig macht. Die Tools Hugin, Enblend und Autopano-SIFT helfen dabei.
  • Schlüsselfrage
    Der Truecrypt-Nachfolger Veracrypt empfiehlt sich mit seiner handlichen grafischen Oberfläche nicht nur Einsteigern: Mit den "Hidden Volumes" bietet er daneben auch ein einzigartiges Profi-Feature.
Kommentare

Infos zur Publikation

EL 11/2017-01/2018: Einstieg in Linux

Digitale Ausgabe: Preis € 9,80
(inkl. 19% MwSt.)

EasyLinux erscheint vierteljährlich und kostet 9,80 Euro. Weitere Infos zum Heft finden Sie auf der Homepage.

Das Jahresabo kostet ab 33,30 Euro. Details dazu finden Sie im Computec-Shop.

Bei Google Play finden Sie digitale Ausgaben für Tablet & Smartphone.

HINWEIS ZU PAYPAL: Die Zahlung ist ohne Paypal-Konto ganz einfach per Kreditkarte oder Lastschrift möglich!      

Stellenmarkt

Aktuelle Fragen

Lieber Linux oder Windows- Betriebssystem?
Sina Kaul, 13.10.2017 16:17, 3 Antworten
Hallo, bis jetzt hatte ich immer nur mit
IT-Kurse
Alice Trader, 26.09.2017 11:35, 2 Antworten
Hallo liebe Community, ich brauche Hilfe und bin sehr verzweifelt. Ih bin noch sehr neu in eure...
Backup mit KUP unter Suse 42.3
Horst Schwarz, 24.09.2017 13:16, 3 Antworten
Ich möchte auch wieder unter Suse 42.3 mit Kup meine Backup durchführen. Eine Installationsmöglic...
kein foto, etc. upload möglich, wo liegt mein fehler?
kerstin brums, 17.09.2017 22:08, 5 Antworten
moin, zum erstellen einer einfachen wordpress website kann ich keine fotos uploaden. vom rechne...
Arch Linux Netzwerkkonfigurationen
Franziska Schley, 15.09.2017 18:04, 0 Antworten
Moin liebe Linux community, ich habe momentan Probleme mit der Einstellung des Lan/Wlan in Arc...