AA_teamwork_hoefl_sxc_1215912.jpg

© Hoefl, sxc.hu

Scannen und OCR mit Gscan2pdf

Teamwork

Vom gedruckten Wort bis zum digitalen Dokument in nur wenigen Schritten: Das Programm Gscan2pdf macht's möglich, weil es mehrere Tools unter einem Dach vereint.

Gscan2pdf [1] arbeitet wie moderne Fotokopierer, die neben dem Drucken und Scannen beziehungsweise dem Erstellen von PDFs oft über eine Texterkennung verfügen. Im Wesentlichen gilt es drei Aufgaben zu bewältigen:

  • eine oder mehrere Seiten als Bilder einscannen,
  • diese zu einer oder mehreren Dateien zusammenzufassen,
  • und bei Bedarf die Ergebnisse um einen OCR-Layer ergänzen.

Der modulare Aufbau der Software (Abbildung 1) ermöglicht es im Prinzip, alle Komponenten durch Alternativen zu ersetzen, die Ihnen für die eine Aufgabe besser geeignet erscheinen. Die Software ermöglicht es zusätzlich, in jeden Bearbeitungsschritt einzugreifen oder den Prozess an einer beliebigen Stelle des Workflows zu starten.

Abbildung 1: Der modulare Aufbau von Gscan2pdf ermöglicht den Austausch einzelner Komponenten.

Installation

Normalerweise sorgt der zur Distribution gehörende Paketmanager dafür, dass alle von Gscan2pdf benötigten Tools installiert sind. Das sollten neben Sane mindestens noch Imagemagick, Tesseract-ocr und Unpaper sein. Die Xdg-utils erweitern die Funktionalität so, dass die Sotfware bei Bedarf direkt Mails versendet; Djvulibre stellt zusätzlich das DjVu-Format [2] bereit.

Praxis

Die hier betrachtete Version 0.9.29 entspricht der aus den aktuellen Ubuntu-Repositories. Vom Hauptfenster der Applikation (Abbildung 2) erreichen Sie die wichtigsten Funktionen über Schaltflächen. In den Menüs stehen zusätzliche Funktionen bereit, mit denen Sie die einzelnen Bearbeitungsschritte starten oder Einstellungen vornehmen.

Abbildung 2: Alle wichtigen Funktionen von Gscan2pdf erreichen Sie über Schaltflächen im Hauptfenster.

Scannen

Beim Scannen öffnet dazu das in Abbildung 3 gezeigte Fenster. Vieles dort erinnert zu Recht an Xsane. Über die Auswahl Gerät wählen Sie aus, von welcher Quelle das Programm die Daten erhält, also normalerweise von einem Scanner. Diesen sollten Sie anschalten, bevor Sie Gscan2pdf starten. Gegebenenfalls suchen Sie über Rescan for devices nach neuen Eingabegeräten.

Abbildung 3: In einem etwas unübersichtlichen Dialog legen Sie die grundlegenden Optionn zum Scannen fest.

In den Seiteneinstellungen legen Sie fest, ob Sie dem Programm die Seiten per automatischem oder über manuellen Einzug übergeben. Dabei haben Sie die Möglichkeit, die Anzahl von automatischen Seiteneinzügen bei Scannern zu begrenzen, die das unterstützen. Der Punkt Erweiterte Seitennummerierung erlaubt es, vom regulären Nummerierungsschema abweichende Seitennummern zu vergeben oder mit einer Startseite anzufangen.

Unter Dokument teilen Sie der Applikation mit, ob Sie eine Einzelseite oder Vorder- und Rückseite (Doppelseitig) nacheinander scannen möchten. Dies ist ebenfalls nur bei Scannern mit automatischem Einzug (und Duplexfunktion) relevant. Die Optionen in der Gruppe Nachbearbeitung legen fest, wie Gscan2pdf mit den eingescannten Bildern verfährt. Die Option Drehen erweist sich als sinnvoll, um vernünftige PDFs zu erzeugen; für das OCR ist ein korrektes Ausrichten normalerweise unerlässlich.

LinuxCommunity kaufen

Einzelne Ausgabe
 
Abonnements
 
TABLET & SMARTPHONE APPS
Bald erhältlich
Get it on Google Play

Deutschland

Ähnliche Artikel

  • Abgelichtet und weggepackt
    Viele Scanner-Tools verwirren mit zahlreichen Funktionen, die Sie in den meisten Fällen nicht benötigen. Der übersichtliche Scan-Helfer Gscan2pdf verwandelt dagegen einfach und komfortabel alte Papierdokumente in platzsparende PDF-Dateien.
  • Richtig digitalisieren
    Einfach nur Bücher einscannen war gestern. Mit dem richtigen Werkzeugkasten erstellen Sie heute E-Books inklusive Volltextsuche und Inhaltsverzeichnis weitgehend automatisch.
  • Dokumente mit gscan2pdf scannen
    Um schnell ein Foto einzuscannen, reichen Programme wie XSane völlig aus. Ein mehrseitiges Dokument als PDF-Datei speichern können Sie damit aber nicht. Hier hift gscan2pdf.
  • Neue Software (Teil 1/2)
    Im Quartalsrhythmus erscheinen viele Programme in neuer Version. Eine Auswahl stellen wir regelmäßig vor. Auf der Heft-DVD finden Sie die passenden Pakete und Installationshinweise (Teil 1/2).
  • Bits statt Papier
    Mit einem digitalen Archiv sparen Sie Platz im Aktenschrank – aber Paperwork macht das Leben nicht unbedingt leichter.
Kommentare

Infos zur Publikation

LU 05/2017: Linux unterwegs

Digitale Ausgabe: Preis € 5,95
(inkl. 19% MwSt.)

LinuxUser erscheint monatlich und kostet 5,95 Euro (mit DVD 8,50 Euro). Weitere Infos zum Heft finden Sie auf der Homepage.

Das Jahresabo kostet ab 86,70 Euro. Details dazu finden Sie im Computec-Shop. Im Probeabo erhalten Sie zudem drei Ausgaben zum reduzierten Preis.

Bei Google Play finden Sie digitale Ausgaben für Tablet & Smartphone.

HINWEIS ZU PAYPAL: Die Zahlung ist ohne eigenes Paypal-Konto ganz einfach per Kreditkarte oder Lastschrift möglich!

Aktuelle Fragen

Knoppix-Live-CD (8.0 LU-Edition) im Uefiboot?
Thomas Weiss, 26.04.2017 20:38, 0 Antworten
Hallo, Da mein Rechner unter Windows 8.1/64Bit ein Soundproblem hat und ich abklären wollte, o...
Grub2 reparieren
Brain Stuff, 26.04.2017 02:04, 5 Antworten
Ein Windows Update hat mir Grub zerschossen ... der Computer startet nicht mehr mit Grub, sondern...
Linux open suse 2,8
Wolfgang Gerhard Zeidler, 18.04.2017 09:17, 2 Antworten
Hallo.bitte um Hilfe bei. Code fuer den Rescue-login open suse2.8 Mfg Yvo
grep und sed , gleicher Regulärer Ausdruck , sed mit falschem Ergebnis.
Josef Federl, 15.04.2017 00:23, 1 Antworten
Daten: dlfkjgkldgjldfgl55.55klsdjfl jfjfjfj8.22fdgddfg {"id":"1","name":"Phase L1","unit":"A",...
IP Cams aufzeichnen?
Bibliothek der Technischen Hochschule Mittelhessen / Giessen, 07.04.2017 09:25, 7 Antworten
Hallo, da nun des öfteren bei uns in der Nachbarschaft eingebrochen wird, würde ich gern mein...