AA_teamwork_hoefl_sxc_1215912.jpg

© Hoefl, sxc.hu

Scannen und OCR mit Gscan2pdf

Teamwork

Vom gedruckten Wort bis zum digitalen Dokument in nur wenigen Schritten: Das Programm Gscan2pdf macht's möglich, weil es mehrere Tools unter einem Dach vereint.

Gscan2pdf [1] arbeitet wie moderne Fotokopierer, die neben dem Drucken und Scannen beziehungsweise dem Erstellen von PDFs oft über eine Texterkennung verfügen. Im Wesentlichen gilt es drei Aufgaben zu bewältigen:

  • eine oder mehrere Seiten als Bilder einscannen,
  • diese zu einer oder mehreren Dateien zusammenzufassen,
  • und bei Bedarf die Ergebnisse um einen OCR-Layer ergänzen.

Der modulare Aufbau der Software (Abbildung 1) ermöglicht es im Prinzip, alle Komponenten durch Alternativen zu ersetzen, die Ihnen für die eine Aufgabe besser geeignet erscheinen. Die Software ermöglicht es zusätzlich, in jeden Bearbeitungsschritt einzugreifen oder den Prozess an einer beliebigen Stelle des Workflows zu starten.

Abbildung 1: Der modulare Aufbau von Gscan2pdf ermöglicht den Austausch einzelner Komponenten.

Installation

Normalerweise sorgt der zur Distribution gehörende Paketmanager dafür, dass alle von Gscan2pdf benötigten Tools installiert sind. Das sollten neben Sane mindestens noch Imagemagick, Tesseract-ocr und Unpaper sein. Die Xdg-utils erweitern die Funktionalität so, dass die Sotfware bei Bedarf direkt Mails versendet; Djvulibre stellt zusätzlich das DjVu-Format [2] bereit.

Praxis

Die hier betrachtete Version 0.9.29 entspricht der aus den aktuellen Ubuntu-Repositories. Vom Hauptfenster der Applikation (Abbildung 2) erreichen Sie die wichtigsten Funktionen über Schaltflächen. In den Menüs stehen zusätzliche Funktionen bereit, mit denen Sie die einzelnen Bearbeitungsschritte starten oder Einstellungen vornehmen.

Abbildung 2: Alle wichtigen Funktionen von Gscan2pdf erreichen Sie über Schaltflächen im Hauptfenster.

Scannen

Beim Scannen öffnet dazu das in Abbildung 3 gezeigte Fenster. Vieles dort erinnert zu Recht an Xsane. Über die Auswahl Gerät wählen Sie aus, von welcher Quelle das Programm die Daten erhält, also normalerweise von einem Scanner. Diesen sollten Sie anschalten, bevor Sie Gscan2pdf starten. Gegebenenfalls suchen Sie über Rescan for devices nach neuen Eingabegeräten.

Abbildung 3: In einem etwas unübersichtlichen Dialog legen Sie die grundlegenden Optionn zum Scannen fest.

In den Seiteneinstellungen legen Sie fest, ob Sie dem Programm die Seiten per automatischem oder über manuellen Einzug übergeben. Dabei haben Sie die Möglichkeit, die Anzahl von automatischen Seiteneinzügen bei Scannern zu begrenzen, die das unterstützen. Der Punkt Erweiterte Seitennummerierung erlaubt es, vom regulären Nummerierungsschema abweichende Seitennummern zu vergeben oder mit einer Startseite anzufangen.

Unter Dokument teilen Sie der Applikation mit, ob Sie eine Einzelseite oder Vorder- und Rückseite (Doppelseitig) nacheinander scannen möchten. Dies ist ebenfalls nur bei Scannern mit automatischem Einzug (und Duplexfunktion) relevant. Die Optionen in der Gruppe Nachbearbeitung legen fest, wie Gscan2pdf mit den eingescannten Bildern verfährt. Die Option Drehen erweist sich als sinnvoll, um vernünftige PDFs zu erzeugen; für das OCR ist ein korrektes Ausrichten normalerweise unerlässlich.

LinuxCommunity kaufen

Einzelne Ausgabe
 
Abonnements
 
TABLET & SMARTPHONE APPS
Bald erhältlich
Get it on Google Play

Deutschland

Ähnliche Artikel

  • Abgelichtet und weggepackt
    Viele Scanner-Tools verwirren mit zahlreichen Funktionen, die Sie in den meisten Fällen nicht benötigen. Der übersichtliche Scan-Helfer Gscan2pdf verwandelt dagegen einfach und komfortabel alte Papierdokumente in platzsparende PDF-Dateien.
  • Richtig digitalisieren
    Einfach nur Bücher einscannen war gestern. Mit dem richtigen Werkzeugkasten erstellen Sie heute E-Books inklusive Volltextsuche und Inhaltsverzeichnis weitgehend automatisch.
  • Dokumente mit gscan2pdf scannen
    Um schnell ein Foto einzuscannen, reichen Programme wie XSane völlig aus. Ein mehrseitiges Dokument als PDF-Datei speichern können Sie damit aber nicht. Hier hift gscan2pdf.
  • Neue Software (Teil 1/2)
    Im Quartalsrhythmus erscheinen viele Programme in neuer Version. Eine Auswahl stellen wir regelmäßig vor. Auf der Heft-DVD finden Sie die passenden Pakete und Installationshinweise (Teil 1/2).
  • Bits statt Papier
    Mit einem digitalen Archiv sparen Sie Platz im Aktenschrank – aber Paperwork macht das Leben nicht unbedingt leichter.
Kommentare

Infos zur Publikation

LU 10/2017: Daten retten & sichern

Digitale Ausgabe: Preis € 8,50
(inkl. 19% MwSt.)

LinuxUser erscheint monatlich und kostet 5,95 Euro (mit DVD 8,50 Euro). Weitere Infos zum Heft finden Sie auf der Homepage.

Das Jahresabo kostet ab 86,70 Euro. Details dazu finden Sie im Computec-Shop. Im Probeabo erhalten Sie zudem drei Ausgaben zum reduzierten Preis.

Bei Google Play finden Sie digitale Ausgaben für Tablet & Smartphone.

HINWEIS ZU PAYPAL: Die Zahlung ist ohne eigenes Paypal-Konto ganz einfach per Kreditkarte oder Lastschrift möglich!

Stellenmarkt

Aktuelle Fragen

Lieber Linux oder Windows- Betriebssystem?
Sina Kaul, 13.10.2017 16:17, 2 Antworten
Hallo, bis jetzt hatte ich immer nur mit
IT-Kurse
Alice Trader, 26.09.2017 11:35, 2 Antworten
Hallo liebe Community, ich brauche Hilfe und bin sehr verzweifelt. Ih bin noch sehr neu in eure...
Backup mit KUP unter Suse 42.3
Horst Schwarz, 24.09.2017 13:16, 3 Antworten
Ich möchte auch wieder unter Suse 42.3 mit Kup meine Backup durchführen. Eine Installationsmöglic...
kein foto, etc. upload möglich, wo liegt mein fehler?
kerstin brums, 17.09.2017 22:08, 5 Antworten
moin, zum erstellen einer einfachen wordpress website kann ich keine fotos uploaden. vom rechne...
Arch Linux Netzwerkkonfigurationen
Franziska Schley, 15.09.2017 18:04, 0 Antworten
Moin liebe Linux community, ich habe momentan Probleme mit der Einstellung des Lan/Wlan in Arc...