Gscan2pdf [1] arbeitet wie moderne Fotokopierer, die neben dem Drucken und Scannen beziehungsweise dem Erstellen von PDFs oft über eine Texterkennung verfügen. Im Wesentlichen gilt es drei Aufgaben zu bewältigen:
- eine oder mehrere Seiten als Bilder einscannen,
- diese zu einer oder mehreren Dateien zusammenzufassen,
- und bei Bedarf die Ergebnisse um einen OCR-Layer ergänzen.
Der modulare Aufbau der Software (Abbildung 1) ermöglicht es im Prinzip, alle Komponenten durch Alternativen zu ersetzen, die Ihnen für die eine Aufgabe besser geeignet erscheinen. Die Software ermöglicht es zusätzlich, in jeden Bearbeitungsschritt einzugreifen oder den Prozess an einer beliebigen Stelle des Workflows zu starten.
Installation
Normalerweise sorgt der zur Distribution gehörende Paketmanager dafür, dass alle von Gscan2pdf benötigten Tools installiert sind. Das sollten neben Sane mindestens noch Imagemagick, Tesseract-ocr und Unpaper sein. Die Xdg-utils erweitern die Funktionalität so, dass die Sotfware bei Bedarf direkt Mails versendet; Djvulibre stellt zusätzlich das DjVu-Format [2] bereit.
Praxis
Die hier betrachtete Version 0.9.29 entspricht der aus den aktuellen Ubuntu-Repositories. Vom Hauptfenster der Applikation (Abbildung 2) erreichen Sie die wichtigsten Funktionen über Schaltflächen. In den Menüs stehen zusätzliche Funktionen bereit, mit denen Sie die einzelnen Bearbeitungsschritte starten oder Einstellungen vornehmen.
Scannen
Beim Scannen öffnet dazu das in Abbildung 3 gezeigte Fenster. Vieles dort erinnert zu Recht an Xsane. Über die Auswahl Gerät wählen Sie aus, von welcher Quelle das Programm die Daten erhält, also normalerweise von einem Scanner. Diesen sollten Sie anschalten, bevor Sie Gscan2pdf starten. Gegebenenfalls suchen Sie über Rescan for devices nach neuen Eingabegeräten.
In den Seiteneinstellungen legen Sie fest, ob Sie dem Programm die Seiten per automatischem oder über manuellen Einzug übergeben. Dabei haben Sie die Möglichkeit, die Anzahl von automatischen Seiteneinzügen bei Scannern zu begrenzen, die das unterstützen. Der Punkt Erweiterte Seitennummerierung erlaubt es, vom regulären Nummerierungsschema abweichende Seitennummern zu vergeben oder mit einer Startseite anzufangen.
Unter Dokument teilen Sie der Applikation mit, ob Sie eine Einzelseite oder Vorder- und Rückseite (Doppelseitig) nacheinander scannen möchten. Dies ist ebenfalls nur bei Scannern mit automatischem Einzug (und Duplexfunktion) relevant. Die Optionen in der Gruppe Nachbearbeitung legen fest, wie Gscan2pdf mit den eingescannten Bildern verfährt. Die Option Drehen erweist sich als sinnvoll, um vernünftige PDFs zu erzeugen; für das OCR ist ein korrektes Ausrichten normalerweise unerlässlich.



