Verbessern

Als nützlich erweisen sich in der Praxis die Optionen unter Bilder bereinigen: Damit starten Sie das Zusatzprogramm Unpaper, um störende Ränder zu entfernen, Rauschen und Verzerrungen zu korrigieren, Schwellwerte für die Schrift einzustellen (Abbildung 4). Hier gilt es, alle möglichen Einstellungen (insbesondere auch die im Filter-Reiter) einmal durchzusehen und gegebenenfalls auszuprobieren.

Abbildung 4: Mit Unpaper sorgen Sie dafür, dass die Scans beispielsweise von Buchseiten akkurat in der Mitte der Seite liegen.

Wie viel die hier vorhandenen Einstellungen wirklich bringen, hängt wesentlich von den zu bearbeitenden Bildern ab. Bei schlechten Bilder empfiehlt es sich manchmal, Unpaper manuell anzuwenden, da das Programm wesentlich mehr Möglichkeiten bietet, als der Dialog in Gscan2pdf anzeigt [3].

Unpaper liest nur PGM-, PPM- und PBM-Dateien, bearbeitet diese und schreibt das Ergebnis in eine PNM-Datei. Bei Bedarf behelfen Sie sich mit Convert aus dem Imagemagick-Paket, um das gewünschte Format zu erzeugen.

Das Modul für die Einstellungen zum Nachbearbeiten bietet derzeit keine Vorschau, sodass oft unklar bleibt, wie sich Änderungen an den Einstellungen auswirken. Das führt insbesondere in Zusammenhang mit der Texterkennung dazu, dass es häufig vieler Versuche bedarf, um gute Ergebnisse zu erzielen. Der Entwickler denkt über eine bessere Lösung nach. Eine entsprechende Feature-Anfrage liegt vor. Alternativ verwenden Sie das Unpaper-GUI (Abbildung 5), um ein möglichst optimales Parameter-Set zu finden (siehe Kasten "Das Unpaper-GUI").

Abbildung 5: Die grafische Oberfläche von Unpaper erlaubt es, sehr einfach ein optimales Parameter-Set für das Nachbearbeiten von Scans zu ermitteln.

Das Unpaper-GUI

Diese Oberfläche [4] für Unpaper rufen Sie via unpap im Terminal auf. Sie bietet die Möglichkeit, viele, aber nicht alle Optionen von Unpaper zu steuern. Der eigentliche Vorteil des Tools liegt in der in der Vorschau auf das Ergebnis. So stellen Sie ungefähr fest, welche Resultate Sie mit veränderten Parametern erzielen und welche Werte das Ergebnis verbessern.

Im linken Fenster zeigt das Programm die eingelesenen Daten, rechts das mit den aktuellen Einstellungen erzeugte Ergebnis. Das ermöglicht es, eines der beiden Ausgabefenster mit einem Parameter-Set zu belegen und im anderen ein neues Set einzustellen. Live preview bewirkt, dass neue Parameter immer direkt eine neue Ausgabe erzeugt.

Im Log-Reiter zeigt das GUI die tatsächlich verwendeten Befehlszeilen. Das erweist sich als nützlich beim Bearbeiten größerer Mengen von Scans. Erfolgreich angewendete Parameter-Sets speichern Sie über Save unpaper settings..., mittels Load unpaper setting... holen Sie diese wieder hervor.

Neben dem Scannen verfügt Gscan2pdf über die Möglichkeit, Bilder aus anderen Quellen und Dank Imagemagick auch in anderen Formaten zu verarbeiten. Dies erfolgt über den Import im Menü Datei. Da Unpaper nur mit PNM-Formaten zusammenarbeitet, bietet es sich an, Bilder in diesem Format bereitzustellen. Alle anderen gängigen Formate wandelt Gscan2pdf bei Bedarf um. Das ermöglicht beispielsweise auch das Scannen mit einer Kamera [5].

Nach dem Einlesen der Bilder und noch vor dem Bearbeiten mit Unpaper zeigt Gscan2pdf Thumbnails der Seiten in der Seitenleiste an. Diese bietet über ein Kontextmenü Funktionen zum Modifizieren der Liste (etwa zum Umsortieren, Löschen oder Ersetzen missratener Scans) an. Die Reihenfolge der Seiten passen Sie bei Bedarf auch direkt via Drag & Drop an. Neu nummerieren (Menü Bearbeiten) versieht die Seiten nach dem Umsortieren mit neuen, passenden Seitenzahlen.

Möglicherweise stehen nicht alle beschriebenen Funktionen und Optionen bei Ihrem Scanner bereit, oder der von Ihnen eingesetzte Treiber nicht unterstützt. In diesem Fall lassen sich die entsprechenden Optionen nicht aktivieren und erscheinen ausgegraut.

Wichtige Tastenkombinationen

Tasten Funktion
[Strg]+[I] Importieren
[Strg]+[O] Datei öffnen
[Strg]+[N] Neues Projekt beginnen
[Strg]+[G] Scannen
[Strg]+[S] Speichern
[Strg]+[E] Als EMail versenden
[Strg]+[Q] Beenden
[Strg]+[Z] Undo
[Strg]+[Umschalt]+[Z] Redo
[Strg]+[X] Seite ausschneiden
[Strg]+[C] Seite kopieren
[Strg]+[V] Seite einfügen
[Strg]+[R] neu nummerieren
[+] Ansicht vergrößern
[-] Ansicht verkleinern
[Strg]+[Umschalt]+[R] um 90 Grad drehen (im Uhrzeigersinn)
[Strg]+[Umschalt]+[F] um 180 Grad drehen
[Strg]+[Umschalt]+[C] um 290 Grad drehen (im Uhrzeigersinn)

Problemfall OCR

Die Optical Character Recognition (OCR) gehört unter Linux zu den leidigen Themen. Um Dokumente sicher textuell zu erfassen, braucht es Fehlerraten unter 1 Promille. Das schaffen auch bei guten Eingabedateien selbst die besten Programme unter Linux kaum. Bei den üblichen Wald-und-Wiesen-Scans, hergestellt mit den typischen (Home-)Office-Geräten, fallen die Ergebnisse erheblich schlechter aus.

Gscan2pdf bietet mindesten zwei OCR-Programme alternativ an: Gocr und Tesseract-ocr. Letzteres setzt Google für seine umstrittenen Bookscans (http://books.google.com) ein und gehört damit zu den leistungsfähigeren Programmen. Bei idealen Scans mit einer ausreichend hohen Auflösung, guten Kontrasten und geraden Zeilenlauf erzielen Sie gute Ergebnisse. Aber auch nur dann – bei realen Scans sieht es deutlich schlechter aus. Falls installiert, bietet Gscan2pdf auch Ocropus oder Cuneiform als OCR-Engines verwenden, die aber im Test ebenfalls keine guten Ergebnisse lieferten.

Als Faustregel gilt: Mit Auflösungen unter 300 DPI erzielen Sie wohl in den seltensten Fällen ein brauchbares Ergebnis. Die neuste Gscan2pdf-Version ermöglicht es aber zumindest, vereinzelt auftretende OCR-Fehler manuell durch ein Mausklick in das OCR-Ausgabefenster zu korrigieren.

LinuxCommunity kaufen

Einzelne Ausgabe
 
Abonnements
 
TABLET & SMARTPHONE APPS
Bald erhältlich
Get it on Google Play

Deutschland

Ähnliche Artikel

  • Abgelichtet und weggepackt
    Viele Scanner-Tools verwirren mit zahlreichen Funktionen, die Sie in den meisten Fällen nicht benötigen. Der übersichtliche Scan-Helfer Gscan2pdf verwandelt dagegen einfach und komfortabel alte Papierdokumente in platzsparende PDF-Dateien.
  • Richtig digitalisieren
    Einfach nur Bücher einscannen war gestern. Mit dem richtigen Werkzeugkasten erstellen Sie heute E-Books inklusive Volltextsuche und Inhaltsverzeichnis weitgehend automatisch.
  • Dokumente mit gscan2pdf scannen
    Um schnell ein Foto einzuscannen, reichen Programme wie XSane völlig aus. Ein mehrseitiges Dokument als PDF-Datei speichern können Sie damit aber nicht. Hier hift gscan2pdf.
  • Neue Software (Teil 1/2)
    Im Quartalsrhythmus erscheinen viele Programme in neuer Version. Eine Auswahl stellen wir regelmäßig vor. Auf der Heft-DVD finden Sie die passenden Pakete und Installationshinweise (Teil 1/2).
  • Bits statt Papier
    Mit einem digitalen Archiv sparen Sie Platz im Aktenschrank – aber Paperwork macht das Leben nicht unbedingt leichter.
Kommentare

Infos zur Publikation

LU 12/2017: Perfekte Videos

Digitale Ausgabe: Preis € 5,95
(inkl. 19% MwSt.)

LinuxUser erscheint monatlich und kostet 5,95 Euro (mit DVD 8,50 Euro). Weitere Infos zum Heft finden Sie auf der Homepage.

Das Jahresabo kostet ab 86,70 Euro. Details dazu finden Sie im Computec-Shop. Im Probeabo erhalten Sie zudem drei Ausgaben zum reduzierten Preis.

Bei Google Play finden Sie digitale Ausgaben für Tablet & Smartphone.

HINWEIS ZU PAYPAL: Die Zahlung ist ohne eigenes Paypal-Konto ganz einfach per Kreditkarte oder Lastschrift möglich!

Stellenmarkt

Aktuelle Fragen

Huawei
Pit Hampelmann, 13.12.2017 11:35, 1 Antworten
Welches Smartphone ist für euch momentan das beste? Sehe ja die Huawei gerade ganz weit vorne. Bi...
Fernstudium Informatik
Joe Cole, 12.12.2017 10:36, 2 Antworten
Hallo! habe früher als ich 13 Jahre angefangen mit HTML und später Java zu programmieren. Weit...
Installation Linux mint auf stick
Reiner Schulz, 10.12.2017 17:34, 3 Antworten
Hallo, ich hab ein ISO-image mit Linux Mint auf einem Stick untergebracht Jetzt kann ich auch...
Canon Maxify 2750 oder ähnlicher Drucker
Hannes Richert, 05.12.2017 20:14, 4 Antworten
Hallo, leider hat Canon mich weiterverwiesen, weil sie Linux nicht supporten.. deshalb hier die...
Ubuntu Server
Steffen Seidler, 05.12.2017 12:10, 1 Antworten
Hallo! Hat jemand eine gute Anleitung für mich, wie ich Ubuntu Server einrichte? Habe bisher...