AA_digitize_loganban_123rf_38387768.jpg

© Loganban

Mit Paperwork Dokumente digitalisieren und archivieren

Bits statt Papier

Mit einem digitalen Archiv sparen Sie Platz im Aktenschrank – aber Paperwork macht das Leben nicht unbedingt leichter.

Die Idee von Paperwork [1] geht auf den Wunsch nach einem papierlosen Büro zurück: Briefe, Rechnungen und lose Blätter landen auf dem Scanner, der sie als PDF- und JPEG-Dateien für die Ablage ausspuckt. Die Dateien schicken Sie anschließend durch eine OCR-Texterkennung, die den Inhalt in digitale Form bringt.

Hier schlägt die Stunde von Paperwork: Die Applikation fasst Bilddaten und Text in überlagerter Form zusammen und sichert sie als PDF. Die Textinhalte der aufbereiteten Unterlagen fasst Paperwork in einem Index zusammen, über den Sie später die Dokumente wiederfinden. Bei diesem Verfahren gilt es jedoch, einige Klippen zu umschiffen: Damit die Software die Texte ausreichend gut erkennt, benötigen Sie möglichst hochwertige Scans oder Fotografien der Seiten – ein guter Scanner mit mindestens 600 DPI Auflösung ist daher Voraussetzung.

Paperwork sucht beim Start zunächst nach Tesseract [2]. Findet es diese sehr leistungsfähige OCR-Engine nicht, greift das Programm auf Cuneiform zurück. In den meisten Fällen erzielen Sie mit Tesseract die besten Ergebnisse.

Hier geht Paperwork übrigens einen interessanten Weg: Falls es die Orientierung der eingescannten Seiten nicht ermitteln kann, bearbeitet es die Seite einfach viermal in um 90 Grad gedrehten Varianten und verwendet dann die besten Ergebnisse.

Installation

Allgemeine Informationen zur Installation finden Sie auf der Website des Paperwork-Git-Repositories [3]. Unter Ubuntu und Derivaten befindet sich die momentan aktuelle Version 0.32 nicht in den Repositories, es gibt aber ein PPA. Zu dessen Installation finden Sie online

...

Liebe Leserin, lieber Leser,

dieser Artikel ist derzeit nicht in vollem Umfang online zugänglich.

Sie haben die Möglichkeit, diesen Beitrag als PDF zu erwerben. Dazu nutzen Sie bitte die Box unter dem Artikel. Alternativ erweben Sie die Ausgabe als PDF in unserem Online-Shop.

LinuxUser-Artikel werden 12 Monate nach der Erstveröffentlichung automatisch freigeschaltet. Weitere Artikel aus der Zeitschrift LinuxUser finden Sie im Archiv.

Diesen Artikel als PDF kaufen

Express-Kauf als PDF

Umfang: 6 Heftseiten

Preis € 0,99
(inkl. 19% MwSt.)

LinuxCommunity kaufen

Einzelne Ausgabe
 
Abonnements
 
TABLET & SMARTPHONE APPS
Bald erhältlich
Get it on Google Play

Deutschland

Ähnliche Artikel

Kommentare

Infos zur Publikation

LU 05/2017: Linux unterwegs

Digitale Ausgabe: Preis € 5,95
(inkl. 19% MwSt.)

LinuxUser erscheint monatlich und kostet 5,95 Euro (mit DVD 8,50 Euro). Weitere Infos zum Heft finden Sie auf der Homepage.

Das Jahresabo kostet ab 86,70 Euro. Details dazu finden Sie im Computec-Shop. Im Probeabo erhalten Sie zudem drei Ausgaben zum reduzierten Preis.

Bei Google Play finden Sie digitale Ausgaben für Tablet & Smartphone.

HINWEIS ZU PAYPAL: Die Zahlung ist ohne eigenes Paypal-Konto ganz einfach per Kreditkarte oder Lastschrift möglich!

Aktuelle Fragen

Linux open suse 2,8
Wolfgang Gerhard Zeidler, 18.04.2017 09:17, 2 Antworten
Hallo.bitte um Hilfe bei. Code fuer den Rescue-login open suse2.8 Mfg Yvo
grep und sed , gleicher Regulärer Ausdruck , sed mit falschem Ergebnis.
Josef Federl, 15.04.2017 00:23, 1 Antworten
Daten: dlfkjgkldgjldfgl55.55klsdjfl jfjfjfj8.22fdgddfg {"id":"1","name":"Phase L1","unit":"A",...
IP Cams aufzeichnen?
Bibliothek der Technischen Hochschule Mittelhessen / Giessen, 07.04.2017 09:25, 7 Antworten
Hallo, da nun des öfteren bei uns in der Nachbarschaft eingebrochen wird, würde ich gern mein...
WLAN lässt sich nicht einrichten
Werner Hahn, 21.03.2017 14:16, 2 Antworten
Dell Latitude E6510, Ubuntu 16.4, Kabelbox von Telecolumbus. Nach Anklicken des Doppelpfeiles (o...
"Mit Gwenview importieren" funktioniert seit openSuse 42.2 nicht mehr
Wimpy *, 20.03.2017 13:34, 2 Antworten
Bisher konnte ich von Digitalkamera oder SD-Karte oder USB-Stick Fotos mit Gwenview importieren....