Werkzeugkasten

Mit dem PDF Toolkit steht Ihnen ein umfangreiches Programm zum Bearbeiten von PDF-Dateien zu Verfügung, mit dem Sie nicht nur Metadaten auslesen und bearbeiten oder mehrere PDF-Dateien zusammenfügen, sondern auch einzelne Seiten aus einem PDF extrahieren, Seiten rotieren sowie PDF-Dateien verschlüsseln und mit einem Passwortschutz versehen.

Liegt Ihnen etwa der Scan eines Buchs vor, bei dem jedes Kapitel in einem eigenen PDF steckt, dann fügen Sie die einzelnen Dateien mit den Kommandos aus Listing 8 zu einem Gesamtdokument zusammen. Bitte achten Sie darauf, dass die Sortierung im PDF der Reihenfolge des jeweiligen Dateinamens entspricht.

Listing 8

$ pdftk kap1.pdf kap2.pdf kap3.pdf cat output buch.pdf
$ pdftk kap*.pdf cat output buch.pdf

Umgekehrt extrahieren Sie mit Pdftk auch gezielt Passagen aus einem längeren PDF. Angenommen, Sie möchten die Titelseite eines E-Books auf Seite 1 sowie den Inhalt zwischen den Seiten 42 bis 73 als schlankes PDF vorliegen haben, dann erreichen Sie dies mit der Option cat <1 42-73 aus dem entsprechenden Aufruf von Pdftk (Listing 9, erste Zeile).

Alternativ drehen Sie beispielsweise ein Dokument in die richtige Position, das nach dem Scan im Querformat vorliegt (Listing 9, zweite Zeile). Welche Seiten Sie in welche Richtung drehen, bestimmen Sie über die Option 1-endeast. Der erste Teil 1-end bedeutet von Seite 1 bis zum Ende, also alle Seiten. Direkt daran schließt sich die Drehrichtung an: Hier east, also 90 Grad im Uhrzeigersinn (nach "Osten"). Als weitere Drehrichtungen gibt es south (nach "Süden", also um 180 Grad) und west (nach "Westen", also 90 Grad gegen den Uhrzeigersinn).

Listing 9

$ pdftk buch.pdf cat <1 42-73 output kapitel.pdf
$ pdftk scan_quer.pdf cat 1-endeast output scan_hoch.pdf

Darüber hinaus bietet Pdftk die Möglichkeit, das Dokument vor fremden Blicken zu schützen. Die Option encrypt_128bit verschlüsselt das PDF mit einem 128 Bit langen Schlüssel, wobei Sie das Passwort mit user_pw Passwort setzen. Erweitern Sie den Aufruf via owner_pw Passwort2 mit einem zweiten Passwort, darf nur noch der "Besitzer" das Dokument drucken oder bearbeiten – es sei denn, Sie geben die Rechte mit Optionen wie allow printing explizit frei (Listing 10). Beachten Sie jedoch, dass nur Adobes Acrobat Reader diese DRM-Funktionen zwingend beachtet (siehe Kasten "Pseudo-DRM in PDFs").

Listing 10

$ pdftk datei.pdf output datei_verschluesselt.pdf user_pw Passwort
$ pdftk datei.pdf output verschluesselt.pdf user_pw Passwort owner_pw Passwort2
$ pdftk datei.pdf output verschluesselt.pdf user_pw Passwort owner_pw Passwort1 encrypt_128bit allow printing

Möchten Sie sich die mit Pdftk verbundene Tipparbeit sparen, dann finden Sie mit PDF Chain [7] eine passende grafische Benutzeroberfläche (Abbildung 4). Diese legt sämtliche Funktionen des Toolkits auf schnell erfassbare Dialoge, sodass Sie sich keine Kommandos merken müssen. Das Programm finden Sie unter dem Namen pdfchain in den Paketquellen gängiger Distributionen.

Abbildung 4: PDF Chain bietet eine einfache, aber nützliche grafische Oberfläche zu dem leistungsfähigen PDF Toolkit Pdftk.

Pseudo-DRM in PDFs

Die einem PDF-Dokument zuweisbaren Vorgaben zur digitalen Rechteminderung, wie etwa allow printing, allow assembly oder allow copycontents, beachtet lediglich Adobes Acrobat Reader zwingend [11]. KDEs Dokumentenbetrachter Okular hält sich nur an die Vorgaben, wenn Sie den Menüpunkt Einstellungen | Okular einrichten... | Allgemein | DRM-Beschränkungen beachten aktivieren. Der Dokumentenbetrachter Evince aus Gnome ignoriert die DRM-Einschränkungen komplett. In der Praxis bietet die Trennung zwischen User- und Owner-Passwort daher keinen Mehrwert. Einzig das Verschlüsseln über user_pw Passwort encrypt_128bit bietet einen echten Schutz vor ungewünschten Einblicken.

Beschneiden und Komprimieren

Scannt man Bücher oder Zeitschriften mit einem leistungsfähigen Scanner ein, landet oft eine Doppelseite auf einer Seite des PDF-Dokuments. Meist wäre es jedoch wünschenswert, jede Seite der Vorlage tatsächlich auf einer PDF-Seite abzubilden. Hier schafft das Programm Krop [8] (nicht zu verwechseln mit dem Kommandozeilenprogramm crop) Abhilfe. Krop bietet eine Vielzahl von Möglichkeiten, PDF-Dateien zu beschneiden – unter anderem, Doppelseiten in zwei Einzelseiten zu zerteilen (Abbildung 5).

Abbildung 5: Mit Krop teilen Sie eingescannte Doppelseiten schnell und einfach auf zwei einzelne Seiten im PDF-Dokument auf.

Eingescannte Dokumente erreichen schnell Größen, die mit langen Ladezeiten und Problemen beim Weiterverarbeiten einhergehen. Oft gibt auch der Empfänger eine maximale Dateigröße vor. Daher gilt es, schon beim Scannen auf die richtige Auflösung zu achten: Ein Schwarz-Weiß-Scan in 72 dpi genügt üblicherweise zum Lesen, jedoch nicht für eine Texterkennung. In der Praxis resultiert ein Schwarz-Weiß-Scan mit 300 dpi in einem ausgeglichenen Verhältnis von guter Qualität und handhabbarer Dateigröße.

Gerät ein PDF doch einmal zu groß, skalieren Sie dessen Auflösung mit Ghostscript [9] herunter oder optimieren das Dokument gleich komplett für verschiedene Einsatzzwecke (Listing 11). Viele Distributionen bringen das Programm von Haus aus mit, zumindest findet es sich meist unter demselben Namen als Paket in den Quellen.

Der Befehl in der ersten Zeile von Listing 11 veranlasst Ghostscript, aus der PDF-Datei input.pdf eine verkleinerte PDF-Datei output.pdf im Format A4 mit einer Auflösung von 72 dpi zu erstellen. Die Option -dNOPAUSE verhindert, dass Ghostscript nach jeder Seite stoppt und auf eine Bestätigung zum Weitermachen wartet. Die Option -dBATCH bewirkt, dass Ghostscript sich zum Schluss automatisch beendet. Der Aufruf in der zweiten Zeile erhält die Dimensionen des PDFs, setzt jedoch über die Option -dPDFSETTINGS=/Einstellung automatisch eine Reihe weiterer Schalter, die das Dokument für verschiedene Einsatzgebiete optimieren (siehe Tabelle "Ghostscript: PDF-Settings").

Listing 11

$ gs -sDEVICE=pdfwrite -sPAPERSIZE=a4 -r72 -dNOPAUSE -dBATCH -sOutputFile=output.pdf input.pdf
$ gs -sDEVICE=pdfwrite -dCompatibilityLevel=1.4 -dPDFSETTINGS=/ebook -dNOPAUSE -dQUIET -dBATCH -sOutputFile=output.pdf input.pdf

Ghostscript: PDF-Settings

Option Auflösung Kommentar
/screen 72 dpi Für die Darstellung am PC optimiert.
/ebook 150 dpi Gute Qualität bei geringer Größe. Ideal für Scans von Zeugnissen für Bewerbungen.
/printer 300 dpi Optimiert für Ausdrucke, ergibt jedoch recht große Dokumente.
/prepress 300 dpi Für die Weitergabe an Druckereien gedacht, keine Reduzierung der Farbanzahl.
/default keine Angabe Optimierung für eine optimale Darstellung auf unterschiedlichsten Ausgabegeräten.

Diesen Artikel als PDF kaufen

Express-Kauf als PDF

Umfang: 8 Heftseiten

Preis € 0,99
(inkl. 19% MwSt.)

LinuxCommunity kaufen

Einzelne Ausgabe
 
Abonnements
 
TABLET & SMARTPHONE APPS
Bald erhältlich
Get it on Google Play

Deutschland

Ähnliche Artikel

  • Ein Multifunktionsgerät für die Arbeit mit PDF-Dateien
    Zur Verarbeitung der Papierberge im Büro nutzen wir die moderne Bürotechnik. Wir müssen Dokumente abheften und entheften, kopieren, neu zusammenstellen, abstempeln, untersuchen oder klassifizieren. Bei der täglichen Arbeit mit elektronischen Dokumenten kann ein ganz spezielles Multifunktionsgerät verwendet werden: Pdftk ­ das PDF-Toolkit.
  • Bits statt Papier
    Mit einem digitalen Archiv sparen Sie Platz im Aktenschrank – aber Paperwork macht das Leben nicht unbedingt leichter.
  • Richtig digitalisieren
    Einfach nur Bücher einscannen war gestern. Mit dem richtigen Werkzeugkasten erstellen Sie heute E-Books inklusive Volltextsuche und Inhaltsverzeichnis weitgehend automatisch.
  • Texte scannen und mit OCR nachbearbeiten
    Mit einem kleinen Skript verarbeiten Sie große Mengen an Textscans zu PDF-Dateien, die Sie dank OCR mit typischen Unix-Werkzeugen im Volltext durchsuchen.
  • Innere Werte
    Postscript- und PDF-Dokumente führen Zusatzdaten mit, die Aufschluss über das Dokument und dessen Autor geben. Diese Meta-Informationen lassen sich auch setzen und bearbeiten.
Kommentare

Infos zur Publikation

LU 12/2017: Perfekte Videos

Digitale Ausgabe: Preis € 5,95
(inkl. 19% MwSt.)

LinuxUser erscheint monatlich und kostet 5,95 Euro (mit DVD 8,50 Euro). Weitere Infos zum Heft finden Sie auf der Homepage.

Das Jahresabo kostet ab 86,70 Euro. Details dazu finden Sie im Computec-Shop. Im Probeabo erhalten Sie zudem drei Ausgaben zum reduzierten Preis.

Bei Google Play finden Sie digitale Ausgaben für Tablet & Smartphone.

HINWEIS ZU PAYPAL: Die Zahlung ist ohne eigenes Paypal-Konto ganz einfach per Kreditkarte oder Lastschrift möglich!

Stellenmarkt

Aktuelle Fragen

Broadcom Adapter 802.11n nachinstallieren
Thomas Mengel, 31.10.2017 20:06, 2 Antworten
Hallo, kann man nachträglich auf einer Liveversion, MX Linux auf einem USB-Stick, nachträglich...
RUN fsck Manually / Stromausfall
Arno Krug, 29.10.2017 12:51, 1 Antworten
Hallo, nach Absturz des Rechners aufgrund fehlendem Stroms startet Linux nicht mehr wie gewohn...
source.list öffnet sich nicht
sebastian reimann, 27.10.2017 09:32, 2 Antworten
hallo Zusammen Ich habe das problem Das ich meine source.list nicht öffnen kann weiß vlt jemman...
Lieber Linux oder Windows- Betriebssystem?
Sina Kaul, 13.10.2017 16:17, 6 Antworten
Hallo, bis jetzt hatte ich immer nur mit
IT-Kurse
Alice Trader, 26.09.2017 11:35, 2 Antworten
Hallo liebe Community, ich brauche Hilfe und bin sehr verzweifelt. Ih bin noch sehr neu in eure...