Ein Multifunktionsgerät für die Arbeit mit PDF-Dateien

PDFs ausgereizt

Zur Verarbeitung der Papierberge im Büro nutzen wir die moderne Bürotechnik. Wir müssen Dokumente abheften und entheften, kopieren, neu zusammenstellen, abstempeln, untersuchen oder klassifizieren. Bei der täglichen Arbeit mit elektronischen Dokumenten kann ein ganz spezielles Multifunktionsgerät verwendet werden: Pdftk ­ das PDF-Toolkit.

Jeder LaTeX-Anwender muss oft eigene und fremde PDF-Dokumente weiterverarbeiten. Zu den zahlreichen verfügbaren Programmen zur PDF-Bearbeitung gehören beispielsweise GhostScript, die iText-Bibliothek und Xpdf.

Seit Ende 2003 gibt es zudem Pdftk, ein komfortables Kommandozeilenprogramm zur (Stapel-)Verarbeitung von PDF-Dateien. Wer an vielen PDF-Dateien gleiche oder ähnliche Operationen ausführen muss, sollte Pdftk als Werkzeug in die engere Wahl ziehen. Aber auch als Nutzer graphischer Oberflächen kann man sich dieses Programm dienstbar machen. In KDE gibt es dazu spezielle Konqueror-Menüs, unter Windows 2000 oder XP kann man Batch-Dateien mit Pdftk-Befehlen zum Kontextmenü hinzufügen.

Installation und Einsatz

Sie können das PDF-Toolkit in der aktuellsten Version von einer der Webseiten des Autors Sid Steward [7] herunterladen. Er bietet das unter der GPL stehende Programm unter anderem für Linux, Mac OS X (Panther), FreeBSD, Solaris und Windows an. Die plattformspezifische Installation erweist sich auf den getesteten Plattformen (Debian, SuSE Linux, Windows 2000, Windows XP) als unkompliziert.

Nach der Installation rufen Sie Pdftk aus einer Shell (oder der Windows-Eingabeaufforderung) auf. Der Befehl pdftk --help listet alle Kommandos und Optionen des Programms samt kurzer Hilfetexte auf. In der Tabelle "Pdftk-Operationen" finden Sie die wichtigsten Operationen sowie einige Erläuterungen dazu. Der generelle Aufruf des Programms zur Bearbeitung von PDF-Dateien lautet:

pdftk Eingabedatei(en) Operation [Option] output Ausgabedatei [Passworte] [Benutzerrechte]

Pdftk-Operationen

Operation   Erläuterung
attach_files   Fügt Dateien als Anlage an ein PDF-Dokument an. Die PDF-Datei kann auf diese Weise zu einer Archivdatei erweitert werden.
background   Versieht jede Seite eines PDF-Dokuments mit einem Wasserzeichen. Auf leere Flächen kann auch eine Art Stempel gesetzt werden.
burst     Zerlegt ein PDF-Dokument in einzelne Seiten.
cat     Fügt mehrere Dateien oder mehrere Seiten aus verschiedenen PDF-Dokumenten zu einer neuen PDF-Datei zusammen.
dump_data   Gibt Informationen zu einer PDF-Datei auf die Standardausgabe aus.
dump_data_fields Gibt Informationen zu den Formularfeldern einer PDF-Datei auf die Standardausgabe aus.
fill_form   Füllt PDF-Formulare aus oder verbindet die Formulardaten mit dem Dokument.
unpack_files   Entpackt die angefügten Anlagen eines PDF-Dokuments in ein Verzeichnis.
update_info   Aktualisiert die Meta-Informationen (z.B. Autor, Titel, Thema) in einer PDF-Datei.

Die Eingabedateien müssen stets im PDF-Format vorliegen. Für spezielle Operationen benötigt das Tool zusätzlich Textdateien in bestimmten Formaten. pdftk gibt eine oder mehrere PDF-Dateien und in bestimmten Fällen auch Textdateien aus.

Im folgenden haben wir einige Beispiele zusammengestellt, die einige interessante Anwendungen von pfdtk zeigen. Sie leuchten jedoch bei weitem nicht alle Möglichkeiten des Programms aus. Alle Beispieldateien zu diesem Artikel stehen Ihnen unter [2] für eigene Versuche mit pdftk zur Verfügung.

Sie können PDF-Dateien wie eine E-Mail durch Anhänge (attachments) ergänzen. Das Abspeichern der Anhänge beim Empfänger erfolgt zum Beispiel mit dem Adobe Reader (ab Version 6). Pdftk ermöglicht sowohl das Anhängen von Dateien an ein PDF-Dokument als auch das Abspeichern der Anhänge. Bis zum kürzlichen Erscheinen des Adobe Reader 7 stellte das für Linux-Anwender die einzige Möglichkeit dar, Attachments abzuspeichern.

Solche Anhänge kann man zum Beispiel nutzen, um einem PDF-Dokument Quelltexte oder einen Auszug aus der Literaturdatenbank hinzuzufügen. Man könnte auch Messdaten anhängen, um auf diese Weise die Aussagen des Dokuments zu ergänzen. Im folgenden Beispiel soll eine PDF-Datei mit ihrem Quelltext gemeinsam weitergegeben werden. Um die Quelldatei mit Pdftk in das PDF einzubinden, fügen Sie dies mit

pdftk Formular.pdf attach_files Formular.tex output Neu.pdf

an das PDF-Dokument an. Alternativ können Sie die Datei mit Hilfe von pdfLaTEX und attachfile an die fertige PDF-Datei anhängen. Der Empfänger entpackt den Quelltext und andere Anhänge seinerseits mit Pdftk in ein Verzeichnis:

pdftk Beispiel_anhang.pdf unpack_files output Source

In diesem Beispiel speichert Pdftk die Anhänge in das Verzeichnis Source ab. Ein solches Verzeichnis anzugeben, macht immer dann Sinn, wenn mehrere Dateien angehängt sein könnten.

Wasserzeichen und Hintergrundfarbe

Ähnlich wie mit dem LaTeX-Paket eso-pic kann man auch mit Pdftk Wasserzeichen in ein Dokument einbringen. Dazu dient die Operation background. Sie erlaubt zudem, das PDF nachträglich mit einem farbigen Hintergrund zu versehen.

Die als Wasserzeichen genutzte Grafik muss als PDF-Datei vorliegen. Sie können Sie beispielsweise in einem Vektorgrafikprogramm erstellen oder auch mit PostScript programmieren. Weist das Wasserzeichen nicht dieselbe Größe wie das Dokument aufweist, skaliert Pdftk es. Möchten Sie ein Dokument mit dem Stempel "ENTWURF" versehen, erstellen Sie zunächst ein PDF im entsprechenden Seitenformat und rufen dann Pdftk wie folgt auf:

pdftk Beispiel.pdf background Entwurf.pdf output Entwurf1.pdf

Auf unbeschriebenen Teilen des Dokuments wirkt das Wasserzeichen wie ein Stempel. Ein elektronisches Blatt Papier mit einer passenden Hintergrundfarbe kann man zum Beispiel in einer kleinen EPS-Datei erstellen. Die entsprechenden PostScript-Befehle für ein A4-Blatt lauten:

%!PS-Adobe-2.0
%%BoundingBox: 0 0 595 842
0.95 0.95 0.90 setrgbcolor
0 0 moveto 595 0 rlineto 0 842 rlineto -595 0 rlineto
closepath fill
showpage

Änderungen der Hintergrundfarbe können Sie im EPS-Code sehr leicht vornehmen. Nun wandeln Sie die EPS-Datei mit epstopdf in eine PDF-Datei um und fügen Sie über Pdftk als Hintergrund ein:

pdftk Beispiel.pdf background Bg.pdf output Bsp_farbig.pdf

LinuxCommunity kaufen

Einzelne Ausgabe
 
Abonnements
 
TABLET & SMARTPHONE APPS
Bald erhältlich
Get it on Google Play

Deutschland

Ähnliche Artikel

  • Blätterwald
    Das PDF-Format hat sich als Standard für den Austausch von Dokumenten etabliert. Unter Linux stehen eine ganze Reihe von Programmen bereit, mit denen Sie alle Möglichkeiten dieses Dateiformats optimal ausreizen.
  • Seiten-Puzzle
    Im zweiten Teil unserer Serie zu Postscript und PDF geht es Werkzeuge zum Zerlegen und Zusammenfügen von Dokumenten.
  • Anwendungsbeispiele zu LaTeX und PDF
    Die vergangenen Folgen des LaTeX-Workshops im LinuxUser haben viele Möglichkeiten des Satzsystems vorgestellt. Die letzte Ausgabe geht auf einige spezielle Pakete genauer ein, die PDF-Dateien mit weiteren Finessen versehen.
  • Innere Werte
    Postscript- und PDF-Dokumente führen Zusatzdaten mit, die Aufschluss über das Dokument und dessen Autor geben. Diese Meta-Informationen lassen sich auch setzen und bearbeiten.
  • Texte scannen und mit OCR nachbearbeiten
    Mit einem kleinen Skript verarbeiten Sie große Mengen an Textscans zu PDF-Dateien, die Sie dank OCR mit typischen Unix-Werkzeugen im Volltext durchsuchen.
Kommentare

Infos zur Publikation

LU 10/2016: Kryptographie

Digitale Ausgabe: Preis € 0,00
(inkl. 19% MwSt.)

LinuxUser erscheint monatlich und kostet 5,95 Euro (mit DVD 8,50 Euro). Weitere Infos zum Heft finden Sie auf der Homepage.

Das Jahresabo kostet ab 86,70 Euro. Details dazu finden Sie im Computec-Shop. Im Probeabo erhalten Sie zudem drei Ausgaben zum reduzierten Preis.

Bei Google Play finden Sie digitale Ausgaben für Tablet & Smartphone.

HINWEIS ZU PAYPAL: Die Zahlung ist ohne eigenes Paypal-Konto ganz einfach per Kreditkarte oder Lastschrift möglich!

Aktuelle Fragen

Probleme mit MPC/MPD
Matthias Göhlen, 27.09.2016 13:39, 0 Antworten
Habe gerade mein erstes Raspi Projekt angefangen, typisches Einsteigerding: Vom Raspi 3B zum Radi...
Soundkarte wird erkannt, aber kein Ton
H A, 25.09.2016 01:37, 6 Antworten
Hallo, Ich weiß, dass es zu diesem Thema sehr oft Fragen gestellt wurden. Aber da ich ein Linu...
Scannen nur schwarz-weiß möglich
Werner Hahn, 20.09.2016 13:21, 2 Antworten
Canon Pixma MG5450S, Dell Latitude E6510, Betriebssyteme Ubuntu 16.04 und Windows 7. Der Canon-D...
Meteorit NB-7 startet nicht
Thomas Helbig, 13.09.2016 02:03, 4 Antworten
Verehrte Community Ich habe vor Kurzem einen Netbook-Oldie geschenkt bekommen. Beim Start ersch...
windows bootloader bei instalation gelöscht
markus Schneider, 12.09.2016 23:03, 1 Antworten
Hallo alle zusammen, ich habe neben meinem Windows 10 ein SL 7.2 Linux installiert und musste...