PDF-Metadaten aktualisieren

Adobe hat das PDF-Format so konzipiert, dass während der Existenz des Dokuments die Datenintegrität gewahrt bleibt. Der Betrachter soll keinen Zweifel daran hegen müssen, dass ihn das empfangene Dokument unverändert erreicht hat. Ähnliches gilt für den Autor – er will meist sicher sein, dass der Empfänger das Dokument nicht nachträglich modifizieren kann.

Dass PDF diese Ansprüche bedient, mag dazu beigetragen haben, dass das Format sich als Quasi-Standard zum Datenaustausch etablieren konnte – etwa auch bei Belegen und Rechnungen. Obwohl Postscript ebenso "sicher" ist, kommt es für derartige Belange weitaus seltener zu Einsatz. Zumindest die Metadaten eines PDF-Dokuments lassen sich aber relativ einfach modifizieren. Das geschieht in drei Schritten: dem Auslesen der bisherigen Metadaten, dem folgenden Verändern der Daten und dem abschließenden Aktualisieren des PDFs.

Das Auslesen der PDF-Datei und das Speichern der Metadaten erledigen Sie mithilfe von pdftk. Der folgende Aufruf liest aus dem File RN2.pdf die Metadaten ein und speichert sie in der Datei daten:

pdftk RN2.pdf dump_data > daten

Öffnen Sie nun das File daten, erhalten Sie auf diesem Weg eine ganze Reihe von Informationen über das PDF-Dokument (Abbildung 10). Die Metadaten lagern jeweils in aufeinanderfolgenden Zeile in Schlüssel-Wert-Paaren. Zeilen, die mit InfoKey beginnen, enthalten einen Schlüssel, die Zeilen mit InfoValue den zugehörigen Wert.

Abbildung 10: Mittels Pdftk aus einem PDF-Dokument ausgelesene Meta-Informationen.

Um nun etwa den Autorennamen zu ändern, suchen Sie im der Datei die Zeile InfoKey: Author und ändern in der darauffolgenden Zeile den Autorennamen wie gewünscht. Dann speichern Sie das File als neue_daten ab. Abschließend aktualisieren Sie das PDF mit den geänderten Metadaten:

pdftk RN2.pdf update_info neue_daten output RN3.pdf

Der Befehl schreibt die Änderungen in ein neues PDF-Dokument namens RN3.pdf. In Abbildung 11 sehen Sie, dass sich dort Unbekannt Erdritter als Autor des Dokumentes hinzugemogelt hat.

Abbildung 11: Dieses PDF haben wir um den zusätzlichen Autor "Unbekannt Erdritter" ergänzt.

Wer genau hinschaut, bemerkt zudem eine Auffälligkeit: Das Erzeugungsdatum ist nicht mehr korrekt gesetzt. Ob das an einem Bug in Pdftk liegt oder andere Ursachen hat, ließ sich bis Redaktionsschluss nicht mehr abschließend klären. Wie auch immer: Noch ist das Schummeln leider nicht perfekt. 

Glossar

RGB

Red, Green, Blue. Additives Farbmodell, das Farben durch das additive Mischen der drei Grundfarben Rot, Grün und Blau nachbildet.

CMYK

Cyan, Magenta, Yellow, Key. Subtraktives Farbmodell, das als technische Grundlage für den modernen Vierfarbdruck dient. "Key" bezieht sich auf den Schwarz-Anteil: Im Englischen heißt die schwarz druckende Offset-Platte "key plate", weil an ihr die farbig druckenden Platten ausgerichtet werden.

RTF

Rich Text Format. Von Microsoft 1987 eingeführtes Dateiformat, das auf reinen Textdateien basiert. Wird in der Windows-Welt oft zum Datenaustausch eingesetzt.

Infos

[1] PS/PDF-Tricks: Frank Hofmann, "Scheibchenweise", LinuxUser 12/2009, S. 88, http://www.linux-community.de/artikel/19635/

[2] Pdfinfo: http://linuxcommand.org/man_pages/pdfinfo1.html

[3] Pdftk: http://www.accesspdf.com/pdftk/

[4] Scribus: http://www.scribus.net/

[5] SVG bei Wikipedia: http://de.wikipedia.org/wiki/Scalable_Vector_Graphics

[6] DCMI: http://www.dublincore.org

[7] Dublin Core bei Wikipedia: http://de.wikipedia.org/wiki/Dublin_Core

[8] Krita: http://www.koffice.org/krita/

[9] AI-Format bei Wikipedia: http://de.wikipedia.org/wiki/Adobe_Illustrator

[10] Docbook: http://www.docbook.org

[11] Buch zu Docbook-XML: Lars Trieloff, "Docbook-XML", mitp Verlag, Bonn 2005, ISBN 3-8266-1519-0

[12] Buch zu XML/XSL: Christine Kränzler, "XML/XSL für Buch und Web", Markt+Technik Verlag, München 2002, ISBN 3-8272-6339-5

[13] XSL-FO bei Wikipedia: http://de.wikipedia.org/wiki/Extensible_Stylesheet_Language_%E2%80%93_Formatting_Objects

[14] Xsltproc: http://xmlsoft.org/XSLT/xsltproc2.html

[15] Apache Fop Project: http://xmlgraphics.apache.org/fop/

LinuxCommunity kaufen

Einzelne Ausgabe
 
Abonnements
 
TABLET & SMARTPHONE APPS
Bald erhältlich
Get it on Google Play

Deutschland

Ähnliche Artikel

  • Aus einer Quelle
    Das Markdown-Format bietet die Möglichkeit, ohne verwirrende Tags einen Text zu erstellen, den Sie dann in verschiedenste Ausgabeformate konvertieren.
  • Strichweise
    Daten wiederzufinden, eindeutig zuzuordnen und als vollständig und authentisch zu identifizieren, ist nicht leicht. Hintergrundbilder und Barcodes können dabei helfen.
  • Randständig
    Sie möchten ein PDF drucken, das für ein exotisches Papierformat gedacht oder mit unpassenden Rändern versehen ist? Kein Problem – Pdf90 und Pdfcrop machen es im Nu zur Augenweide.
  • Seiten-Puzzle
    Im zweiten Teil unserer Serie zu Postscript und PDF geht es Werkzeuge zum Zerlegen und Zusammenfügen von Dokumenten.
  • Scheibchenweise
    Der fünfte Teil der Postscript/PDF-Reihe legt den Fokus auf Tipps und Tricks, die den Umgang mit Postscript und PDF im Alltag leichter machen.
Kommentare

Infos zur Publikation

LU 12/2017: Perfekte Videos

Digitale Ausgabe: Preis € 5,95
(inkl. 19% MwSt.)

LinuxUser erscheint monatlich und kostet 5,95 Euro (mit DVD 8,50 Euro). Weitere Infos zum Heft finden Sie auf der Homepage.

Das Jahresabo kostet ab 86,70 Euro. Details dazu finden Sie im Computec-Shop. Im Probeabo erhalten Sie zudem drei Ausgaben zum reduzierten Preis.

Bei Google Play finden Sie digitale Ausgaben für Tablet & Smartphone.

HINWEIS ZU PAYPAL: Die Zahlung ist ohne eigenes Paypal-Konto ganz einfach per Kreditkarte oder Lastschrift möglich!

Stellenmarkt

Aktuelle Fragen

EasyBCD/NeoGrub
Wolfgang Conrad, 17.12.2017 11:40, 0 Antworten
Hallo zusammen, benutze unter Windows 7 den EasyBCD bzw. NEOgrub, um LinuxMint aus einer ISO Dat...
Huawei
Pit Hampelmann, 13.12.2017 11:35, 2 Antworten
Welches Smartphone ist für euch momentan das beste? Sehe ja die Huawei gerade ganz weit vorne. Bi...
Fernstudium Informatik
Joe Cole, 12.12.2017 10:36, 2 Antworten
Hallo! habe früher als ich 13 Jahre angefangen mit HTML und später Java zu programmieren. Weit...
Installation Linux mint auf stick
Reiner Schulz, 10.12.2017 17:34, 3 Antworten
Hallo, ich hab ein ISO-image mit Linux Mint auf einem Stick untergebracht Jetzt kann ich auch...
Canon Maxify 2750 oder ähnlicher Drucker
Hannes Richert, 05.12.2017 20:14, 4 Antworten
Hallo, leider hat Canon mich weiterverwiesen, weil sie Linux nicht supporten.. deshalb hier die...