Home / LinuxUser / 2010 / 02 / Innere Werte

Newsletter abonnieren

Lies uns auf...

Folge LinuxCommunity auf Twitter

Top-Beiträge

Mandriva gibt Distribution in die Hände der Community
(268 Punkte bei 24 Stimmen)
Neues vom Systemd
(179 Punkte bei 5 Stimmen)
Mandriva in Nöten
(161 Punkte bei 4 Stimmen)
Mageia 2 ist fertig
(161 Punkte bei 4 Stimmen)

Heftarchiv

LinuxUser Heftarchiv

EasyLinux Heftarchiv

Ubuntu User Heftarchiv

Ubuntu User Heftarchiv

Partner-Links:

Shopping
Topsuche
 
Yatego Deutschlands größte Shoppingmall. 10000 Shops,
3.5 Mio Artikel. Alle Bestseller, Servertechnik und Technik Themenwelten.

Notebooks und Netzwerkhardware bei Mercateo günstig kaufen.
Internet Telefonie mit VoIP Telefonen von Gigaset
Das B2B Portal www.Linx.de informiert über Produkte und Dienstleistungen.
Günstige Digitalkameras finden Sie im Preisvergleich.

Innere Werte

Werkzeuge für PDF und Postscript (Teil 7)

PDF-Metadaten aktualisieren

Adobe hat das PDF-Format so konzipiert, dass während der Existenz des Dokuments die Datenintegrität gewahrt bleibt. Der Betrachter soll keinen Zweifel daran hegen müssen, dass ihn das empfangene Dokument unverändert erreicht hat. Ähnliches gilt für den Autor – er will meist sicher sein, dass der Empfänger das Dokument nicht nachträglich modifizieren kann.

Dass PDF diese Ansprüche bedient, mag dazu beigetragen haben, dass das Format sich als Quasi-Standard zum Datenaustausch etablieren konnte – etwa auch bei Belegen und Rechnungen. Obwohl Postscript ebenso "sicher" ist, kommt es für derartige Belange weitaus seltener zu Einsatz. Zumindest die Metadaten eines PDF-Dokuments lassen sich aber relativ einfach modifizieren. Das geschieht in drei Schritten: dem Auslesen der bisherigen Metadaten, dem folgenden Verändern der Daten und dem abschließenden Aktualisieren des PDFs.

Das Auslesen der PDF-Datei und das Speichern der Metadaten erledigen Sie mithilfe von pdftk. Der folgende Aufruf liest aus dem File RN2.pdf die Metadaten ein und speichert sie in der Datei daten:

pdftk RN2.pdf dump_data > daten

Öffnen Sie nun das File daten, erhalten Sie auf diesem Weg eine ganze Reihe von Informationen über das PDF-Dokument (Abbildung 10). Die Metadaten lagern jeweils in aufeinanderfolgenden Zeile in Schlüssel-Wert-Paaren. Zeilen, die mit InfoKey beginnen, enthalten einen Schlüssel, die Zeilen mit InfoValue den zugehörigen Wert.

Abbildung 10: Mittels Pdftk aus einem PDF-Dokument ausgelesene Meta-Informationen.

Um nun etwa den Autorennamen zu ändern, suchen Sie im der Datei die Zeile InfoKey: Author und ändern in der darauffolgenden Zeile den Autorennamen wie gewünscht. Dann speichern Sie das File als neue_daten ab. Abschließend aktualisieren Sie das PDF mit den geänderten Metadaten:

pdftk RN2.pdf update_info neue_daten output RN3.pdf

Der Befehl schreibt die Änderungen in ein neues PDF-Dokument namens RN3.pdf. In Abbildung 11 sehen Sie, dass sich dort Unbekannt Erdritter als Autor des Dokumentes hinzugemogelt hat.

Abbildung 11: Dieses PDF haben wir um den zusätzlichen Autor "Unbekannt Erdritter" ergänzt.

Wer genau hinschaut, bemerkt zudem eine Auffälligkeit: Das Erzeugungsdatum ist nicht mehr korrekt gesetzt. Ob das an einem Bug in Pdftk liegt oder andere Ursachen hat, ließ sich bis Redaktionsschluss nicht mehr abschließend klären. Wie auch immer: Noch ist das Schummeln leider nicht perfekt. 

Glossar

RGB

Red, Green, Blue. Additives Farbmodell, das Farben durch das additive Mischen der drei Grundfarben Rot, Grün und Blau nachbildet.

CMYK

Cyan, Magenta, Yellow, Key. Subtraktives Farbmodell, das als technische Grundlage für den modernen Vierfarbdruck dient. "Key" bezieht sich auf den Schwarz-Anteil: Im Englischen heißt die schwarz druckende Offset-Platte "key plate", weil an ihr die farbig druckenden Platten ausgerichtet werden.

RTF

Rich Text Format. Von Microsoft 1987 eingeführtes Dateiformat, das auf reinen Textdateien basiert. Wird in der Windows-Welt oft zum Datenaustausch eingesetzt.

Infos

[1] PS/PDF-Tricks: Frank Hofmann, "Scheibchenweise", LinuxUser 12/2009, S. 88, http://www.linux-community.de/artikel/19635/

[2] Pdfinfo: http://linuxcommand.org/man_pages/pdfinfo1.html

[3] Pdftk: http://www.accesspdf.com/pdftk/

[4] Scribus: http://www.scribus.net/

[5] SVG bei Wikipedia: http://de.wikipedia.org/wiki/Scalable_Vector_Graphics

[6] DCMI: http://www.dublincore.org

[7] Dublin Core bei Wikipedia: http://de.wikipedia.org/wiki/Dublin_Core

[8] Krita: http://www.koffice.org/krita/

[9] AI-Format bei Wikipedia: http://de.wikipedia.org/wiki/Adobe_Illustrator

[10] Docbook: http://www.docbook.org

[11] Buch zu Docbook-XML: Lars Trieloff, "Docbook-XML", mitp Verlag, Bonn 2005, ISBN 3-8266-1519-0

[12] Buch zu XML/XSL: Christine Kränzler, "XML/XSL für Buch und Web", Markt+Technik Verlag, München 2002, ISBN 3-8272-6339-5

[13] XSL-FO bei Wikipedia: http://de.wikipedia.org/wiki/Extensible_Stylesheet_Language_%E2%80%93_Formatting_Objects

[14] Xsltproc: http://xmlsoft.org/XSLT/xsltproc2.html

[15] Apache Fop Project: http://xmlgraphics.apache.org/fop/

Einem Freund empfehlen    Druckansicht Bookmark and Share
Kommentare

Hits
Wertung: 0 Punkte (0 Stimmen)

Schlecht Gut

Infos zur Publikation

Infos zur Publikation

LinuxUser 06/2012

Aktuelle Ausgabe kaufen:

Heft bestellen Heft als PDF kaufen

LinuxUser erscheint monatlich und kostet in der Nomedia-Ausgabe EUR 5,50 und mit DVD EUR 8,50. Weitere Informationen zum Heft finden Sie auf der LinuxUser-Homepage.

Im LinuxUser-Probeabo erhalten Sie drei Ausgaben für 3 Euro. Das Jahresabo (ab EUR 56,10) können Sie im LNM-Shop bestellen.

Tipp der Woche

Adobe AIR
Adobe-AIR-Programme installieren und (manuell) starten
Tim Schürmann, 14.05.2012 13:09, 0 Kommentare

Es gibt sie noch: neue Anwendungen, die Adobes Integrated Runtime voraussetzen. Aktuellstes und vermutlich auch größtes Beispiel ist das Adventure Botanicula

Aktuelle Fragen

gibt es ein Kommandozeilen Tool, um ein X11-Fenster in ein Anderes einzubetten?
GoaSkin , 21.05.2012 16:44, 0 Antworten
Das XEmbed-Protokoll ist u.A. dazu gedacht, dass man eine X11-Anwendung in eine andere wie ein Wi...
Apache2, Options -Indexes geht nicht
no no, 12.05.2012 19:01, 8 Antworten
Habe in apache2.conf folgendes stehen: Options -Indexes ...
LInux auf Dell LS H500
Andreas Endresl, 09.05.2012 08:54, 2 Antworten
Habe einen alten Dell Latitude LS H500 nur mit ext. Floppy und CD es geht nur immer eines von den...
Datenwiederherstellung unter Ubuntu 12.04 mit "Simple Backup" nach Umzug von Linux Mint
Christian Lottmann, 07.05.2012 13:33, 0 Antworten
Vor dem Umzug auf Ubuntu 12.04 habe ich unter Linux MInt mit "Simple Backup" voll (15.4.2012) und...
DKMS für den propritären NVIDIA-Treiber
Commander Data, 26.04.2012 22:02, 2 Antworten
Hallo an die Gemeinde. Ich habe hier ein interessantes Stück openSuSE gefunden. http://forums.op...