Daten für die Ewigkeit?

Bilder richtig taggen

Angeregt durch die Frage eines Lesers beschäftigen wir uns diesmal mit Metadaten von Bildern (siehe Kasten Metadaten). Das Problem besteht nicht nur theoretisch: Auch für Ubuntu-Anwender lautet die schlichte Frage: Mit welchem Bildbetrachter soll ich meine Fotos verwalten, damit auch die in die Bilder eingebauten Informationen die nächsten 20 Jahre überstehen?

Metadaten

Versteckt in den Daten von Bildern finden Sie meist auch ergänzende Informationen zu diesen – die Metadaten. Sie geben beispielsweise an, wo Sie ein Bild aufgenommen haben und mit welcher Blende. Sie enthalten aber auch Informationen, die Sie selbst eingeben – etwa den Titel.

Leider fehlt bisher ein einheitliches Metadaten-System für digitale Bilder, einige Bildtypen bringen gar eigene Varianten mit. So nutzen Bilder im PNG-Format neben XMP ein eigenes Metadaten-System [1], bei dem so genannte Chunks zum Einsatz kommen ("iTXt, tEXt, and zTXt chunks"). RAW-Fotos greifen für ihre Metadaten wahlweise zu den Standards XMP, Exif und IPTC (DNG von Adobe) oder Exif, Makernote (CR2 von Canon) und viele mehr. Fast jeder Kamerahersteller bringt ein eigenes RAW-Format mit. Die Formate sind dabei unterschiedlich gut darin, Metadaten aufzunehmen. Im Artikel konzentrieren wir uns jedoch im wesentlichen auf den Umgang mit JPG- und TIFF-Dateien, die XMP, Exif und IPTC verstehen.

Ein Wendepunkt in der Metadaten-Diskussion war sicherlich der 24. September 2008. Auf der Photokina in Köln kündigte die Metadata Working Group eine erste Richtlinie zur Kompatibilität von Metadaten an. Die wurde notwendig, weil verschiedene Metaformate für digitale Bilder nebeneinander existierten und bis heute existieren. Eine der Folgen: Die verschiedenen Bildbetrachter interpretieren die Metadaten jeweils anders und zerstören sie zum Teil.

Weil die Lage ernst ist, hat das International Press Telecommunications Council (IPTC) – ein in London angesiedelter Zusammenschluss von Nachrichtenagenturen – im Mai diesen Jahres ein Manifest zum Thema verfasst. Die Organisation beschreibt darin in fünf Punkten, wie sie sich den optimalen und richtigen Umgang mit Bild-Metadaten vorstellt [2].

Von IIM zu XMP

Aber zurück zu den Anfängen. Da existierte nur IIM, das Information Interchange Model. Dieses wurde vom eben erwähnten IPTC 1991 entwickelt. Es brachte bestimmte Tags mit, die es erlaubten, im damals noch sehr teuren Bereich der professionellen Digitalfotografie auch Informationen zu den Fotos (Titel, Aufnahmeort usw.) zu übermitteln.

Doch dann schaffte Adobe 1994 Fakten: Der bedeutendste Softwareanbieter im Bereich der digitalen Bildverarbeitung schnappte sich die Definitionen der IPTC-Metadaten (ohne aber die Struktur zu übernehmen) und bezeichnete sein Metadatenmodell als IPTC-Header. Dank Photoshop und Co. verbreitete sich diese Form der Metadaten und wurde zum Standard. Die Informationen zu den Fotos steckten in den Bildern selbst und erschienen nur, wenn der Bildbetrachter sie aus den Fotos lesen und interpretieren konnte. Dieses Modell überwiegt bis heute.

2001 schwenkte Adobe dann zum XML-basierten XMP-Standard (Extensible Metdata Platform) um, der sich – anders als IPTC – vom Anwender beliebig erweitern ließ. Im Gegensatz zur Dublin Core Metadata Initiative [3] bettete Adobe die XMP-Daten auch hier direkt in die Bilder ein und schrieb sie nicht in eine separate XML-Datei. Mit XMP-Daten ließen und lassen sich Bilder im PNG- und GIF-Format, aber auch HTML- und WAV-Dateien versehen.

Das IPTC reagierte auf XMP und entwarf ein XML-Schema mit dem Namen IPTC Core Schema, das die IPTC-Metadaten und XMP miteinander verband, also einen kleinsten gemeinsamen Nenner zwischen den Formaten schaffte.

Weitere Metadaten kamen allerdings von einer ganz anderen Seite – den Hardware-Herstellern. Insbesondere die japanischen Kamerahersteller beeinflussten die Entstehung von Exif. Im Exchangeable Image File Format schreiben Kameras automatisch Metadaten in die Header der von ihnen produzierten Fotos. Das bietet sich an, weil die Kameras ihre Bilder meist ohnehin gleich in das JPG-Format konvertieren. Zu den gesammelten Informationen gehören unter anderem das Datum, die Uhrzeit, die Blende und die Auflösung des Fotos, aber auch der geografische Standort.

Es kam in der Folge zu einem ziemlichen Chaos: Verbreitete Bildbetrachter interpretierten die Metadaten ganz unterschiedlich, weshalb diese falsch ausgelesen, überschrieben oder schlicht ignoriert wurden. Das ändert sich nun langsam.

Metadata Working Group (MWG)

Die erwähnte Metadata Working Group wurde wohl auch aus diesem Grund ins Leben gerufen: Um Ordnung ins Chaos der verschiedenen Standards zu bringen. Zu dem Konsortium, das Microsoft 2006 ins Leben rief, gehören unter anderem Apple, Adobe, Canon, Nokia und Sony. Es versuchte nicht, einen weiteren Standard zu erfinden, sondern gab Richtlinien vor, die regeln, was passiert, wenn eine Software in einem Foto auf mehrere Metadaten-Systeme trifft. Abbildung 1 zeigt recht schön, was beim Lesen geschieht: Sind zugleich Exif- und XMP-Daten vorhanden, bevorzugt die Software zum Beispiel die Exif-Daten.

Abbildung 1

Abbildung 1: Ein Wikipedia-Nutzer hat skizziert, wie die Richtlinien der MWG sich auf den Umgang mit Metadaten auswirken (Losch/Wikipedia).

Wer unterstützt was?

Natürlich kann es gut sein, dass sich die Metadaten in den nächsten 20 Jahren noch einmal deutlich ändern. Wenn Sie aber aktuell daran denken, Ihre Fotos zu taggen, sollten Sie entweder zu Picasa [4], Digikam [5] oder den Exiftools [6] greifen. Alle drei unterstützen bereits die von der Metadata Working Group entworfene Spezifikation. Während Picasa aber eine proprietäre Bildverwaltung von Google ist, die sich nach Aussage eines Mitarbeiters an den MWG-Richtlinien orientiert [7], steht mit dem KDE-Programm Digikam eine freie Software mit einem brillanten Funktionsumfang bereit, die nach Aussage des Projekts den MWG-Richtlinien folgt [9]. Nicht zuletzt lassen sich mit den Exiftools gezielt Metadaten beeinflussen – allerdings über die Kommandozeile. Die Software bringt eine MWG-Option mit, die Sie gezielt als Modul aktivieren und dann über einen Schalter anwenden [8].

Wie aber sieht es mit den gängigen Ubuntu-Programmen aus: Gimp und Shotwell. Letzteres Programm ist Ubuntus offizieller Bildbetrachter und noch nicht soweit. Die Entwickler kennen jedoch die MWG-Richtlinien und denken darüber nach, sie zu implementieren [10]. Immerhin kann Shotwell ab Version 0.8 Tags in den Formaten Exif, XMP und IPTC in die Fotos schreiben.

Anders sieht es in Gimp aus: Zwar arbeitet aktuell ein Entwickler an den Metadaten, aber dabei geht es offenbar zunächst darum, die Metadaten auszulesen und darzustellen [10]. Es dauert vermutlich noch etwas, bis die Software zu den anderen aufschließt – allerdings sind Metadaten auch nicht das Kerngeschäft von Gimp.

Quo vadis?

Niemand weiß, wie die Welt in 20 Jahren aussieht. Wenn Sie aber jetzt sofort eine Fotosammlung inklusive Tags aufbauen wollen, würden wir empfehlen, das JPG- oder TIFF-Format zu verwenden und zu Digikam oder Picasa zu greifen. Alternativ stehen noch die Exiftools bereit, wenn es Ihnen nur um das reine Taggen der Fotos geht. Wer RAW-Fotos bevorzugt, sollte wohl Adobes DNG-Format nutzen, mit dem auch Ufraw und RawTherapee umgehen können.

Glossar

XML

eine Beschreibungssprache im Textformat, die den Austausch von Daten zwischen gänzlich verschiedenen Programmen über Tags und Schemata ermöglicht.

Tip a friend    Druckansicht beenden Bookmark and Share
Kommentare