Das PDF-Format

Aus LinuxUser 02/2001

Das PDF-Format

Portierbar

Die meisten Computer-Besitzer stolpern früher oder später über PDF-Dokumente. Handbücher zu Software findet man heutzutage oft nur noch in diesem Format auf den zugehörigen CD-ROMs vor. In diesem Artikel zeigen wir, was PDF ist, welche Programme es rund um das “Portable Document Format” unter Linux gibt, und was auch Sie selbst alles damit anfangen können.

PDF ist die Abkürzung für Portable Document Format, ein Dateiformat, das 1992 von der amerikanischen Firma Adobe entwickelt wurde. Zwei Jahre später entschloss man sich, das Format (d. h. den Bauplan einer PDF-Datei) offenzulegen und jedermann frei zugänglich zu machen. Allerdings ist PDF kein Standard – Adobe bestimmt weiterhin selbst, wie das Format aussieht und welche Erweiterungen in Zukunft aufgenommen werden.

Die Idee hinter PDF war und ist auch noch heute, das Problem des Datenaustauschs zu beheben. Hat man z. B. eine Datei unter StarOffice erstellt und möchte diese an eine weitere oder im Falle eines Handbuchs sogar an viele andere Personen weitergeben, ist es sehr wahrscheinlich, dass mindestens eine der verwendeten Schriftarten bei wenigstens einem der Benutzer nicht installiert ist. Dies hat unweigerlich zur Folge, dass diese Schriftart durch StarOffice ersetzt wird und das Dokument nicht mehr so angezeigt wird, wie dies vom Autor vorgesehen war. Selbst wenn das Dokument vom Original nur geringfügig abweicht, kann dies im professionellen Einsatz bereits zu einer kleinen Katastrophe führen. Ein weit größeres Problem – gerade wenn ein Dokument möglichst viele Menschen erreichen soll – ist, dass nicht jeder StarOffice installiert hat, bzw. es aus Platzgründen nicht installieren möchte. Gleiches gilt natürlich für andere Dateiformate wie die von Microsoft Word oder WordPerfect.

Das von Adobe ins Leben gerufene PDF-Format soll nun all diese Probleme beheben. Dabei stellen die relativ kleinen Betrachtungsprogramme für das PDF-Format sicher, dass das Dokument auf jedem Computer exakt gleich aussieht. Sie erlauben dem Benutzer das Betrachten, Durchsuchen und auch den Ausdruck des entsprechenden PDF-Dokumentes.

Zur Einführung des PDF-Formates war Adobe mit der Idee des Datenaustausches allerdings nicht ganz alleine: das Konkurrenzformat nannte sich Envoy und stammte von der Firma Novell. Dieses Format hatte gegenüber PDF den Vorteil, dass ein Betrachtungsprogramm für Windows gleich mit in die entsprechende Datei integriert werden konnte. Einige Zeit lang wurde das Erzeugungsprogramm für Envoy-Dateien sogar der WordPerfect Suite 7 beigelegt. Wegen des integrierten Windows-Viewers ist es aus Sicht der Linux-Gemeinde sicher zu begrüßen, dass PDF sich letztendlich durchgesetzt und Envoy vollständig verdrängt hat.

PDF wurde – auch und gerade durch das Internet – zu einem Standard für die Publikation von elektronischen Dokumenten aller Art. Eine wesentliche Rolle bei der raschen Verbreitung dieses Formates spielte das von Adobe kostenlos verteilte Anzeigeprogramm, der Acrobat Reader. Da er für fast alle Betriebssysteme erhältlich ist, ist in dieser Unabhängigkeit von einem speziellen Computer-System sicherlich der primäre Grund für den Erfolg von PDF zu sehen. Dabei ist das Format qualitativ sehr hochwertig, so dass es ab Version 1.2 im professionellen Druckbereich langsam aber sicher PostScript Konkurrenz macht. Ein weiterer Vorteil, den einige Dokumenten-Hersteller schätzen, ist der Manipulationsschutz: Ohne größeren Aufwand lassen sich PDF-Dateien nicht verändern.

Im Laufe der Zeit wurden durch Adobe immer wieder kleinere Verbesserungen, die gerade auch auf den Einsatz in professionellen Bereichen abzielen, durchgeführt, so dass mittlerweile auch Verknüpfungen (ähnlich den Hyperlinks in Internet-Seiten), das Erstellen eines Index und sogar das Einbinden von Video- und Klangsequenzen möglich sind. (Ein Index wird aus einer Gruppe von PDF-Dateien erstellt und in der Praxis oft für Inhaltsverzeichnisse genutzt.) Die neueste Version bietet neben vom Betrachter ausfüllbaren Formularfeldern auch Möglichkeiten zur Einbindung digitaler Unterschriften.

Das PDF-Dateiformat, das auf der ebenfalls weit verbreiteten Seitenbeschreibungssprache PostScript basiert, kodiert ein Ausgangsdokument so, dass es auf allen Computern und unter beliebigen Betriebssystemen immer wie das Originaldokument aussieht. Dazu werden die verwendeten Schriftarten und sämtliche Grafiken und Bilder mit in die PDF-Datei integriert. Dies hat den Vorteil, dass nur eine einzige Datei weitergegeben werden muss. Zusätzlich werden die in einer PDF-Datei enthaltenen Daten komprimiert, wodurch die Datei in der Regel kleiner als das Ausgangsdokument wird. Diese Eigenschaft prädestiniert PDF geradezu für den Einsatz im Internet. Aber Vorsicht: hat man ein Umwandlungsprogramm, das hohe Komprimierungsstufen zulässt, so muss man beachten, dass in diesem Fall auch die Qualität des gesamten Dokuments leidet und es dann evtl. nicht mehr in der Druckvorstufe einsetzbar ist.

Ein weiterer Vorteil gegenüber PostScript ist, dass Defekte in einer PDF-Datei besser abgefangen werden. Ist nur eine Seite zerstört, stehen die Chancen unter PDF besser, den Rest des Dokumentes noch zu retten.

Um aus einem vorliegenden Dokument eine PDF-Datei zu erzeugen, benötigt man ein entsprechendes Umwandlungsprogramm; außerdem empfiehlt sich für die Kontrolle ein Betrachtungsprogramm, das die so generierten PDF-Dokumente auf dem Bildschirm anzeigen kann. Unter Linux heißt der Dreh- und Angelpunkt Ghostscript in Verbindung mit Ghostview. Diese beiden Programme sind kostenlos im Internet erhältlich und sollten (wie übrigens alle im Folgenden beschriebenen Programme) jeder Distribution beiliegen. Manchmal werden insbesondere die kleineren Werkzeuge etwas versteckt oder in verschiedene Kategorien verteilt.

Ansichten

Der Klassiker unter den PDF-Betrachtungsprogrammen ist sicherlich der Acrobat Reader, der allerdings unter Linux leider nur in Englisch erhältlich ist. Acrobat Reader liegt zur Zeit in der Version 4 vor und bietet neben der wohl komfortabelsten Bedienoberfläche auch Suchfunktionen und die Möglichkeit, die gerade betrachtete PDF-Datei zu drucken. Texte und Grafiken lassen sich kopieren, sofern der Dokument-Hersteller diese Funktionen nicht bei der Erzeugung im Dokument gesperrt hat. Des weiteren bietet Acrobat Reader die Möglichkeit, eigene Lesezeichen (die sog. Bookmarks) zu definieren: Dazu muss die Liste mit den Lesezeichen am linken Bildschirmrand eingeblendet werden (Windows/Show Bookmarks). Unterhalb dieser Liste, am unteren Bildschirmrand, befinden sich zwei Schaltflächen. Mit der linken können Sie ein neues Lesezeichen anlegen. Ab sofort können Sie mit einem Klick auf dieses Lesezeichen die entsprechende Stelle im Dokument direkt anspringen.

Abbildung 1: Acrobat Reader ist für fast alle Betriebssysteme erhältlich

Abbildung 1: Acrobat Reader ist für fast alle Betriebssysteme erhältlich

Die Alternative zum Acrobat Reader ist das schon erwähnte Ghostscript mit den darauf basierenden Programmen. Bei GhostScript handelt es sich um einen kostenlosen Interpreter für die Seitenbeschreibungssprachen PostScript und PDF. Mithilfe dieses Programms ist es möglich, PostScript-Dateien auch ohne einen speziellen PostScript-fähigen Drucker auszudrucken oder auf dem Bildschirm zu betrachten. So wird GhostScript unter Linux häufig eingesetzt, wenn ein Drucker nicht von sich aus PostScript beherrscht. Darüber hinaus verfügt GhostScript über ein paar interessante Zusatzfunktionen, die im Folgenden genutzt werden sollen. GhostScript selbst wird über Textkommandos gesteuert; da dies recht umständlich ist, gibt es ein paar grafische Frontends wie GhostView, gv oder KGhostView, von denen mindestens eines Ihrer Distribution beiliegen dürfte. Diese Programme sind in ihrer Bedienung ziemlich ähnlich – sie unterscheiden sich im wesentlichen nur durch die Anordnung der Schaltflächen. Alle drei Programme beschränken sich im Funktionsumfang auf die Navigation und den Ausdruck von PostScript- und PDF-Dateien.

xpdf

Eine recht unbekannte Alternative zum Anzeigen von PDF-Dateien bietet das Programm xpdf. Diese kleine Anwendung wirkt von ihrem Erscheinungsbild wie eine Mischung aus Acrobat Reader und GhostView. Auch dieses Programm beschränkt sich auf die reinen Anzeige- und Druck-Funktionen. Die wesentlichen Dateifunktionen erreichen Sie übrigens, indem Sie auf der Zeichenfläche die rechte Maustaste betätigen.

Abbildung 2: xpdf ist schon ein Klassiker

Abbildung 2: xpdf ist schon ein Klassiker

Selbst ist der Mann

Nachdem die Programme zur Anzeige von bereits vorliegenden PDF-Dateien betrachtet wurden, sollen nun die Werkzeuge vorgestellt werden, mit denen man PDF-Dokumente erzeugen kann. Ein Wermutstropfen gleich vorweg: das von Adobe hergestellte Programm “Distiller”, das üblicherweise zum Erzeugen von PDF-Dateien eingesetzt wird, ist nur für Windows und MacOS erhältlich. Somit ist es unter Linux (noch) nicht möglich, die neuen Funktionen wie Formulare oder digitale Unterschriften zu nutzen. Dies betrifft insbesondere alle interaktiven Elemente. So bleibt der Linux-Anwender auf das Erzeugen simpler Dokumente ohne Zusatzfunktionen beschränkt. Adobe vertreibt zwar eine Server-Version des Distillers für Linux, die aber dank eines Preises von ca. 15.000,– DM nur für Unternehmen mit größeren Netzwerken in Frage kommt.

Für den Privatanwender eröffnen sich dennoch mehrere Möglichkeiten, unter Linux PDF-Dateien erzeugen. So kann man das jeder Distribution beiliegende Konvertierungsprogramm ps2pdf einsetzen, oder man greift auf das kommerzielle WordPerfect Office 2000 zurück, das direkt und dabei wesentlich komfortabler als ps2pdf arbeitet. Des weiteren gibt es noch eine Reihe von kleineren Tools, mit denen man PDF-Dateien erzeugen kann. Leider werden fast all diese Programme, mit Ausnahme von WordPerfect Office 2000, über Konsolenbefehle (in der Shell) gesteuert. Aber keine Angst: Die Bedienung ist dennoch nicht schwer.

ps2pdf

Dieses zu GhostScript gehörende Hilfsprogramm erzeugt aus einer PostScript-Datei eine PDF-Datei. Diese liegt anschließend im etwas älteren PDF-Format 1.2 vor (aktuell ist PDF Version 1.3). Bevor das Tool zum Einsatz kommt, müssen Sie eine PostScript-Datei (meistens mit der Endung .ps) erzeugen. In der Regel geht dies, indem man dem entsprechenden Programm, z. B. StarOffice, im Drucken-Dialog sagt, es soll das Dokument in eine Datei drucken. Falls Sie bunte PDF-Dateien erstellen wollen, sollten Sie beachten, dass zum einen der benutzte Druckertreiber Farbdruck beherrschen muss und zum anderen im Anwendungsprogramm die Ausgabe von Farbe aktiviert ist. Wurde die Datei korrekt erzeugt, öffnen Sie ein Terminal-Fenster und wechseln in das Verzeichnis, in dem sich die eben erzeugte Ausgangsdatei befindet. Geben Sie anschließend den Befehl

ps2pdf PS-Datei PDF-Datei

ein und betätigen Sie die Eingabetaste. Ersetzen Sie dabei PS-Datei durch den Dateinamen der PostScript-Datei, die in das PDF-Format umgewandelt werden soll, und PDF-Datei durch den Dateinamen für die zu erzeugende PDF-Datei. ps2pdf wandelt nun mit Hilfe von GhostScript die PS-Datei in eine PDF-Datei um.

Leider weist diese Möglichkeit der PDF-Erzeugung einige Limitierungen auf. So können keinerlei interaktive Elemente, die PDF bietet, erzeugt werden. Des weiteren werden Schriftarten, die GhostScript nicht kennt (dies sind genau die von Adobe vorgegebenen Schriftarten, die auch mit dem Acrobat Reader installiert werden) automatisch in Grafiken umgewandelt. Dies wirkt sich negativ auf die Anzeige-Qualität bei Vergrößerungen aus. Außerdem kann es in seltenen Fällen noch Probleme mit einigen Versionen vom Acrobat Reader und der korrekten Darstellung der PDF-Datei geben.

WordPerfect Office 2000

Auch Corels kommerzielles Office-Paket erezugt noch das alte PDF-Format in der Version 1.2. Allerdings ist das Erstellen von PDF-Dateien mit einem Programm aus WordPerfect Office 2000 wesentlich komfortabler als über ps2pdf: Öffnen Sie zunächst das Dokument, das in eine PDF-Datei umgewandelt werden soll. Wählen Sie aus dem Menü Datei/Als PDF freigeben. Nun sollte sich ein Fenster öffnen, das zwei Registerkarten beherbergt. Die erste Registerkarte erinnert etwas an den Drucken-Dialog. Hier können Sie festlegen, wie die zu erzeugende Datei heißen soll und welche Abschnitte bzw. Seiten von Ihrem Dokument in der PDF-Datei landen sollen. Das zweite Register ist wesentlich interessanter: Auf ihm können Sie z. B. Angaben zum Kompressionsgrad der im Dokument enthaltenen Bilder machen. Beachten Sie in diesem Zusammenhang, dass mit steigender Kompressionsrate die Qualität der Bilder sinkt. Weiterhin sollten Sie unbedingt sicherstellen, dass die Option Schriften in Dokument einfügen aktiviert ist: Nur so kann wirklich gewährleistet werden, dass Ihr Dokument später auf jedem Computer gleich aussieht. Ein abschließender Klick auf OK erzeugt dann das Dokument.

Leider gibt es auch bei diesem Weg einige Probleme. So unterstützt auch WordPerfect keine interaktiven Elemente, und in einigen Fällen werden Grafiken nicht ordnungsgemäß in den Text eingefügt.

In diesem Zusammenhang noch eine Anmerkung: Auch CorelDraw 9 kann PDF-Dateien erzeugen und bietet bei der Ausgabe sogar noch mehr Einstellungsmöglichkeiten als WordPerfect Office 2000. Nach Corels Finanzproblemen sieht es aber zur Zeit leider danach aus, dass es kein CorelDraw für Linux mehr in Deutsch geben wird. Wer das Programm einsetzen möchte, wird vermutlich auf einen US-Import des Software-Pakets zurückgreifen müssen.

Der letzte Rest vom Schützenfest

Über die beiden oben genannten Alternativen hinaus gibt es noch weitere, kleinere Werkzeuge, wovon hier insbesondere pstoedit nicht unerwähnt bleiben soll. Das fast schon universelle Werkzeug, zu beziehen unter [2], erlaubt es, verschiedene Grafik- und Textformate ineinander umzuwandeln. Darunter findet sich auch die Möglichkeit, PostScript- in PDF-Dateien umzuwandeln. Dabei greift das Programm wie ps2pdf auf GhostScript zurück. Auch die Bedienung ist ziemlich ähnlich: Als Befehl geben Sie diesmal in einem Terminalfenster

pstoedit -f pdf PS-Datei PDF-Datei

ein. Der Parameter “-f pdf” sagt dem Tool, dass das Ausgabeformat PDF sein soll. Übrigens: In unserem Test sah dasselbe mit pstoedit erzeugte PDF-Dokument besser als das durch ps2pdf generierte aus.

Darüber hinaus gibt es im Internet noch weitere, meist Shareware-Programme, die PDF-Dateien erzeugen können: Eine gute Anlaufstelle für eine Suche bietet Linuxberg [3].

Und zurück

Haben Sie ein Dokument nur als PDF-Datei vorliegen, so können Sie es nicht bearbeiten. Sie haben aber die Möglichkeit, diese Datei in ein anderes Format zurückzuwandeln.

Die erste Variante führt mit GhostScript wieder von PDF zurück zu PostScript. Dazu verwenden Sie das Programm pdf2ps, das genauso funktioniert wie ps2pdf. Ein etwas unscheinbares Programm ist pdftohtml, zu finden unter [1]; es sollte in vielen Distributionen (wie z. B. SuSE Linux) bereits enthalten sein. Wie der Name schon andeutet, ist dieses Programm in der Lage, PDF-Dateien in HTML-Seiten umzuwandeln. Sie sollten vor einem Einsatz sicherstellen, dass das Programm pnmtopng installiert ist. Dieses wird von pdftohtml benötigt, um die in den PDF-Dateien enthaltenen Bilder in ein für die Internet-Browser darstellbares Format (png) zu konvertieren. Um pdftohtml zu verwenden, öffnen Sie ein Terminal-Fenster und wechseln in das Verzeichnis, in dem die zu konvertierende Datei liegt. pdftohtml legt beim Umwandeln der PDF-Datei ein Verzeichnis an, das dem Namen der PDF-Datei ohne die Endung “pdf” entspricht. Sie sollten deshalb vor dem Programmstart prüfen, ob nicht eine Datei existiert, die denselben Namen wie das spätere Verzeichnis trägt. In diesem Verzeichnis legt pdftohtml dann alle erzeugten HTML-Seiten ab. Um den Konvertierungsvorgang zu starten, geben Sie in das Terminalfenster den Befehl

pdftohtml PDF-Ausgangsdatei

ein, wobei Sie PDF-Ausgangsdatei durch den Namen der Datei ersetzen, die in HTML konvertiert werden soll. Sobald der Vorgang beendet ist, öffnen Sie in dem neu erzeugten Verzeichnis mit einem Browser einfach die Datei index.html.

Ein wahrer Tausendsasser, was die Konvertierung betrifft, ist das schon weiter oben angesprochene pstoedit. Mit ihm lassen sich PDF-Dateien in die Formate Tgif, fig (für xfig), gnuplot, Flattened PostScript, DXF – (AutoCAD), LWO (LightWave 3D), RIB (RenderMan), RPL (Real3D), Idraw, AI (Adobe Illustrator) und einige mehr umwandeln. Anschließend lässt sich die entsprechende Datei mit der zugehörigen Applikation verändern. Das Programm wird in einem Terminalfenster durch die Eingabe des Kommandos

pstoedit -f Format PDF-Datei Zieldatei

gestartet. Format ersetzen Sie dabei durch ein Kürzel, welches dem Format entspricht, in das die PDF-Datei umgewandelt werden soll. Welches Kürzel welchem Format entspricht, können Sie der beiliegenden Dokumentation entnehmen; über “pstoedit -help” erhalten Sie einen Hilfetext, in dem u. a. alle unterstützten Dateiformate mit ihren Kürzeln aufgeführt sind.

Falls Sie xpdf installiert haben, können Sie die mitgelieferten Tools pdftopbm, pdftops und pdftotext einsetzen: Diese Kommandozeilen-Tools wandeln ein PDF-Dokument in mehrere pbm-Bilder, wieder zurück in eine PostScript-Datei oder in eine normale Textdatei um. Beachten Sie, dass bei der letzten der drei Methoden Grafiken und Formatierungen nicht übernommen werden können. Die einzelnen Programme werden auf die schon bekannte Weise aufgerufen:

pdftotext PDF-Datei Ziel-Datei

Damit sind wir schon am Ende unserer Reise durch die Welt der PDF-Dokumente. Bei der Vielzahl der Programme sollten auch Sie ein passendes Tool für Ihre Zwecke finden.

Abbildung 3: Freshmeat <link href="#article_i4" class="info" srcset=

[4] findet zum Stichwort pdf 71 Hilfsprogramme” width=”254″ height=”300″ /> Abbildung 3: Freshmeat [4] findet zum Stichwort pdf 71 Hilfsprogramme

LinuxUser 02/2001 KAUFEN
EINZELNE AUSGABE
ABONNEMENTS
TABLET & SMARTPHONE APPS
E-Mail Benachrichtigung
Benachrichtige mich zu:

Hinweis: Dieser Artikel ist älter als ein Jahr, enthaltene Informationen sind möglicherweise veraltet.

0 Kommentare
Älteste
Neuste Beste Bewertung
Inline Feedbacks
Alle Kommentare anzeigen
Nach oben