Saubere Sache
out of the box
Diashow
Wer ein längeres HTML-Dokument geschrieben hat und dieses gerne zwecks Präsentation in Form von einzelnen Folien mit dem Beamer an die Wand werfen will, sollte die Option -slides ausprobieren. Aus einer einzelnen Datei erzeugt tidy durchnumerierte Dateien slideN.html, wobei jeweils das <H2>-Tag (also eine Überschrift der Ebene 2) als Folientrenner fungiert. Auf jeder Folie befinden sich Links zur vorigen, ersten und nächten Folie.
Finetuning
Falls Sie bestimmte Kommandozeilenoptionen von tidy immer wieder benötigen, aber müde sind, diese ständig einzutippen, bieten sich Einträge in eine Konfigurationsdatei an. Ob Sie eine systemweite Konfiguration oder eine an Ihren Benutzer-Account gebundene benutzen wollen, bleibt Ihnen überlassen. Um tidy mitzuteilen, wo sich die Konfigurationsdatei befindet, setzen Sie die Environment-Variable HTML_TIDY auf den entsprechenden Dateinamen, etwa /etc/htmltidy.conf. Dazu fügen Sie Ihrer .bashrc die Zeile export HTML_TIDY=/etc/htmltidy.conf hinzu.
In der Konfigurationsdatei tragen Sie nun ihre Standardoptionen ein. Listing 5 zeigt ein Beispiel. Eine umfangreiche Übersicht der Optionen finden Sie in der Datei Overview.html im tidy-Quellarchiv.
Listing 5
Beispiel für htmltidy.conf
wrap: 72 indent: auto char-encoding: latin1 uppercase-tags: yes
Mit wrap: 72 werden im HTML-Dokument Zeilen nach 72 Zeichen umgebrochen, indent: auto sorgt für automatisches Einrücken mit Ausnahme von Tabellen, char-encoding: latin1 wählt die Zeichensatzkodierung und uppercase-tags: yes bewirkt das gleiche wie die Option -upper. Zu weiteren Funktionen und Möglichkeiten von tidy kann ich die Homepage des Programms sehr empfehlen.
Glossar
HTML
"HyperText Markup Language", die ursprünglich am CERN entwickelte Auszeichnungssprache für Seiten des World Wide Web. Durch sogenannte Tags wird die Auszeichnung bestimmter Textteile als Überschriften, Listen, Tabellen und ähnliches erreicht.
WYSIWYG
"What You See Is What You Get", ein besonders im Office-Bereich gern eingesetztes Konzept, um Eingaben sofort in der formatierten Darstellung zu sehen. Da bei HTML das genaue Aussehen von Überschriften und anderen Seitenelementen nicht festgelegt ist, lässt es sich kaum mit dem WYSIWYG-Konzept vereinbaren.
HTML-Entitäten
Eine Ersatzschreibweise für Zeichen außerhalb des 7-Bit-ASCII-Zeichensatzes oder Zeichen, die in HTML eine Sonderbedeutung haben. Die Entität für den Umlaut ü ist ü, die für das Copyright-Zeichen © oder die für das Kleiner-als-Zeichen <.
ISO-Latin-1
Ein Standard für die Kodierung von länderspezifischen und Sonderzeichen als Erweiterung des ASCII-Zeichensatzes. Letzterer schreibt nur die Kodierungen von 0 bis 127 fest und lässt so z. B. Umlaute außen vor.
Environment-Variable
(auch: Umgebungsvariablen) Mit diesen Variablen werden bestimmte Systemeinstellungen automatisch an Prozesse weitergegeben, zum Beispiel der Suchpfad für Programme PATH, die Lokalisierungseinstellungen LC_LANG und LC_CTYPE oder eben der Name einer Konfigurationsdatei.



