Programmierhappen für Zwischendurch
Praktisch und nützlich: AWK
Ausblick
Wenn Sie AWK erst aus diesem Artikel kennengelernt haben, liegt der Eindruck nahe, diese Sprache könne nicht mehr als Texte zu finden und auszudrucken. Ein Trugschluss! Die Wahrheit lautet: Der Einfachheit – und Kürze – halber hat der Autor viele Konstrukte und Funktionen unterschlagen oder nur am Rande erwähnt.
Immerhin zeigt Kasten 1 einen kurzen Überblick über die Befehlssprache. Eine komplette Referenz enthält die – sehr gut gemachte – Manpage zu gawk(1), der GNU-Version von AWK, die auf den allermeisten Linux-Systemen installiert sein sollte. Als Standardlektüre in Buchform bietet sich immer noch das passende Werk der AWK-Autoren selbst [2] an.
Für die weitere Beschäftigung gilt wie so oft unter Unix: Probieren geht über Studieren. AWK eignet sich für fast alle Situationen, in denen es um einfache Operationen mit reinen Textdateien geht; von der Logfile-Auswertung über Finanzbuchhaltung bis hin zur wissenschaftlichen Statistik.
Glossar
reguläre Ausdrücke
Liebevoll Regexps genannt, erlauben diese Muster eine flexible Suche nach Textteilen, die nicht immer gleich sind. Neben normalen Zeichen kann man auch nach besonderen Bestandteilen fahnden, z. B. Platzhalter benutzen oder den Suchstring in Abhängigkeit von bereits gefundenen Textstücken modifizieren. Nähere Informationen gibt [3].
tsv
"Tabulator separated values" nennt man eine Datei, bei der mehrere Spalten durch Tabulatorzeichen voneinander getrennt sind. Das Äquivalent mit Kommas zwischen den Spalten heißt CSV, "comma separated values".
grep
Eines der meistgenutzten Unix-Progrämmchen; es durchsucht Dateien nach regulären Ausdrücken.
Whitespace
Bezeichnung für eine Folge von Leerzeichen, Tabstopps oder Zeilenenden, die mindestens ein Zeichen lang sein muss, aber beliebig lang sein darf. Auf manchen Systemen (einschließlich AWK) zählt zusätzlich der vertikale Tabstopp zum Whitespace. Klar: "White space" ist alles, was "weißen Platz" auf dem Papier erzeugt.
LaTeX
In Verbindung mit TeX ein Textsatz-, nicht aber DTP-System [4]. Als typografische Feinheit fügt LaTeX nach einem Punkt normalerweise einen etwas größeren Zwischenraum ein, um das Satzende für die Lesenden leichter erfassbar zu machen.
Infos
[1] Die Beispiele aus diesem Artikel: http://www.seligma.com/linux-user/awk/
[2] Alfred V. Aho, Brian W. Kernighan, Peter J. Weinberger: "The AWK Programming Language", Addison Wesley, 1988, ISBN 0-201-07981-X, ca. 54,00 USD.
[3] Marc André Selig: "Nadel im Heuhaufen", LinuxUser 08/2002, S. 74 ff.
[4] Heike Jurzik: "Gutenberg am Rechner", LinuxUser 09/2002, S. 43 ff.



