Home / LinuxUser / 2001 / 02 / Teil 3: String-Verarbeitung und Reguläre Ausdrücke

Newsletter abonnieren

Lies uns auf...

Folge LinuxCommunity auf Twitter

Top-Beiträge

Mandriva gibt Distribution in die Hände der Community
(268 Punkte bei 24 Stimmen)
Neues vom Systemd
(161 Punkte bei 4 Stimmen)
Mandriva in Nöten
(161 Punkte bei 4 Stimmen)

Heftarchiv

LinuxUser Heftarchiv

EasyLinux Heftarchiv

Ubuntu User Heftarchiv

Ubuntu User Heftarchiv

Partner-Links:

Shopping
Topsuche
 
Yatego Deutschlands größte Shoppingmall. 10000 Shops,
3.5 Mio Artikel. Alle Bestseller, Servertechnik und Technik Themenwelten.

Notebooks und Netzwerkhardware bei Mercateo günstig kaufen.
Internet Telefonie mit VoIP Telefonen von Gigaset
Das B2B Portal www.Linx.de informiert über Produkte und Dienstleistungen.
Günstige Digitalkameras finden Sie im Preisvergleich.

Wortfetzen

Teil 3: String-Verarbeitung und Reguläre Ausdrücke

Pfadangabe aufbauen

Nun wollen wir den Verzeichnisnamen nicht mit Leerzeichen, sondern wie üblich mit Schrägstrichen getrennt haben. Dazu nutzen wir aus, dass "$*" alle Parameter – in unserem Fall $1 bis $3 – hintereinander stehend liefert, durch das erste Zeichen aus IFS getrennt. Wir setzen IFS wieder einmal auf den Schrägstrich und gewinnen mit der Zeile 8 den lesbaren Verzeichnisnamen zurück. Bei der Umformung ist uns allerdings der erste Slash abhanden gekommen, weshalb wir ihn voranstellen müssen. Ganz wichtig ist noch Zeile 9, auch wenn es auf den ersten Blick nicht so aussieht: Stünde in Zeile 10 in IFS der Slash, so würde echo unseren ebenfalls durch Schrägstriche getrennten Pfad wiederum als einzelne Parameter übergeben bekommen – und echo gibt Parameter stets mit Leerzeichen getrennt aus.

Muster-Erkennung

Das letzte Beispiel diente uns nicht nur als Vertiefung, sondern soll auch zeigen, wie man sich durch die Verwendung der richtigen Befehle das Leben deutlich leichter machen kann. Folgendes Listing tut im Ergebnis genau das gleiche wie das vorhergehende:

#!/bin/bash
 Verzeichnis="${1%/*}"
 Datei="${1##*/}"
 echo Verzeichnis: $Verzeichnis
 echo Datei: $Datei

Dabei bekommen wir es mit zwei neuen Befehlen zu tun, ${variable%muster} und ${variable##muster}. Beide arbeiten mit einer Muster-Erkennung (pattern matching). Das Muster in Zeile 2 ist "/*" und steht für eine Zeichenkette, die mit einem Schrägstrich beginnt und anschließend beliebig viele Zeichen dahinter hat. Beliebig viele bedeutet hier: Keins bis unendlich viele. Die Bash hat für die Muster-Erkennung zusätzliche Steuerzeichen, so genannte wildcards – die wichtigsten sind Fragezeichen und Stern. Das Fragezeichen steht für ein beliebiges Zeichen, während der Stern beliebig viele Zeichen abdeckt.

Der Befehl selbst durchsucht die Variable von hinten nach vorn und prüft, wann das Muster erstmalig passt – wann also von hinten gesehen das erste mal ein Slash auftaucht und entweder nichts oder irgend etwas dahinter steht. Dann löscht er das gerade gefundene Muster, der Slash und die eventuell dahinter stehenden Zeichen werden entfernt.

Dies benutzen wir, um das Verzeichnis zu gewinnen. Wir wissen, dass der Programmname unmittelbar hinter dem letzten Schrägstrich steht, und müssen ihn entfernen, um das Verzeichnis zu bekommen. Der letzte Schrägstrich selbst wird – wie im vorangegangenen Beispiel auch – ebenfalls entfernt.

Um den Dateinamen zu erhalten, müssen wir genau umgekehrt vorgehen: Wir entfernen alles bis zum letzten Schrägstrich. Das Muster haben wir dafür herumgedreht, wir suchen beliebig viele Zeichen, hinter denen dann ein Slash steht. Der Befehl ${variable##muster} sucht von vorn beginnend nach dem ersten Passen des Musters. Die doppelte Raute bewirkt, dass er sich nicht mit dem ersten Treffer zufrieden gibt, sondern versucht, so viel wie möglich auf einmal zu entfernen. Im Beispiel von Pfad=/usr/X11R6/bin/X würde sich ${Pfad#*/} schon mit "/" begnügen (der Stern steht hier für kein Zeichen, gefolgt vom Slash), während ${Pfad##*/} gierig "/usr/X11R6/bin/" entfernt (der Stern steht für "/usr/X11R6/bin", gefolgt vom Slash).

Den Mustervergleich von hinten und vorn mit anschließendem Entfernen gibt es jeweils in einer genügsamen (${variable%muster} und ${variable#muster}) und in einer gierigen (${variable%%muster} und ${variable##muster}) Variante.

Doch zurück zu unserem Programm. In der zweiten Zeile gewinnen wir das Verzeichnis, in dem wir von hinten suchend das Muster "/*" entfernen lassen. In unserem Fall wird also "/X" gelöscht, übrig bleibt "/usr/X11R6/bin". In Zeile drei verwenden wir die gierige Methode und lassen von vorn suchend das Muster "*/" löschen – "/usr/X11R6/bin/" wird damit herausgenommen, übrig bleibt "X" als Dateiname.

Einem Freund empfehlen    Druckansicht Bookmark and Share
Kommentare
Grober Unfug
besserwisser (unangemeldet), Sonntag, 04. März 2012 22:01:22
Ein/Ausklappen

Leider kann bash genau das nicht.
Shells verwenden normal sog. Wildcards (wie in der Kommandozeile)
und keine richtigen Regulärausdrücke.
zb. ist "*" innerhalb eines solchen Konstrukts mit ".*" gleichzusetzen
weshalb die Verfielfachung "x*" (wobei x beliebig ist) ganau nicht mehr funktioniert (auch ".*" da ja "." immer als Zeichen betrachtet wird, im echten RE wäre das nur mit Maskierung "\." möglich).

Grund: Diese Funktionen sind gedacht um Pfade und Dateinamen zu behandeln und verarbeiten nur Präfix und Suffix, daher auch die Anwendung mit Vorwärts- und Rückwärtssuche (# und %) bzw. mit der eigenschaft gierig und genügsam (##,%% und #,%).
Siehe bash manpage unter "Parameter Expansion", das sagt eigentlich schon alles.

Wer es nicht glaubt, bzw zur Übersicht:
http://www.lrz.de/services/schulung/unterlagen/regul/#meta


Bewertung: Noch keine Bewertung abgegeben!
Den Beitrag bewerten: Gut / Schlecht

Hits
Wertung: 69 Punkte (1 Stimme)

Schlecht Gut

Infos zum Autor

Mirko Dölle

Redakteur für Linux bei c't, Heise Zeitschriften Verlag; ehemals Competence Center Hardware/Linux-Magazin, Linux New Media AG


Infos zur Publikation

Infos zur Publikation

LinuxUser 06/2012

Aktuelle Ausgabe kaufen:

Heft bestellen Heft als PDF kaufen

LinuxUser erscheint monatlich und kostet in der Nomedia-Ausgabe EUR 5,50 und mit DVD EUR 8,50. Weitere Informationen zum Heft finden Sie auf der LinuxUser-Homepage.

Im LinuxUser-Probeabo erhalten Sie drei Ausgaben für 3 Euro. Das Jahresabo (ab EUR 56,10) können Sie im LNM-Shop bestellen.

Tipp der Woche

Adobe AIR
Adobe-AIR-Programme installieren und (manuell) starten
Tim Schürmann, 14.05.2012 13:09, 0 Kommentare

Es gibt sie noch: neue Anwendungen, die Adobes Integrated Runtime voraussetzen. Aktuellstes und vermutlich auch größtes Beispiel ist das Adventure Botanicula

Aktuelle Fragen

gibt es ein Kommandozeilen Tool, um ein X11-Fenster in ein Anderes einzubetten?
GoaSkin , 21.05.2012 16:44, 0 Antworten
Das XEmbed-Protokoll ist u.A. dazu gedacht, dass man eine X11-Anwendung in eine andere wie ein Wi...
Apache2, Options -Indexes geht nicht
no no, 12.05.2012 19:01, 8 Antworten
Habe in apache2.conf folgendes stehen: Options -Indexes ...
LInux auf Dell LS H500
Andreas Endresl, 09.05.2012 08:54, 2 Antworten
Habe einen alten Dell Latitude LS H500 nur mit ext. Floppy und CD es geht nur immer eines von den...
Datenwiederherstellung unter Ubuntu 12.04 mit "Simple Backup" nach Umzug von Linux Mint
Christian Lottmann, 07.05.2012 13:33, 0 Antworten
Vor dem Umzug auf Ubuntu 12.04 habe ich unter Linux MInt mit "Simple Backup" voll (15.4.2012) und...
DKMS für den propritären NVIDIA-Treiber
Commander Data, 26.04.2012 22:02, 2 Antworten
Hallo an die Gemeinde. Ich habe hier ein interessantes Stück openSuSE gefunden. http://forums.op...