Zu Befehl
Auch wenn sich viele Dinge bequem über grafische Oberflächen wie KDE oder GNOME regeln lassen – wer sein Linux-System richtig ausreizen möchte, kommt um die Kommandozeile nicht herum. Abgesehen davon gibt es auch sonst viele Situationen, in denen es gut ist, sich im Befehlszeilendschungel ein wenig auszukennen.
Der Stream-Oriented Editor ist kein interaktiver Editor, sondern eine Art Textfilter, der bestimmte Zeichen oder Zeichenkombinationen sucht und ersetzt. Stream-oriented oder "zeichenstromorientiert" bedeutet, dass von stdinDaten entgegengenommen und nach der Bearbeitung wieder auf stdoutausgegeben werden.
Auf der Kommandozeile gibt es grundsätzlich zwei Möglichkeiten, den sed aufzurufen:
sed [-n] [-e] 'befehl' datei(en)– ein'befehl'wird auf der Kommandozeile angegeben und aufdatei(en)angewendetsed [-n] -f script datei(en)– eine externe Skript-Datei mitsed-Befehlen wird aufgerufen und aufdatei(en)angewendet
Gibt es keine datei(en) in dem Aufruf, liest sed von der Standardeingabe. Jede gelesene Zeile wird mit den sed-Kommandos bearbeitet und in eine Art Puffer geschrieben, dessen Inhalt zum Schluss auf der Standardausgabe angezeigt wird.
Regulär ausgedrückt
Um sed effektiv einzusetzen, ist es sinnvoll, sich ein paar reguläre Ausdrücke ("regular expressions", siehe auch man 7 regex) anzuschauen. Diese Suchmuster haben normalerweise zwei Komponenten: die Angabe, nach welchem Zeichen gesucht wird, und die Angabe, wie oft die gesuchten Zeichen auftreten dürfen. Was sich kompliziert anhört, kann man sich in einer Tabelle ganz einfach vor Augen führen (siehe Tabelle 1):
Tabelle 1: Suchmuster – "regular expressions"
| Muster | Bedeutung |
|---|---|
abc
|
genau diese Zeichenkette: "abc" |
[abc]
|
eines dieser Zeichen: a, b oder c |
[^abc]
|
keines der Zeichen darf auftauchen |
[a-c]
|
eines der Zeichen von a bis c |
.
|
ein beliebiges Zeichen |
?
|
das Muster vor dem ? darf einmal oder gar nicht auftreten |
*
|
das Muster darf beliebig oft oder gar nicht auftreten |
+
|
das Muster darf beliebig oft, muss aber mindestens einmal auftreten |
{n}
|
das Muster muss genau n-mal auftreten
|
{,n}
|
das Muster darf höchstens n-mal auftreten
|
{n,}
|
das Muster muss mindestens n-mal auftreten
|
{n,m}
|
das Muster muss mindestens n-mal und höchstens m-mal auftreten
|
Gesucht, gefunden
In einem sed-Skript wird zunächst nach einem übereinstimmenden Muster gesucht und danach die Anweisung ausgeführt. Eine Ausgabe wird erzeugt und der Prozess für jede Zeile des Skriptes wiederholt. sed wechselt danach zur nächsten Zeile der Eingabe-Datei und fängt von vorne an.
Am besten machen Sie sich die Arbeitsweise von sed an einem kleinen Beispiel klar. Nehmen wir an, Sie haben eine HTML-Datei, in der häufig eine bestimmte URL vorkommt, die durch eine andere ersetzt werden soll. In einer Testdatei url.html sollen alle Links der Form
<a href="http://www.huhnix.net/">http://www.huhnix.net/</a>
ersetzt werden durch
<a href="http://www.huhnix.org/">http://www.huhnix.org/</a>
Der erste Ansatz ist die Verwendung des folgenden Befehls:
huhn@asteroid:~$ sed 's/huhnix.net/huhnix.org/' url.html
Zwischen den Schrägstrichen findet die Ersetzung statt – nach dem ersten / steht das, was ersetzt werden soll, nach dem zweiten das, was stattdessen erscheinen soll, und der dritte Schrägstrich markiert das Ende der Ersetzung. Falls die Schrägstriche im Suchmuster vorkommen, können auch andere alphanumerische Zeichen als Begrenzer eingesetzt werden. Hier lässt sich z. B. auf # oder | ausweichen:
huhn@asteroid:~$ sed 's#http://www.huhnix.net#http://www.huhnix.org#' url.html
Es empfiehlt sich, die sed-Befehle mit ' ' zu maskieren und so vor einem Zugriff durch die Shell zu schützen, die eventuell einige Zeichen als eigene Metazeichen erkennen würde. Bei dem eben gezeigten Aufruf wird das Ergebnis zunächst nach stdout geschrieben, und Sie haben die Möglichkeit, den Output zu kontrollieren. Bei einer längeren Datei leiten Sie die Ausgabe am besten mit dem Pipe-Zeichen | in einen Pager Ihrer Wahl um, also z. B.:
huhn@asteroid:~$ sed 's/huhnix.net/huhnix.org/' url.html | less
Soll der Output stattdessen in eine Datei umgeleitet werden, verwenden Sie das Größer-Zeichen > zusammen mit dem Namen der Datei, in die geschrieben werden soll, also sed 's/huhnix.net/huhnix.org/' url.html > neue_url.html.
Beim Output auf der Kommandozeile sehen Sie, dass sed immer nur das erste Vorkommen des Suchmusters pro Zeile ersetzt:
… <a href="http://www.huhnix.org/">http://www.huhnix.net/</a>
Sollen alle Vorkommen des Suchmusters in der entsprechenden Zeile ersetzt werden, teilen Sie sed das durch ein angehängtes g (für "global") mit:
huhn@asteroid:~$ sed 's/huhnix.net/huhnix.org/g' url.html … <a href="http://www.huhnix.org/">http://www.huhnix.org/</a>



