Aus LinuxUser 11/2002

sed

Ersetz Dich!

Der Stream-Editor sed hilft beim automatischen Verändern einer oder mehrerer Dateien, vereinfacht sich wiederholende Änderungen oder erstellt gleich ganze Konvertierungsprogramme. Monotone Aufgaben der Textverarbeitung lassen sich so im Handumdrehen lösen.

Zu Befehl

Auch wenn sich viele Dinge bequem über grafische Oberflächen wie KDE oder GNOME regeln lassen – wer sein Linux-System richtig ausreizen möchte, kommt um die Kommandozeile nicht herum. Abgesehen davon gibt es auch sonst viele Situationen, in denen es gut ist, sich im Befehlszeilendschungel ein wenig auszukennen.

Der Stream-Oriented Editor ist kein interaktiver Editor, sondern eine Art Textfilter, der bestimmte Zeichen oder Zeichenkombinationen sucht und ersetzt. Stream-oriented oder „zeichenstromorientiert“ bedeutet, dass von stdinDaten entgegengenommen und nach der Bearbeitung wieder auf stdoutausgegeben werden.

Auf der Kommandozeile gibt es grundsätzlich zwei Möglichkeiten, den sed aufzurufen:

  • sed [-n] [-e] 'befehl' datei(en) – ein 'befehl' wird auf der Kommandozeile angegeben und auf datei(en) angewendet
  • sed [-n] -f script datei(en) – eine externe Skript-Datei mit sed-Befehlen wird aufgerufen und auf datei(en) angewendet

Gibt es keine datei(en) in dem Aufruf, liest sed von der Standardeingabe. Jede gelesene Zeile wird mit den sed-Kommandos bearbeitet und in eine Art Puffer geschrieben, dessen Inhalt zum Schluss auf der Standardausgabe angezeigt wird.

Regulär ausgedrückt

Um sed effektiv einzusetzen, ist es sinnvoll, sich ein paar reguläre Ausdrücke („regular expressions“, siehe auch man 7 regex) anzuschauen. Diese Suchmuster haben normalerweise zwei Komponenten: die Angabe, nach welchem Zeichen gesucht wird, und die Angabe, wie oft die gesuchten Zeichen auftreten dürfen. Was sich kompliziert anhört, kann man sich in einer Tabelle ganz einfach vor Augen führen (siehe Tabelle 1):

Tabelle 1: Suchmuster – „regular expressions“

Muster Bedeutung
abc genau diese Zeichenkette: „abc“
[abc] eines dieser Zeichen: a, b oder c
[^abc] keines der Zeichen darf auftauchen
[a-c] eines der Zeichen von a bis c
. ein beliebiges Zeichen
? das Muster vor dem ? darf einmal oder gar nicht auftreten
* das Muster darf beliebig oft oder gar nicht auftreten
+ das Muster darf beliebig oft, muss aber mindestens einmal auftreten
{n} das Muster muss genau n-mal auftreten
{,n} das Muster darf höchstens n-mal auftreten
{n,} das Muster muss mindestens n-mal auftreten
{n,m} das Muster muss mindestens n-mal und höchstens m-mal auftreten

Gesucht, gefunden

In einem sed-Skript wird zunächst nach einem übereinstimmenden Muster gesucht und danach die Anweisung ausgeführt. Eine Ausgabe wird erzeugt und der Prozess für jede Zeile des Skriptes wiederholt. sed wechselt danach zur nächsten Zeile der Eingabe-Datei und fängt von vorne an.

Am besten machen Sie sich die Arbeitsweise von sed an einem kleinen Beispiel klar. Nehmen wir an, Sie haben eine HTML-Datei, in der häufig eine bestimmte URL vorkommt, die durch eine andere ersetzt werden soll. In einer Testdatei url.html sollen alle Links der Form

<a href="http://www.huhnix.net/">http://www.huhnix.net/</a>

ersetzt werden durch

<a href="http://www.huhnix.org/">http://www.huhnix.org/</a>

Der erste Ansatz ist die Verwendung des folgenden Befehls:

huhn@asteroid:~$ sed 's/huhnix.net/huhnix.org/' url.html

Zwischen den Schrägstrichen findet die Ersetzung statt – nach dem ersten / steht das, was ersetzt werden soll, nach dem zweiten das, was stattdessen erscheinen soll, und der dritte Schrägstrich markiert das Ende der Ersetzung. Falls die Schrägstriche im Suchmuster vorkommen, können auch andere alphanumerische Zeichen als Begrenzer eingesetzt werden. Hier lässt sich z. B. auf # oder | ausweichen:

huhn@asteroid:~$ sed 's#http://www.huhnix.net#http://www.huhnix.org#' url.html

Es empfiehlt sich, die sed-Befehle mit ' ' zu maskieren und so vor einem Zugriff durch die Shell zu schützen, die eventuell einige Zeichen als eigene Metazeichen erkennen würde. Bei dem eben gezeigten Aufruf wird das Ergebnis zunächst nach stdout geschrieben, und Sie haben die Möglichkeit, den Output zu kontrollieren. Bei einer längeren Datei leiten Sie die Ausgabe am besten mit dem Pipe-Zeichen | in einen Pager Ihrer Wahl um, also z. B.:

huhn@asteroid:~$ sed 's/huhnix.net/huhnix.org/' url.html | less

Soll der Output stattdessen in eine Datei umgeleitet werden, verwenden Sie das Größer-Zeichen > zusammen mit dem Namen der Datei, in die geschrieben werden soll, also sed 's/huhnix.net/huhnix.org/' url.html > neue_url.html.

LinuxUser 11/2002 KAUFEN
EINZELNE AUSGABE Print-Ausgaben Digitale Ausgaben
ABONNEMENTS Print-Abos Digitales Abo
TABLET & SMARTPHONE APPS
Deutschland

Hinterlasse einen Kommentar

  E-Mail Benachrichtigung  
Benachrichtige mich zu: