Regexe testen

Bei großen Datenströmen empfiehlt es sich, reguläre Ausdrücke zunächst zu testen, bevor Sie diese auf die gesamten Daten anwenden. Weniger versierten Anwendern erleichtern hier Tools das Leben, die reguläre Ausdrücke visualisieren. Unter Ubuntu finden sich derzeit zwei dieser Werkzeuge in den Repositories: Kodos und Kiki [7].

Während Kodos sich nur auf älteren Distributionen ohne Klimmzüge installieren lässt, gibt sich Kiki (Abbildung 3) anspruchsloser. Es verwendet die durch Python definierten und erzeugten regulären Ausdrücke, die es testweise auf einen zuvor eingegebenen Text anwendet.

Abbildung 3: Kiki (oben) und Regexper (unten) testen reguläre Ausdrücke, bevor sie auf großen Datenmengen zum Einsatz kommen.

Etwas anders funktioniert das Regexp Testing Tool regexper [8]. Das Java-Programm verwendet naturgemäß Java-basierte Regular Expressions und wendet diese auf eine zuvor geladene Testdatei an (Listing 3). Die Versuchsdaten dürfen relativ groß ausfallen, was sich manchmal als Vorteil erweist.

Listing 3

$ java -Xmx1200M -Dfile.encoding=windows-1251 -jar bin/regexper.jar -f Testdatei

Allerdings weisen alle diese Werkzeuge Schwächen beim Verarbeiten von Unicode-Zeichen auf, sodass sie sich bei der Konstruktion von regulären Ausdrücken nur für erste Tests mit einfachen Zeichen eignen.

Fazit

Sofern Sie keinen Bedarf an Unicode-spezifischen Features haben, genügen für das Durchsuchen kleiner Datenströme beziehungsweise Dateien die herkömmlichen Grep-Varianten völlig – nicht zuletzt deswegen, weil es davon ja spezielle Ableger für unterschiedliche Einsatzgebiete gibt, wie beispielsweise Agrep [9]. Ganz anders sieht es beim Durchsuchen von großen Datenströmen nach komplexen Mustern aus: Hier stellt Icgrep sicherlich eine der bemerkenswertesten Neuentwicklungen der letzten Zeit dar und lässt sich obendrein kostenfrei nutzen. 

Glossar

gierige Regexe

Solche Ausdrücke versuchen, die Treffer für Muster so zu erzeugen, dass sie möglichst viel Text einschließen. Bei nichtgierigen regulären Ausdrücken verhält es sich genau andersherum.

Diesen Artikel als PDF kaufen

Express-Kauf als PDF

Umfang: 5 Heftseiten

Preis € 0,99
(inkl. 19% MwSt.)

LinuxCommunity kaufen

Einzelne Ausgabe
 
Abonnements
 
TABLET & SMARTPHONE APPS
Bald erhältlich
Get it on Google Play

Deutschland

Ähnliche Artikel

  • Zu Befehl: Suchen mit grep, egrep, fgrep, (b)zgrep
    Für die Suche nach Wörtern und Ausdrücken in Textdateien bieten sich die Kommandos der grep-Familie an. Als Ergebnis zeigen sie wahlweise die gefundenen Zeilen, die Namen der Dateien, in denen das Suchmuster vorkommt, oder die Anzahl der Treffer an.
  • Reguläre Ausdrücke
    Regulären Ausdrücken begegnet man auf Unix-Systemen an allen Ecken und Enden. Doch was genau hat es damit auf sich, und wie nutzt man sie?
  • Erste Schritte mit Regular Expressions
    Computer erleichtern die Arbeit – man muss ihnen nur genau sagen, was sie tun sollen. Mit regulären Ausdrücken beschleunigen Sie das Suchen und Ersetzen von Zeichenketten auf elegante Art.
  • Schnipseljagd
    Computer erleichtern die Arbeit – sofern man ihnen genau sagt, was sie tun sollen. Mit regulären Ausdrücken beschleunigen Sie das Suchen und Ersetzen von Zeichenketten auf elegante Art.
  • Zu Befehl
    Auch wenn sich viele Dinge bequem über grafische Oberflächen wie KDE oder GNOME regeln lassen – wer sein Linux-System richtig ausreizen möchte, kommt um die Kommandozeile nicht herum. Abgesehen davon gibt es auch sonst viele Situationen, wo es gut ist, sich im Befehlszeilendschungel ein wenig auszukennen.
Kommentare

Infos zur Publikation

LU 12/2017: Perfekte Videos

Digitale Ausgabe: Preis € 5,95
(inkl. 19% MwSt.)

LinuxUser erscheint monatlich und kostet 5,95 Euro (mit DVD 8,50 Euro). Weitere Infos zum Heft finden Sie auf der Homepage.

Das Jahresabo kostet ab 86,70 Euro. Details dazu finden Sie im Computec-Shop. Im Probeabo erhalten Sie zudem drei Ausgaben zum reduzierten Preis.

Bei Google Play finden Sie digitale Ausgaben für Tablet & Smartphone.

HINWEIS ZU PAYPAL: Die Zahlung ist ohne eigenes Paypal-Konto ganz einfach per Kreditkarte oder Lastschrift möglich!

Stellenmarkt

Aktuelle Fragen

Broadcom Adapter 802.11n nachinstallieren
Thomas Mengel, 31.10.2017 20:06, 2 Antworten
Hallo, kann man nachträglich auf einer Liveversion, MX Linux auf einem USB-Stick, nachträglich...
RUN fsck Manually / Stromausfall
Arno Krug, 29.10.2017 12:51, 1 Antworten
Hallo, nach Absturz des Rechners aufgrund fehlendem Stroms startet Linux nicht mehr wie gewohn...
source.list öffnet sich nicht
sebastian reimann, 27.10.2017 09:32, 2 Antworten
hallo Zusammen Ich habe das problem Das ich meine source.list nicht öffnen kann weiß vlt jemman...
Lieber Linux oder Windows- Betriebssystem?
Sina Kaul, 13.10.2017 16:17, 6 Antworten
Hallo, bis jetzt hatte ich immer nur mit
IT-Kurse
Alice Trader, 26.09.2017 11:35, 2 Antworten
Hallo liebe Community, ich brauche Hilfe und bin sehr verzweifelt. Ih bin noch sehr neu in eure...