Newsletter abonnieren

Lies uns auf...

Folge LinuxCommunity auf Twitter

Top-Beiträge

Eingedost
(161 Punkte bei 4 Stimmen)
Aufteiler
(161 Punkte bei 4 Stimmen)

Heftarchiv

LinuxUser Heftarchiv

EasyLinux Heftarchiv

Ubuntu User Heftarchiv

Ubuntu User Heftarchiv

Partner-Links:

Das B2B Portal www.Linx.de informiert über Produkte und Dienstleistungen.

Suche mit less
Suche mit less

Mit Bordmitteln riesige Textdatei durchsuchen

→ Zum Tipp-Archiv...

Wer eine bestimmte Stelle in einer mehrere Gigabyte großen Textdatei auffinden möchte, kommt mit den herkömmlichen Texteditoren nicht besonders weit: Entweder laden diese eine solch große Datei gar nicht erst ein oder aber sie stürzen beim Ladevorgang ab. Die ganze Textflut mit dem Kommandozeilenprogramm more zu durchblättern, dürfte wohl nur etwas für Masochisten sein.

Der Autor selbst musste vor Kurzem ein im Laufe der Jahre gewachsenes E-Mail-Archiv durchsuchen. Gefragt war lediglich das Datum einer ganz bestimmten E-Mail. Um dieses aufzuspüren, kam zunächst grep in den Sinn:

grep "Biene Mayer" inbox

Das spuckt allerdings nur die Zeile mit dem Namen des Absenders aus.

Griffig

Um auch an die Betreff-Zeile und das Datum der entsprechenden E-Mail zu gelangen, mussten auch die Zeilen um die Fundstelle herum ausgegeben werden. Genau dafür kennt grep den Parameter -C:

grep -C 2 "Biene Mayer" inbox

Dieser Befehl liefert auch die zwei Zeilen vor, sowie die zwei Zeilen nach dem Absender – mit anderen Worten also auch die vier Zeilen um die Fundstelle herum.

Bei vielen großen Textdateien dürfte man damit schon ans Ziel gelangen. Hier gab es jedoch im E-Mail-Archiv gleich mehrere E-Mails von Biene Mayer. grep spuckt somit alle Fundstellen aus. Diese sind zwar jeweils durch mehrere Bindestriche getrennt ----, bei der entstehenden Textflut war das aber nicht besonders hilfreich. Nur die erste Fundstelle liefert grep, wenn man noch den Parameter -m 1 anhängt:

grep -m 1 -C 2 "Biene Mayer" inbox

Dummerweise war das jedoch nicht die gesuchte E-Mail. Man könnte jetzt viel Hirnschmalz in das Suchmuster stecken oder zu speziellen grep-Alternativen greifen (beim Durchsuchen von großen E-Mail-Archiven hilft beispielsweise das darauf spezialisierte grepmail [1]).

less durchsucht auch große Dateien.

less durchsucht auch große Dateien.

Weniger ist mehr

Das alles ist jedoch gar nicht nötig, denn auf der Festplatte schlummert bei den meisten Distributionen less. Dieser more-Ersatz durchsucht auch beliebig große Textdateien. Dazu setzt man less schlicht auf die Textdatei an:

less inbox

tippt einen Schrägstrich / (via [Umschalt+7]), gibt an der erscheinenden Kommandozeile das gesuchte Wort ein (im Beispiel Biene Mayer) und drückt die Eingabetaste. Damit landet man automatisch beim ersten Treffer. [N] springt jetzt zum nächsten Treffer, [Umschalt+N] zum vorherigen zurück. Wie gewohnt kann man mit den Pfeiltasten nach oben und unten oder seitenweise mit [Bild auf] und [Bild ab] blättern.

Es gibt natürlich noch weitere Möglichkeiten, eine riesige Textdatei nach einem Begriff zu durchpflügen, grep und less dürften für die meisten schnellen Suchen allerdings schon ausreichen.

Infos

[1] Axel Beckert, Frank Hofmann, „Durchkämmt“ – Suche in Datenformaten (Teil 2), LinuxUser, Ausgabe 7/2012:
http://www.linux-community.de/Internal/Artikel/Print-Artikel/LinuxUser/2012/07/Suche-in-Datenformaten-Teil-2/

Bookmark and Share

Kommentare
useless use of cat
Chris (unangemeldet), Dienstag, 22. Januar 2013 13:43:25
Ein/Ausklappen

cat inbox |

Ist völlig unnötig.
grep "Biene Mayer" inbox



Bewertung: 174 Punkte bei 8 Stimmen.
Den Beitrag bewerten: Gut / Schlecht
-
Re: useless use of cat
Tim Schürmann, Mittwoch, 23. Januar 2013 00:01:24
Ein/Ausklappen

Stimmt, Danke für den Hinweis. Ich lasse es im Text aber jetzt erstmal so stehen.

(Ich habe in der letzten Zeit eindeutig zu viel mit der Pipe arbeiten müssen... :))


Bewertung: 108 Punkte bei 9 Stimmen.
Den Beitrag bewerten: Gut / Schlecht
-
Re: useless use of cat
Jörg Meier (unangemeldet), Donnerstag, 24. Januar 2013 06:08:50
Ein/Ausklappen

> Ich lasse es im Text aber jetzt erstmal so stehen.

Warum? Weil es so schön diletantisch aussieht?



Bewertung: 58 Punkte bei 8 Stimmen.
Den Beitrag bewerten: Gut / Schlecht
-
Re: useless use of cat
Tim Schürmann, Donnerstag, 24. Januar 2013 10:35:01
Ein/Ausklappen

> Warum?

Weil es den Kommentar erklärt. Ich werde es dann aber jetzt ändern.

> Weil es so schön diletantisch aussieht?

Warum diletantisch? Es ist eine weitere (erlaubte) Möglichkeit, "grep" die zu untersuchenden Informationen zuzuführen. Die Textdatei muss "grep" sowieso einmal komplett durchgehen. Von der Geschwindigkeit dürfte das zudem auf modernen Rechnern keinen großen Unterschied machen.


Bewertung: 154 Punkte bei 9 Stimmen.
Den Beitrag bewerten: Gut / Schlecht

Kommentare
useless use of cat
Chris (unangemeldet), Dienstag, 22. Januar 2013 13:43:25
Ein/Ausklappen
-
Re: useless use of cat
Tim Schürmann, Mittwoch, 23. Januar 2013 00:01:24
Ein/Ausklappen
-
Re: useless use of cat
Jörg Meier (unangemeldet), Donnerstag, 24. Januar 2013 06:08:50
Ein/Ausklappen
-
Re: useless use of cat
Tim Schürmann, Donnerstag, 24. Januar 2013 10:35:01
Ein/Ausklappen

> Warum?

Weil es den Kommentar erklärt. Ich werde es dann aber jetzt ändern.

> Weil es so schön diletantisch aussieht?

Warum diletantisch? Es ist eine weitere (erlaubte) Möglichkeit, "grep" die zu untersuchenden Informationen zuzuführen. Die Textdatei muss "grep" sowieso einmal komplett durchgehen. Von der Geschwindigkeit dürfte das zudem auf modernen Rechnern keinen großen Unterschied machen.


Bewertung: 154 Punkte bei 9 Stimmen.
Den Beitrag bewerten: Gut / Schlecht

Tipp der Woche

Bilder vergleichen mit diffimg
Bilder vergleichen mit diffimg
Tim Schürmann, 01.04.2014 12:40, 1 Kommentare

Das kleine Werkzeug diffimg kann zwei (scheinbar) identische Bilder miteinander vergleichen und die Unterschiede optisch hervorheben. Damit lassen sich nicht nur Rätsel a la „Orignial und Fäls...

142 Hits
Wertung: 154 Punkte (9 Stimmen)

Aktuelle Fragen

programm suche
Hans-Joachim Köpke, 13.04.2014 10:43, 8 Antworten
suche noch programme die zu windows gibt, die auch unter linux laufen bzw sich ähneln sozusagen a...
Funknetz (Web-Stick)
Hans-Joachim Köpke, 04.04.2014 07:31, 2 Antworten
Bei Windows7 brauche ich den Stick nur ins USB-Fach schieben dann erkennt Windows7 Automatisch, a...
Ubuntu 13.10 überschreibt immer Windows 8 Bootmanager
Thomas Weiss, 15.03.2014 19:20, 8 Antworten
Hallo Leute, ich hoffe das ich richtig bin. Ich habe einen Dell Insipron 660 Ich möchte gerne Ub...
USB-PTP-Class Kamera wird nicht erkannt (Windows-only)
Wimpy *, 14.03.2014 13:04, 15 Antworten
ich habe meiner Frau eine Digitalkamera, AGFA Optima 103, gekauft und wir sind sehr zufrieden dam...
Treiber
Michael Kristahn, 12.03.2014 08:28, 5 Antworten
Habe mir ein Scanner gebraucht gekauft von Canon CanoScan LiDE 70 kein Treiber wie bekomme ich de...

Jetzt auf den Mailinglisten

Re: [EasyLinux-Ubuntu] Video-Datei komprimieren
Rainer, 16.04.2014 12:29
Hallo Heiko, Am Wed, 16 Apr 2014 12:16:53 +0200 schrieb Heiko Ißleib : > >> > >> >...
Re: [EasyLinux-Ubuntu] Video-Datei komprimieren
Heiko Ißleib, 16.04.2014 12:16
Am 16.04.2014, 10:23 Uhr, schrieb Rainer : Hallo. > > Am Wed, 16 Apr 2014 09:34:54 +0200 > sch...
Re: [EasyLinux-Ubuntu] [erledigt - OT] Thunderbird: Umschalten auf plain-Text-Darstellung
"J.Bilder", 16.04.2014 12:10
Hi Rainer, Am 16.04.2014 12:06, schrieb Rainer Schmitz: > Hey > Am 16.04.2014 11:18, schrieb J.Bild...
Re: [EasyLinux-Ubuntu] [OT] Thunderbird: Umschalte auf plain-Text-Darstellung
Rainer Schmitz, 16.04.2014 12:06
Hey Am 16.04.2014 11:18, schrieb J.Bilder: > Hallo Liste, > > bei Thunderbird kann man empfan...
[EasyLinux-Ubuntu] [OT] Thunderbird: Umschalte auf plain-Text-Darstellung
"J.Bilder", 16.04.2014 11:18
Hallo Liste, bei Thunderbird kann man empfangene HTML-Mails Mails als plain text darstellen lassen. Ich h...