Dateien schneller packen und konvertieren mit GNU parallel

GNU parallel in Aktion
GNU parallel in Aktion
20.11.2012 16:23

Wer viele Dateien in einem Verzeichnis komprimieren oder konvertieren möchte, kann das auf der Shell mit einer Schleife machen:

for i in *; do gzip $i; done 

Dieses Beispiel komprimiert nacheinander alle Dateien mit gzip. Um die Auflösung (also die Abmessungen) aller Bilder mit der Endung .png um 50 Prozent zu verkleinern, kann man zum Werkzeug mogrify aus dem ImageMagick-Paket greifen (unter Ubuntu 12.10 im Paket imagemagick):

for i in *.png; do mogrify -resize 50% $i; done 

Beide Lösungen haben jedoch die unangenehme Eigenschaft, dass sie jede Datei nacheinander behandeln. Oder mit anderen Worten: Je mehr Dateien im Verzeichnis liegen, desto länger dauert der gesamte Vorgang.

Die Kompression oder Umwandlung könnte man beschleunigen, indem man mehrere Dateien gleichzeitig einpacken beziehungsweise bearbeiten lässt. Damit würde dann auf modernen Prozessoren auch nicht nur ein Rechnenkern beschäftigt, während die anderen Däumchen drehen.

Je mehr Dateien zu verarbeiten sind, desto deutlicher sind die Unterschiede zwischen einer Schleife und der parallelen Verarbeitung.

Genau hier springt das kleine Programm parallel ein, das alle großen Distributionen in ihren Repositories anbieten. Unter Ubuntu 12.10 steckt es beispielsweise im Paket parallel. Das Werkzeug startet einfach einen Befehl mehrfach. Alle Informationen, mit denen man parallel über die Standardeingabe füttert, reicht es an die von ihm gestarteten Befehle weiter. Klingt kompliziert, ist in der Praxis aber ganz einfach. Um alle Dateien im aktuellen Verzeichnis parallel verpacken zu lassen, ruft man einfach folgenden Befehl auf:

ls | parallel gzip

Die gepackten Dateien muss man nicht alle wieder einzeln auspacken. Stattdessen hilft auch hier wieder parallel:

ls | parallel gunzip

In beiden Fällen startet parallel gleich mehrfach gzip beziehungsweise gunzip und setzt die Bande dann auf die von ls herübergereichten Dateinamen an.

Nach dem gleichen Prinzip skaliert der folgende Befehl die Auflösung aller Bilder mit der Endung .png um die Hälfte herunter:

ls *.png | parallel mogrify -resize 50%

Die wesentlichen limitierenden Faktoren sind hier nur noch die Geschwindigkeit der Festplatte und die Anzahl der Prossorkerne.


Kommentare
do not parse ls
norbert (unangemeldet), Donnerstag, 29. November 2012 15:50:49
Ein/Ausklappen

Siehe Überschrift. Den Output von ls zu parsen ist die schlechteste idee ever. Und wenn es nur ein Beispiel war, dann ein schlechtes. So lehrt man User, Bugs zu bauen.
näheres dazu: http://mywiki.wooledge.org/ParsingLs


Bewertung: 163 Punkte bei 33 Stimmen.
Den Beitrag bewerten: Gut / Schlecht
-
Re: do not parse ls
Kai (unangemeldet), Donnerstag, 29. November 2012 22:48:51
Ein/Ausklappen

Nein, nicht pauschal. Es kommt darauf an, was nach dem Pipe mit den Dateinamen passiert.

"ls" wird übrigens auch in der offiziellen parallel-Dokumentation als Beispiel genannt.

Auf Nummer sicher gehen kann man mit den doppelt geschweiften klammern:

ls | parallel befehl {}




Bewertung: 209 Punkte bei 34 Stimmen.
Den Beitrag bewerten: Gut / Schlecht
Achtung - systemlast
Ulf B., Dienstag, 20. November 2012 19:51:21
Ein/Ausklappen

Hallo,

nettes Progrämmchen, man sollte es allerdings mit bedacht einsetzten.

Zum einen bringt es nur etwas bei Hyberthreding und Mehrkern-CPUs und zum anderen kann man damit einen PC (je nach Kernel) quasi lahmlegen. und zwar wenn man mindestens so viele Tasks wie CPU Kerne (auch Hyberthredding) hat. Dieses tritt dann auf, wenn man den Prozess startet und zeitweise wenig z.B. auf dem Desktop tut. Denn nach einiger Zeit ordnet Linux den Prozessen mit hoher Last höhere Resourcen (RAM und CPU zeit zu). Dann sollte man die Priorität der Tasks herunter stufen - damit das nicht so gravierend auftritt.

Gruß
Ulf


Bewertung: 141 Punkte bei 44 Stimmen.
Den Beitrag bewerten: Gut / Schlecht
-
Re: Achtung - systemlast
mandri (unangemeldet), Donnerstag, 22. November 2012 21:07:07
Ein/Ausklappen

Haben die Macher auch bemerkt:
http://www.linux-community....hrichten/GNU-Parallel-20121122


Bewertung: 209 Punkte bei 25 Stimmen.
Den Beitrag bewerten: Gut / Schlecht

Kommentare
do not parse ls
norbert (unangemeldet), Donnerstag, 29. November 2012 15:50:49
Ein/Ausklappen
-
Re: do not parse ls
Kai (unangemeldet), Donnerstag, 29. November 2012 22:48:51
Ein/Ausklappen

Nein, nicht pauschal. Es kommt darauf an, was nach dem Pipe mit den Dateinamen passiert.

"ls" wird übrigens auch in der offiziellen parallel-Dokumentation als Beispiel genannt.

Auf Nummer sicher gehen kann man mit den doppelt geschweiften klammern:

ls | parallel befehl {}




Bewertung: 209 Punkte bei 34 Stimmen.
Den Beitrag bewerten: Gut / Schlecht

Tipp der Woche

Ubuntu 14.10 und VirtualBox
Ubuntu 14.10 und VirtualBox
Tim Schürmann, 08.11.2014 18:45, 4 Kommentare

Wer Ubuntu 14.10 in einer virtuellen Maschine unter VirtualBox startet, der landet unter Umständen in einem Fenster mit Grafikmüll. Zu einem korrekt ...

Aktuelle Fragen

Admin Probleme mit Q4os
Thomas Weiss, 30.03.2015 20:27, 4 Antworten
Hallo Leute, ich habe zwei Fragen zu Q4os. Die Installation auf meinem Dell Latitude D600 verl...
eeepc 1005HA externer sound Ausgang geht nicht
Dieter Drewanz, 18.03.2015 15:00, 0 Antworten
Hallo LC, nach dem Update () funktioniert unter KDE der externe Soundausgang an der Klinkenbuc...
AceCad DigiMemo A 402
Dr. Ulrich Andree, 15.03.2015 17:38, 2 Antworten
Moin zusammen, ich habe mir den elektronischen Notizblock "AceCad DigiMemo A 402" zugelegt und m...
Start-Job behindert Bootvorgang, Suse 13.2, KDE,
Wimpy *, 20.02.2015 10:32, 4 Antworten
Beim Bootvorgang ist ein Timeout von 1 Min 30 Sec. weil eine Partition sdb1 gesucht und nicht gef...
Konfiguration RAID 1 mit 2 SSDs: Performance?
Markus Mertens, 16.02.2015 10:02, 6 Antworten
Hallo! Ich möchte bei einer Workstation (2x Xeon E5-2687Wv3, 256GB RAM) 2 SATA-SSDs (512GB) al...

Jetzt auf den Mailinglisten

[EasyLinux-Ubuntu] [Jessie] geplantes Release-Datum
Heinz-Stefan Neumeyer, 31.03.2015 23:20
Für die, die es interessiert: Kam vorhin über die Mailingliste -- Gruß Stefan Bitte bei Antworten auf...
[EasyLinux-Suse] GRUB error
Thomas Lueck, 31.03.2015 22:59
Christoph, stelle Deine Fragen ruhig weiter hier auf der Liste. Dietmar hat es Dir ganz bestimmt nicht krumm...
Re: [EasyLinux-Ubuntu] [Jessie] DVBcut - Navigation in Aufnahme
Heinz-Stefan Neumeyer, 31.03.2015 20:26
Am Dienstag, den 31.03.2015, 11:53 +0200 schrieb Wolfgang Voelker: Hallo Wolfgang > > Mein letzter...
[EasyLinux-Ubuntu] Scannen und Drucken: automatische Verkleinerung?
Rainer, 31.03.2015 18:59
Hallo zusammen, mir ist immer mal wieder aufgefallen, dass beim Ausdrucken von Dokumenten, die ich als pdf...
Re: [EasyLinux-Ubuntu] Video drehen
Gerhard Blaschke, 31.03.2015 17:19
Am 31.03.2015 um 16:22 schrieb Heiko Ißleib: > Am Dienstag, 31. März 2015, 09:42:17 schrieb Uwe Herrmuth:...