Dateien schneller packen und konvertieren mit GNU parallel

GNU parallel in Aktion
GNU parallel in Aktion
20.11.2012 16:23

Wer viele Dateien in einem Verzeichnis komprimieren oder konvertieren möchte, kann das auf der Shell mit einer Schleife machen:

for i in *; do gzip $i; done 

Dieses Beispiel komprimiert nacheinander alle Dateien mit gzip. Um die Auflösung (also die Abmessungen) aller Bilder mit der Endung .png um 50 Prozent zu verkleinern, kann man zum Werkzeug mogrify aus dem ImageMagick-Paket greifen (unter Ubuntu 12.10 im Paket imagemagick):

for i in *.png; do mogrify -resize 50% $i; done 

Beide Lösungen haben jedoch die unangenehme Eigenschaft, dass sie jede Datei nacheinander behandeln. Oder mit anderen Worten: Je mehr Dateien im Verzeichnis liegen, desto länger dauert der gesamte Vorgang.

Die Kompression oder Umwandlung könnte man beschleunigen, indem man mehrere Dateien gleichzeitig einpacken beziehungsweise bearbeiten lässt. Damit würde dann auf modernen Prozessoren auch nicht nur ein Rechnenkern beschäftigt, während die anderen Däumchen drehen.

Je mehr Dateien zu verarbeiten sind, desto deutlicher sind die Unterschiede zwischen einer Schleife und der parallelen Verarbeitung.

Genau hier springt das kleine Programm parallel ein, das alle großen Distributionen in ihren Repositories anbieten. Unter Ubuntu 12.10 steckt es beispielsweise im Paket parallel. Das Werkzeug startet einfach einen Befehl mehrfach. Alle Informationen, mit denen man parallel über die Standardeingabe füttert, reicht es an die von ihm gestarteten Befehle weiter. Klingt kompliziert, ist in der Praxis aber ganz einfach. Um alle Dateien im aktuellen Verzeichnis parallel verpacken zu lassen, ruft man einfach folgenden Befehl auf:

ls | parallel gzip

Die gepackten Dateien muss man nicht alle wieder einzeln auspacken. Stattdessen hilft auch hier wieder parallel:

ls | parallel gunzip

In beiden Fällen startet parallel gleich mehrfach gzip beziehungsweise gunzip und setzt die Bande dann auf die von ls herübergereichten Dateinamen an.

Nach dem gleichen Prinzip skaliert der folgende Befehl die Auflösung aller Bilder mit der Endung .png um die Hälfte herunter:

ls *.png | parallel mogrify -resize 50%

Die wesentlichen limitierenden Faktoren sind hier nur noch die Geschwindigkeit der Festplatte und die Anzahl der Prossorkerne.


Kommentare
do not parse ls
norbert (unangemeldet), Donnerstag, 29. November 2012 15:50:49
Ein/Ausklappen

Siehe Überschrift. Den Output von ls zu parsen ist die schlechteste idee ever. Und wenn es nur ein Beispiel war, dann ein schlechtes. So lehrt man User, Bugs zu bauen.
näheres dazu: http://mywiki.wooledge.org/ParsingLs


Bewertung: 160 Punkte bei 31 Stimmen.
Den Beitrag bewerten: Gut / Schlecht
-
Re: do not parse ls
Kai (unangemeldet), Donnerstag, 29. November 2012 22:48:51
Ein/Ausklappen

Nein, nicht pauschal. Es kommt darauf an, was nach dem Pipe mit den Dateinamen passiert.

"ls" wird übrigens auch in der offiziellen parallel-Dokumentation als Beispiel genannt.

Auf Nummer sicher gehen kann man mit den doppelt geschweiften klammern:

ls | parallel befehl {}




Bewertung: 222 Punkte bei 27 Stimmen.
Den Beitrag bewerten: Gut / Schlecht
Achtung - systemlast
Ulf B., Dienstag, 20. November 2012 19:51:21
Ein/Ausklappen

Hallo,

nettes Progrämmchen, man sollte es allerdings mit bedacht einsetzten.

Zum einen bringt es nur etwas bei Hyberthreding und Mehrkern-CPUs und zum anderen kann man damit einen PC (je nach Kernel) quasi lahmlegen. und zwar wenn man mindestens so viele Tasks wie CPU Kerne (auch Hyberthredding) hat. Dieses tritt dann auf, wenn man den Prozess startet und zeitweise wenig z.B. auf dem Desktop tut. Denn nach einiger Zeit ordnet Linux den Prozessen mit hoher Last höhere Resourcen (RAM und CPU zeit zu). Dann sollte man die Priorität der Tasks herunter stufen - damit das nicht so gravierend auftritt.

Gruß
Ulf


Bewertung: 154 Punkte bei 39 Stimmen.
Den Beitrag bewerten: Gut / Schlecht
-
Re: Achtung - systemlast
mandri (unangemeldet), Donnerstag, 22. November 2012 21:07:07
Ein/Ausklappen

Haben die Macher auch bemerkt:
http://www.linux-community....hrichten/GNU-Parallel-20121122


Bewertung: 207 Punkte bei 23 Stimmen.
Den Beitrag bewerten: Gut / Schlecht

Tipp der Woche

Ubuntu 14.10 und VirtualBox
Ubuntu 14.10 und VirtualBox
Tim Schürmann, 08.11.2014 18:45, 2 Kommentare

Wer Ubuntu 14.10 in einer virtuellen Maschine unter VirtualBox startet, der landet unter Umständen in einem Fenster mit Grafikmüll. Zu einem korrekt ...

Aktuelle Fragen

Rootpasswort
Jutta Naumann, 29.01.2015 09:14, 1 Antworten
Ich habe OpenSuse 13.2 installiert und leider nur das Systempasswort eingerichtet. Um Änderungen,...
Neue SuSE-Literatur
Roland Welcker, 14.01.2015 14:10, 1 Antworten
Verehrte Linux-Freunde, seit Hans-Georg Essers Buch "LINUX" und Stefanie Teufels "Jetzt lerne ich...
DVD abspielen unter openSUSE 13.1
Michael Pfaffe, 12.01.2015 11:48, 6 Antworten
Hallo Linuxer, Bisher habe ich meine DVD´s mit linDVD unter openSUSE abgespielt. Mit der Versi...
Kontrollleiste SuSE 12.3 gestalten
Roland Welcker, 31.12.2014 14:06, 1 Antworten
Wie bekomme ich das Icon eines beliebigen Programms (aktuell DUDEN) in die Kontrollleiste und kan...
flash-player
roland reiner, 27.12.2014 15:24, 7 Antworten
Mein Flashplayer funktioniert nicht mehr-Plug in wird nicht mehr unterstütz,auch über google chro...

Jetzt auf den Mailinglisten

[EasyLinux-Ubuntu] [Thunderbird] live.mozillamessaging.com
Heinz-Stefan Neumeyer, 01.02.2015 11:13
Hallo an alle Mitleser, kann mir jemand aus dem kurzen Halt verraten, wie man dem TB selbst den Versuch ver...
Re: [EasyLinux-Ubuntu] Trinity was:KMail2 / fetchmail
Heinz-Stefan Neumeyer, 01.02.2015 10:01
Am Samstag, den 31.01.2015, 23:59 +0100 schrieb Matthias Müller: Moin Matthias > > Viellleicht hab...
Re: [EasyLinux-Suse] Installation von Version 13.2
"H.-Stefan Neumeyer", 01.02.2015 09:41
On Sat, 31 Jan 2015 00:53:47 +0100 Heiko Ißleib wrote: Moin Heiko > > Na mal sehen,was die Exper...
Re: [EasyLinux-Suse] Installation von Version 13.2
"H.-Stefan Neumeyer", 01.02.2015 09:30
On Sat, 31 Jan 2015 23:04:46 +0100 helmholtz.yanik@mail.de wrote: Moin Yanik > > Die DVD mit der...
Re: [EasyLinux-Suse] Installation von Version 13.2
"H.-Stefan Neumeyer", 01.02.2015 09:17
On Fri, 30 Jan 2015 21:43:21 +0100 helmholtz.yanik@mail.de wrote: Hallo Yanik > > Der Versuch vo...