Zip und Zop
Aktuelle Komprimierprogramme in der Übersicht
Was bringts?
Die hohe Anzahl der Verfahren und Programme erschwert es, für den jeweiligen Zweck eine passende Wahl zu treffen. Hier kommt das im Rahmen des Artikels entwickelte Ruby-Skript Packbench zum Zuge, das eine Datei mit mehreren Programmen packt und dabei Dateigröße, die CPU-Last während des Packens und die Dauer des Vorgangs ermittelt.
Beziehen Sie das Archiv der Version 1.6 oder später von der Heft-DVD oder der Projektseite [9] und entpacken Sie es mit dem Befehl tar -xf Dateiname
in einem Terminal. Alternativ beziehen Sie mit git clone git://gitorious.org/packbench/packbench.git die aktuelle Version aus dem Git-Repository [10]. Installieren Sie für Git unter Debian und Ubuntu das Paket git-core und unter OpenSuse git. Für die Programmiersprache Ruby hieven Sie das Paket ruby auf die Platte.
Im Verzeichnis packbench befindet sich das eigentliche Skript packbench, die Konfigurationsdatei packbench-config.rb, das kurze Liesmich README und das Verzeichnis example-benchmarks mit den Protokollen einiger Benchmark-Läufe. Wer Git verwendet, bringt diese Inhalte mit git pull jederzeit auf den aktuellen Stand.
Auf Debian Testing und Ubuntu installieren Sie die Pakete gzip, bzip2, pbzip2, lbzip2, xz-utils, zip, p7zip-full, lzma, lzop, lrzip, rar, paq8l, zp, zpaq. Nutzer anderer Distributionen kompilieren weniger gängige, aktuelle Programme aus dem Quelltext. Sie müssen nicht alle Programme installieren. Das Skript meldet nicht vorhandene Packer, wartet fünf Sekunden und überspringt diese im Benchmark. Mit [Strg]+[C] brechen Sie ab, um die fehlenden Programme vorher noch zu installieren.
Die Konfigurationsdatei packbench-config.rb enthält ein Ruby-Skript. Daher ist wichtig, auf die korrekte Syntax zu achten (Kasten "Packbench-Konfiguration"). Die Konstante FILES enthält eine komma-getrennte Liste der zu packenden Dateien. Standardmäßig verwendet das Skript die etwa 40 MByte große Datei coreutils-8.5.tar, die Sie mit den in Listing 1 gezeigten Befehlen herunter laden und entpacken.
Listing 1
$ wget http://ftp.gnu.org/gnu/coreutils/coreutils-8.5.tar.bz2 $ bunzip2 coreutils-8.5.tar.bz2
Die von den Entwicklern angebotene Xz-Variante entpacken Sie indes mit xz -d coreutils-8.5.tar.xz. Stellen Sie dem Dateinamen in TMPFILE einen Pfad voran, um für die temporären Dateien ein anderes Verzeichnis als das Aktuelle zu verwenden.
Packbench-Konfiguration
#!/usr/bin/ruby env
# Configuration file for packbench
# Temporary file, can be with path
TMPFILE = "packbench-#{Time.now.to_i.to_s}-#{rand(99999).to_s}.tmp"
# Files to compress and decompress
FILES = [
"coreutils-8.5.tar"
]
# Packers to be used
[...]
PACKERS = [
{
"name" => "gzip",
"extension" => ".gz",
"version" => "gzip --version | head -1",
"compress" => "gzip",
"compressvariants" => [ "-6", "-1", "-9" ],
"decompress" => "gzip -d"
},
[...]
{
"name" => "zip",
"extension" => ".zip",
"version" => "zip --version | grep \"This is\"",
"compress" => "zip COMPRESSVARIANT #{TMPFILE}.zip",
"compressvariants" => [ "-6", "-1", "-9" ],
"decompress" => "unzip"
},
[...]
Unter PACKERS finden Sie bereits viele Packprogramme vorkonfiguriert. Die, die Sie nicht testen möchten, überspringen Sie, in dem Sie im entsprechenden Abschnitt zwischen den geschweiften Klammern die Zeile "skip" => true einfügen. Alle Zeilen im Abschnitt bis auf die letzte müssen mit einem Komma enden.
Möchten Sie einen neuen Packer hinzufügen, schauen in die passende Manpage und tragen analog zu den anderen Einträgen dessen Name (name), die Dateiendung (extension), einen Weg, dessen Version herauszubekommen (version), die Aufrufe fürs Komprimieren (compress) und Dekomprimieren (decompress) sowie die gewünschten unterschiedlichen Pack-Optionen (compressvariants) ein.
Die vorliegenden Einträge enthalten an erster Stelle immer die Standard-Einstellung und dann Optionen für schwächere und stärkere Komprimierung. Für Packer, die den Namen der Archiv-Datei verlangen, bietet sich die Schreibweise bei Zip ein, um mit den Platzhalter COMPRESSVARIANT die Pack-Optionen an der richtigen Stelle einzufügen. Die meisten dieser Optionen stellen die Wörterbuch- oder Blockgröße für die Kompression ein und beeinflussen damit den Speicherverbrauch. Einige Manpages und Hilfetexte der Befehle geben Richtwerte an (Tabelle "Speicherverbrauch").
Speicherverbrauch
| Programm | Option | Speicherverbrauch |
|---|---|---|
| Bzip2, Lbzip2, Pbzip2 | -1, -2, …, -9
|
100, 200, …, 900 KByte |
| Xz | Von -0 bis -9
|
Etwa 6 bis 800 MByte |
| Lzip | Von -1 bis -9
|
1 bis 32 MByte, bis 512 MByte möglich (-s)
|
| ZP | -1, -2, -3
|
38, 111, 246 MByte |
| Paq8l | Von -1 bis -8
|
Von 133 bis 1643 MByte |
| Zpaq | Unter anderem von -cmax.cfg,-1 bis -cmaxcfg,3
|
Von 130 bis 1861 MByte |
Stoppen Sie gegebenenfalls mit /etc/init.d/cron stop oder service cron stop zeitgesteuerte Jobs, um die Ergebnisse nicht zu verfälschen. Schließlich starten Sie den Benchmark mit ./packbench oder ruby packbench (Abbildung 1). Mit ./packbench | tee packbench-2010-08-19.log landet die Ausgabe gleichzeitig auf dem Bildschirm und in einer Datei.
Ergebnisse
Das Programm gibt am Ende eines Durchlaufs nach allgemeinen Informationen wie dem verwendeten Prozessor und die Versionen der Packprogramme die eigentlich Benchmark-Ergebnisse im Form einer Tabulator-getrennten CSV-Tabelle aus (Abbildung 2). Die ausgeschnittenen und in eine eigene Datei mit der Endung .csv gespeicherten Tabellenzeilen lesen Sie in OpenOffice Calc ein. Wählen Sie im Dialog Textimport als Zeichensatz UTF-8 oder Westeuropa (ISO-8859-15/EURO). Als Trennzeichen wählen Sie unter Trennoptionen den Tabulator als Trennzeichen aus.
Die Vorschau sollte die Spalten nun richtig anzeigen (Abbildung 3). Vor dem Klick auf OK wählen Sie für die Spalten mit Dezimalzahlen (Size%, P-Time, U-Time) im Kontextmenü des Spaltentitels als Spaltentyp US-Englisch, damit Calc den Dezimalpunkt durch ein Komma ersetzt.
Mit Einfügen | Diagramm erstellen Sie aus markierten Daten Diagramme. Nicht nebeneinander liegende Daten markieren Sie mit [Strg]. Kopieren Sie ein Diagramm, öffnen Sie mit Neu | Zeichnung OpenOffice Draw und fügen Sie es dort ein, um es zu exportieren. Auf der DVD der Media-Ausgabe befindet sich als Beispiel die Auswertung der Ergebnisse aus diesem Artikel.



