Große Dateien teilen und wieder zusammenfügen

split und cat
split und cat
13.08.2012 13:08

Selbst in Zeiten übergroßer Festplatten und Breitbandanschlüssen steht man immer mal wieder vor der Aufgabe eine überdimensionale Datei in kleine, mundgerechte Häppchen zu unterteilen. Sei es, weil man ein großes HD-Video oder ein Backup auf mehreren DVDs sichern möchte oder man eine fette ISO-Datei auf einem kleinen USB-Stick transportieren muss.

Spalter

In solchen Situationen hilft das Kommandozeilenprogramm split. Es sollte in den meisten aktuellen Distributionen standardmäßig installiert sein, zumindest aber in den Repositories liegen. Um mit ihm die große Datei megagross.iso in 500 MB große Stückchen zu zerlegen, benötigt man schlicht:

split --verbose --bytes=500m --suffix-length=2 --numeric-suffixes
megagross.iso megagross.iso.teil_

Die einzelnen Teile erhalten dabei Dateinamen der Form megagross.iso.teil_01, megagross.iso.teil_02 und so weiter. Wie viele Stellen die angehängten Ziffern umfassen sollen, bestimmt der Parameter --suffix-length=. Sein Kollege --bytes= regelt die Größe der einzelnen Stücke. Der Parameter --numeric-suffixes sorgt schließlich dafür, dass split Zahlen verwendet. Ohne ihn nutzt split Buchstaben, die einzelnen Teile im Beispiel würden dann megagross.iso.teil_aa, megagross.iso.teil_ab und so weiter heißen.

Wer auf diese Weise ein Backup erstellen möchte, kann das Einpacken gleich mit dem Aufspalten verbinden – und zwar über eine Pipe:

tar -cz * | split --bytes=500m --suffix-length=2 --numeric-suffixes - ../meinbackup.tgz.teil_

Dieser Befehl erstellt ein tgz-Archiv und verteilt es automatisch auf 500 MB große Stücke mit den Namen meinbackup.tgz.teil_01, meinbackup.tgz.teil_02 und so weiter.

Das Teilen und Zusammenfügen einer großen Datei benötigt nur zwei Befehle. Anstelle von "m" für Megabyte kann man wie hier auch "k" für Kilobyte verwenden.

Zusammenfügen

Am Zielort setzt dann ein simples:

cat megagross.iso.teil_* > megagross.iso

die Einzelteile wieder zur ursprünglichen Datei zusammen. Doch Vorsicht: Sollte es bereits eine Datei namens megagross.iso geben, wird diese gnadenlos und ohne Rückfrage überschrieben.

Eine aufgesplittetes tgz-Archiv lässt sich ebenfalls per Pipe direkt beim Zusammensetzen entpacken:

cat meinbackup.tgz.teil_* | tar xvz

Trau schau wem

Sicherheitsfanatiker erstellen vor dem Splitten noch eine Prüfsumme, etwa mit md5sum:

md5sum megagross.iso > pruefsumme.txt

Bei diesem Befehl landet die Prüfsumme in der Datei pruefsumme.txt. Das erspart das Abtippen der kryptischen Nummer: Man muss die Datei nur mitkopieren und dann nach dem Zusammenfügen mit folgendem Befehl prüfen:

md5sum -c pruefsumme.txt

Die Ausgabe sollte dann schlicht OK lauten.


Kommentare

Tipp der Woche

Ubuntu 14.10 und VirtualBox
Ubuntu 14.10 und VirtualBox
Tim Schürmann, 08.11.2014 18:45, 4 Kommentare

Wer Ubuntu 14.10 in einer virtuellen Maschine unter VirtualBox startet, der landet unter Umständen in einem Fenster mit Grafikmüll. Zu einem korrekt ...

Aktuelle Fragen

Admin Probleme mit Q4os
Thomas Weiss, 30.03.2015 20:27, 6 Antworten
Hallo Leute, ich habe zwei Fragen zu Q4os. Die Installation auf meinem Dell Latitude D600 verl...
eeepc 1005HA externer sound Ausgang geht nicht
Dieter Drewanz, 18.03.2015 15:00, 1 Antworten
Hallo LC, nach dem Update () funktioniert unter KDE der externe Soundausgang an der Klinkenbuc...
AceCad DigiMemo A 402
Dr. Ulrich Andree, 15.03.2015 17:38, 2 Antworten
Moin zusammen, ich habe mir den elektronischen Notizblock "AceCad DigiMemo A 402" zugelegt und m...
Start-Job behindert Bootvorgang, Suse 13.2, KDE,
Wimpy *, 20.02.2015 10:32, 4 Antworten
Beim Bootvorgang ist ein Timeout von 1 Min 30 Sec. weil eine Partition sdb1 gesucht und nicht gef...
Konfiguration RAID 1 mit 2 SSDs: Performance?
Markus Mertens, 16.02.2015 10:02, 6 Antworten
Hallo! Ich möchte bei einer Workstation (2x Xeon E5-2687Wv3, 256GB RAM) 2 SATA-SSDs (512GB) al...

Jetzt auf den Mailinglisten

Re: [EasyLinux-Ubuntu] Nvidia X740XL
Gerhard Blaschke, 21.04.2015 01:08
Nachtrag: Am 21.04.2015 um 00:34 schrieb Gerhard Blaschke: > Am 20.04.2015 um 19:59 schrieb Richard Krau...
Re: [EasyLinux-Ubuntu] Nvidia X740XL
Gerhard Blaschke, 21.04.2015 00:34
Am 20.04.2015 um 19:59 schrieb Richard Kraut: > Am Sonntag, den 19.04.2015, 15:59 +0200 schrieb Gerhard Bl...
Re: [EasyLinux-Ubuntu] wie_als_root_ausführen?
Gerhard Blaschke, 20.04.2015 23:03
Am 20.04.2015 um 19:04 schrieb Heiko Ißleib: > Hallo Gerhard. > > Ich vermute,Du weißt schon,wi...
Re: [EasyLinux-Ubuntu] Nvidia X740XL
Gerhard Blaschke, 20.04.2015 23:01
Am 20.04.2015 um 19:59 schrieb Richard Kraut: > Am Sonntag, den 19.04.2015, 15:59 +0200 schrieb Gerhard Bl...
Re: [EasyLinux-Ubuntu] Nvidia X740XL
Richard Kraut, 20.04.2015 19:59
Am Sonntag, den 19.04.2015, 15:59 +0200 schrieb Gerhard Blaschke: > Der eingestellte Treiber funktioniert...