Große Dateien teilen und wieder zusammenfügen

split und cat
split und cat
13.08.2012 13:08

Selbst in Zeiten übergroßer Festplatten und Breitbandanschlüssen steht man immer mal wieder vor der Aufgabe eine überdimensionale Datei in kleine, mundgerechte Häppchen zu unterteilen. Sei es, weil man ein großes HD-Video oder ein Backup auf mehreren DVDs sichern möchte oder man eine fette ISO-Datei auf einem kleinen USB-Stick transportieren muss.

Spalter

In solchen Situationen hilft das Kommandozeilenprogramm split. Es sollte in den meisten aktuellen Distributionen standardmäßig installiert sein, zumindest aber in den Repositories liegen. Um mit ihm die große Datei megagross.iso in 500 MB große Stückchen zu zerlegen, benötigt man schlicht:

split --verbose --bytes=500m --suffix-length=2 --numeric-suffixes
megagross.iso megagross.iso.teil_

Die einzelnen Teile erhalten dabei Dateinamen der Form megagross.iso.teil_01, megagross.iso.teil_02 und so weiter. Wie viele Stellen die angehängten Ziffern umfassen sollen, bestimmt der Parameter --suffix-length=. Sein Kollege --bytes= regelt die Größe der einzelnen Stücke. Der Parameter --numeric-suffixes sorgt schließlich dafür, dass split Zahlen verwendet. Ohne ihn nutzt split Buchstaben, die einzelnen Teile im Beispiel würden dann megagross.iso.teil_aa, megagross.iso.teil_ab und so weiter heißen.

Wer auf diese Weise ein Backup erstellen möchte, kann das Einpacken gleich mit dem Aufspalten verbinden – und zwar über eine Pipe:

tar -cz * | split --bytes=500m --suffix-length=2 --numeric-suffixes - ../meinbackup.tgz.teil_

Dieser Befehl erstellt ein tgz-Archiv und verteilt es automatisch auf 500 MB große Stücke mit den Namen meinbackup.tgz.teil_01, meinbackup.tgz.teil_02 und so weiter.

Das Teilen und Zusammenfügen einer großen Datei benötigt nur zwei Befehle. Anstelle von "m" für Megabyte kann man wie hier auch "k" für Kilobyte verwenden.

Zusammenfügen

Am Zielort setzt dann ein simples:

cat megagross.iso.teil_* > megagross.iso

die Einzelteile wieder zur ursprünglichen Datei zusammen. Doch Vorsicht: Sollte es bereits eine Datei namens megagross.iso geben, wird diese gnadenlos und ohne Rückfrage überschrieben.

Eine aufgesplittetes tgz-Archiv lässt sich ebenfalls per Pipe direkt beim Zusammensetzen entpacken:

cat meinbackup.tgz.teil_* | tar xvz

Trau schau wem

Sicherheitsfanatiker erstellen vor dem Splitten noch eine Prüfsumme, etwa mit md5sum:

md5sum megagross.iso > pruefsumme.txt

Bei diesem Befehl landet die Prüfsumme in der Datei pruefsumme.txt. Das erspart das Abtippen der kryptischen Nummer: Man muss die Datei nur mitkopieren und dann nach dem Zusammenfügen mit folgendem Befehl prüfen:

md5sum -c pruefsumme.txt

Die Ausgabe sollte dann schlicht OK lauten.


Kommentare

Tipp der Woche

Ubuntu 14.10 und VirtualBox
Ubuntu 14.10 und VirtualBox
Tim Schürmann, 08.11.2014 18:45, 0 Kommentare

Wer Ubuntu 14.10 in einer virtuellen Maschine unter VirtualBox startet, der landet unter Umständen in einem Fenster mit Grafikmüll. Zu einem korrekt ...

Aktuelle Fragen

Nach Ubdates alles weg ...
Maria Hänel, 15.11.2014 17:23, 4 Antworten
Ich brauche dringen eure Hilfe . Ich habe am wochenende ein paar Ubdates durch mein Notebook von...
Brother Drucker MFC-7420
helmut berger, 11.11.2014 12:40, 1 Antworten
Hallo, ich habe einen Drucker, brother MFC-7420. Bin erst seit einigen Tagen ubuntu 14.04-Nutzer...
Treiber für Drucker brother MFC-7420
helmut berger, 10.11.2014 16:05, 2 Antworten
Hallo, ich habe einen Drucker, brother MFC-7420. Bin erst seit einigen Tagen ubuntu12.14-Nutzer u...
Can't find X includes.
Roland Welcker, 05.11.2014 14:39, 1 Antworten
Diese Meldung erhalte ich beim Versuch, kdar zu installieren. OpenSuse 12.3. Gruß an alle Linuxf...
DVDs über einen geeigneten DLNA-Server schauen
GoaSkin , 03.11.2014 17:19, 0 Antworten
Mein DVD-Player wird fast nie genutzt. Darum möchte ich ihn eigentlich gerne abbauen. Dennoch wür...

Jetzt auf den Mailinglisten

Re: [EasyLinux-Suse] OS_13.2_mate_caja_multiple_Instanzen_(hier_erstmal_gelöst)
Heinz-Stefan Neumeyer, 27.11.2014 17:00
Am Donnerstag, den 27.11.2014, 16:33 +0100 schrieb Willi Zelinka: Hallo Willi > > Noch eine Ergänz...
Re: [EasyLinux-Suse] OS_13.2_mate_caja_multiple_Instanzen_(hier_erstmal_gelöst)
Willi Zelinka, 27.11.2014 16:33
Am Donnerstag, 27. November 2014, 16:11:07 schrieb Heinz-Stefan Neumeyer: > Hallo Heiko > > >...
Re: [EasyLinux-Suse] OS_13.2_mate_caja_multiple_Instanzen_(hier_erstmal_gelöst)
Heinz-Stefan Neumeyer, 27.11.2014 16:11
Am Donnerstag, den 27.11.2014, 14:07 +0100 schrieb Heiko Ißleib: Hallo Heiko > > Ein gedrucktes Ha...
Re: [EasyLinux-Ubuntu] Personalausweis
Nguyen Dong Loan, 27.11.2014 15:51
Am Donnerstag, 27. November 2014, 13:54:25 schrieb Hartmut Haase: Die gleiche Frage habe ich mir vor einem ha...
Re: [EasyLinux-Suse] OS_13.2_mate_caja_multiple_Instanzen_(hier_erstmal_gelöst)
Heiko, 27.11.2014 14:07
Am Mittwoch, 26. November 2014, 21:18:18 schrieb H.-Stefan Neumeyer: Hallo Stefan. > Ich kann be...