split und cat

Große Dateien teilen und wieder zusammenfügen

4

Selbst in Zeiten übergroßer Festplatten und Breitbandanschlüssen steht man immer mal wieder vor der Aufgabe eine überdimensionale Datei in kleine, mundgerechte Häppchen zu unterteilen. Sei es, weil man ein großes HD-Video oder ein Backup auf mehreren DVDs sichern möchte oder man eine fette ISO-Datei auf einem kleinen USB-Stick transportieren muss.

Spalter

In solchen Situationen hilft das Kommandozeilenprogramm split. Es sollte in den meisten aktuellen Distributionen standardmäßig installiert sein, zumindest aber in den Repositories liegen. Um mit ihm die große Datei megagross.iso in 500 MB große Stückchen zu zerlegen, benötigt man schlicht:

split --verbose --bytes=500m --suffix-length=2 --numeric-suffixes
megagross.iso megagross.iso.teil_

Die einzelnen Teile erhalten dabei Dateinamen der Form megagross.iso.teil_01, megagross.iso.teil_02 und so weiter. Wie viele Stellen die angehängten Ziffern umfassen sollen, bestimmt der Parameter --suffix-length=. Sein Kollege --bytes= regelt die Größe der einzelnen Stücke. Der Parameter --numeric-suffixes sorgt schließlich dafür, dass split Zahlen verwendet. Ohne ihn nutzt split Buchstaben, die einzelnen Teile im Beispiel würden dann megagross.iso.teil_aa, megagross.iso.teil_ab und so weiter heißen.

Wer auf diese Weise ein Backup erstellen möchte, kann das Einpacken gleich mit dem Aufspalten verbinden – und zwar über eine Pipe:

tar -cz * | split --bytes=500m --suffix-length=2 --numeric-suffixes - ../meinbackup.tgz.teil_

Dieser Befehl erstellt ein tgz-Archiv und verteilt es automatisch auf 500 MB große Stücke mit den Namen meinbackup.tgz.teil_01, meinbackup.tgz.teil_02 und so weiter.

Das Teilen und Zusammenfügen einer großen Datei benötigt nur zwei Befehle. Anstelle von "m" für Megabyte kann man wie hier auch "k" für Kilobyte verwenden.
Das Teilen und Zusammenfügen einer großen Datei benötigt nur zwei Befehle. Anstelle von „m“ für Megabyte kann man wie hier auch „k“ für Kilobyte verwenden.

Zusammenfügen

Am Zielort setzt dann ein simples:

cat megagross.iso.teil_* > megagross.iso

die Einzelteile wieder zur ursprünglichen Datei zusammen. Doch Vorsicht: Sollte es bereits eine Datei namens megagross.iso geben, wird diese gnadenlos und ohne Rückfrage überschrieben.

Eine aufgesplittetes tgz-Archiv lässt sich ebenfalls per Pipe direkt beim Zusammensetzen entpacken:

cat meinbackup.tgz.teil_* | tar xvz

Trau schau wem

Sicherheitsfanatiker erstellen vor dem Splitten noch eine Prüfsumme, etwa mit md5sum:

md5sum megagross.iso > pruefsumme.txt

Bei diesem Befehl landet die Prüfsumme in der Datei pruefsumme.txt. Das erspart das Abtippen der kryptischen Nummer: Man muss die Datei nur mitkopieren und dann nach dem Zusammenfügen mit folgendem Befehl prüfen:

md5sum -c pruefsumme.txt

Die Ausgabe sollte dann schlicht OK lauten.

Hinterlasse einen Kommentar

4 Kommentare auf "Große Dateien teilen und wieder zusammenfügen"

  E-Mail Benachrichtigung  
Neuste Älteste Beste Bewertung
Benachrichtige mich zu:

Die erklärten Optionen lassen sich alle in man oder help nachlesen. Aber was ist mit dem vereinzelten ‚-‚ ? Wofür steht das? Darüber wurde kein Wort verloren..

Machen Sie es besser. 😉 Jeder kann auf der LinuxCommunity eigene Artikel und News einreichen, die wir dann veröffentlichen. Über einen ausführlicheren Artikel über „split“ würden wir uns jedenfalls freuen.

Hi, wie du selbst gesagt hast, lassen sich alle Optionen in der Manpage nachlesen. 😉
Dort steht auch ziemlich am Beginn: „With no INPUT, or when INPUT is -, read standard input.“
Das einzelne ‚-‚ braucht man in dem Fall, um von standard input zu lesen, damit die Daten verarbeitet werden, die von tar über die Pipe daher kommen.

Vielen Dank für die Anleitung. Bringt mich weiter, als die Aufteilung nur mit Tar (falls das in eine Datei überhaupt geht), denn ich kann dabei auch packen. Im Gegensatz zum Vorposter ist die Anleitung durchaus sinnvoll. Was nützen mir die Man-Pages, wenn ich nicht weiß, dass ich das mit Split überhaupt machen kann.