Grundlagen der Datensicherung

Aus LinuxUser 08/2023

Grundlagen der Datensicherung

© Tharin Kaewkanya, 123RF

Wohl behütet

Die eigenen Daten gehören zum Wichtigsten, was es auf dem PC gibt. Daher lohnt es sich, einige Stunden Zeit für das Aufsetzen einer regelmäßigen Datensicherung zu investieren.

Mechanische Festplatten gehören zu den fehleranfälligsten Komponenten jedes PCs. Zum einen enthalten sie bewegte Bauteile, die auf die Dauer verschleißen, zum anderen reagieren sie empfindlich auf thermische und mechanische Belastungen. Unter ungünstigen Umständen genügt es, gegen den Rechner zu stoßen, um einer Platte das Lebenslicht auszublasen.

Zwar besitzen die heute vor allem in Laptops häufig verwendeten SSDs keine bewegten Teile mehr, zeigen sich jedoch zumindest in den günstigeren Versionen aber trotzdem fehleranfällig. Das liegt vor allem daran, dass die einzelnen Speicherzellen je nach Bauart nur zwischen 3000 und 100 000 Schreibzyklen aushalten. Dem gegenüber stehen etwa eine Milliarde Zyklen bei konventionellen Festplatten. Dieses Problem kompensieren Gegenmaßnahmen wie Over-Provisioning samt damit einhergehender Garbage Collection, Wear Leveling und Bad-Block-Management zwar teilweise, beseitigen es aber nicht komplett. Allerdings bewegt sich die Verschleißgrenze moderner SSD-Speicher bei mehreren Hundert Terabyte TBW (Total Bytes Written).

Diesen Aspekten gilt es Rechnung zu tragen und die Daten in regelmäßigen Abständen zu sichern. Allerdings ist die Empfindlichkeit von Festplatten bei Weitem nicht das einzige Argument für eine Datensicherung. Weitaus häufiger als durch defekte Bauteile tritt Datenverlust durch versehentliches Löschen, Schädlingsbefall oder Dateisysteminkonsistenzen auf. Diesbezüglich machte speziell Ransomware, die den Inhalt ganzer Lauf- und Netzwerke verschlüsselt, in den letzten Jahren von sich reden. Allein für das Jahr 2021 schätzen Experten den Schaden in Deutschland auf über 24 Milliarden Euro – eine ausgereifte Backup-Strategie hätte sehr viel Geld gespart.

Speichermedien

Prinzipiell eignet sich jeder Datenträger mit dem nötigen Fassungsvermögen als Backup-Medium. Spendieren Sie dem Rechner etwa eine zweite Festplatte und kopieren die relevanten Daten in regelmäßigen Abständen von der einen auf die andere Disk, gehen beim Ausfall einer Platte keine wichtigen Daten verloren.

Um das lästige manuelle Kopieren der Dateien zu umgehen, bietet es sich an, die Platten zu einem RAID-1-Verbund zusammenzufassen [1]. Das System schreibt dann die Daten jeweils auf beide Platten gleichzeitig. Fällt eine Disk aus, müssen Sie diese lediglich durch eine neue ersetzen und diese in den RAID-Verbund aufnehmen.

Diese Methode hat jedoch auch Nachteile: Ereignisse, die den Rechner beschädigen oder zerstören, etwa Überspannung durch Blitzeinschläge, ziehen unter Umständen beide Platten in Mitleidenschaft. Des Weiteren schützt ein RAID-1 lediglich gegen Festplattenausfälle. Fehler im Dateisystem, Zerstörung der Daten durch Schadsoftware oder versehentliches Löschen fängt diese Methode der redundanten Datenspeicherung nicht ab. Zudem bringt speziell Soft-RAID einen weiteren, nicht zu unterschätzenden Nachteil mit sich: Die Performance sinkt gegenüber einer Einzelplatte unter Umständen um 30 oder mehr Prozent.

Solche Nachteile umgehen Sie mit dem Einsatz einer externen Festplatte, die Sie ausschließlich zur Datensicherung an den Rechner stecken und nach dem Backup wieder in den Schrank legen. Als alternative Speichermedien bieten sich USB-Sticks und SD-Karten an, die es mit 128 GByte Fassungsvermögen schon für unter 20 Euro zu kaufen gibt. USB-Sticks sind zwar robuster als Festplatten, fassen aber weniger Daten. Zudem ist wie bei den SSDs die Anzahl der Schreibzyklen begrenzt. Verwenden Sie den Stick jedoch ausschließlich zur Datensicherung, spielt das kaum eine Rolle. Sehr wohl stört aber, dass die Transferrate auch der besten Sticks weit unter denen einer SSD liegt.

Als weitere Backup-Medien wurden in der Vergangenheit oft CDs und DVDs eingesetzt [2]. Sie spielen angesichts der massiv gestiegenen Datenvolumen inzwischen aber kaum mehr eine Rolle: Vor 15 Jahren umfasste beispielsweise ein Bild im RAW-Format meist unter 10 MByte, inzwischen sind es nicht selten über 40 MByte.

Übermorgen

Ein seit Jahren eng mit der Datensicherung verbundenes Thema, das bei den Anwendern immer wieder für Verunsicherung sorgt, stellt die Haltbarkeit von Speichermedien dar. So eignen sich hochwertige USB-Sticks sehr gut zum längerfristigen Speichern von Daten. Dasselbe gilt für SSDs, deren GByte-Preise inzwischen bei etwa 6 Cent liegen, bei einem Fassungsvermögen von 1 TByte.

Als relativ haltbares Speichermedium gilt auch die mechanische Festplatte, die als reines Backup-Medium deutlich länger als zehn Jahre hält. Allerdings kommen bei längeren Lagerzeiten einige Unwägbarkeiten ins Spiel, insbesondere der rasante Wandel der IT und der damit verbundene Wechsel von Standards. Unterstützt der Computer der Zukunft die derzeit verwendeten Schnittstellen wie USB, SATA, IDE oder Firewire überhaupt noch?

Wer solche Fragen für abwegig hält, versuche heute einmal, ein 5,25- oder 8-Zoll-Floppy-Laufwerk aufzutreiben. Ähnlich sieht es bei Dateiformaten aus: So wechseln viele Kamerahersteller bei Modellwechseln auch das verwendete RAW-Format. Das kann dazu führen, dass in zehn Jahren keine Software mehr die alten Daten anzeigen kann. Für Abhilfe sorgt hier das Konvertieren der Bilder in Adobes Standard-Format DNG.

Eine interessante Alternative bietet das Online-Backup. Dank der fast flächendeckend verfügbaren Breitband-Internet-Anschlüsse stellt es heute für viele Anwender kein Problem mehr dar, auch viele GByte große Daten zu transferieren. Anbieter, die Online-Storage für wenig Geld anbieten, gibt es inzwischen genügend. Allerdings geben Sie hier zum einen Ihre Daten aus der Hand, zum anderen stellt sich die Frage, ob es den Speicheranbieter in zehn Jahren noch gibt. Darüber hinaus sollten Sie Online-Backups immer verschlüsseln, um die Daten vor Fremdzugriffen zu schützen.

Eine immer häufiger diskutierte Version der Langzeitdatensicherung stellt das Speichern von Informationen auf analogen Medien dar. So hält beispielsweise Papier problemlos 30 Jahre und länger. Diverse Dienste bieten auch das Ausbelichten digitaler Bilder auf Dias zum Archivieren wichtiger Aufnahmen an. Solche Positive überstehen bei richtiger Lagerung mehrere Jahrzehnte ohne Qualitätsverlust. Allerdings fallen hier erhebliche Kosten an: Auch bei Mengen über hundert Stück verlangen viele Anbieter noch bis zu zwei Euro pro Dia.

Der Königsweg bei der digitalen Datensicherung bleibt gerade für die Langzeitarchivierung die Bandsicherung, die nach wie vor in sehr vielen Firmen zum Einsatz kommt.

Professionell sichern

Das regelmäßige Sichern der Datenbestände gehört in Firmen nicht zur Kür, sondern zum vorgeschriebenen Pflichtprogramm, nicht zuletzt wegen der gesetzlich geregelten Aufbewahrungsfrist von bis zu zehn Jahren. Als Backup-Medien kommen dabei, wie erwähnt, beinahe ausnahmslos Bänder zum Einsatz. Sie bieten zum einen den günstigsten Preis per GByte, zum anderen haben sie sich gerade beim langfristigen Aufbewahren von Daten bewährt, da die Bänder bei richtiger Aufbewahrung extrem langsam altern.

Um zu gewährleisten, dass sich die Daten von jedem beliebigen Zeitpunkt rekonstruieren lassen, verwenden viele Admins als Backup-Strategie das Generationen-Rotationsprinzip, auch als Großvater, Vater, Sohn bekannt (Abbildung 1). Die Sohn-Medien enthalten die Tagessicherung, die Vater-Medien das Wochen-Backup und die Großvater-Bänder das Monats-Backup.

Abbildung 1: Das Generationenprinzip <span class="ui-element">Gro&szlig;vater</span>, <span class="ui-element">Vater</span>, <span class="ui-element">Sohn</span> gew&auml;hrleistet, dass sich Daten von jedem beliebigen Sicherungszeitpunkt l&uuml;ckenlos wiederherstellen lassen.

Abbildung 1: Das Generationenprinzip Großvater, Vater, Sohn gewährleistet, dass sich Daten von jedem beliebigen Sicherungszeitpunkt lückenlos wiederherstellen lassen.

Das folgende Beispiel eines üblichen Szenarios veranschaulicht die Technik: An den ersten vier Tagen der Woche erfolgt jeweils eine inkrementelle oder differenzielle Datensicherung (siehe Kasten “Sicherungsmethoden”) auf die Sohn-Medien 1 bis 4. Am Freitag steht eine Vollsicherung auf das Vater-Band 1 an. In der nächsten Woche erfolgt die inkrementelle Datensicherung wieder auf die Sohn-Tapes der Vorwoche, am Freitag ein Voll-Backup auf Vater Nummer 2. So setzt sich das über alle Wochen des Monats fort. Am Monatsende kommt der Großvater 1 an die Reihe, der eine vollständige Datensicherung aufnimmt. Damit werden die Vater-Medien 1 bis 4 für die wöchentlichen Komplettsicherungen des Folgemonats frei. Der Großvater wandert zur Archivierung in den Datenschutzschrank oder noch besser in ein externes Archiv wie einen Banksafe (Abbildung 2).

Abbildung 2: Das Auslagern von Backup-Medien verhindert, dass die vermeintlich sicheren Daten von katastrophalen Einfl&uuml;ssen wie etwa Br&auml;nden zerst&ouml;rt werden. Quelle: Kroll Ontrack

Abbildung 2: Das Auslagern von Backup-Medien verhindert, dass die vermeintlich sicheren Daten von katastrophalen Einflüssen wie etwa Bränden zerstört werden. Quelle: Kroll Ontrack

Diese Art der Datensicherung ist zwar sehr effizient, für den Privatanwender aber zu umständlich, zu teuer und in der Regel auch nicht notwendig. Selbst der Einsatz von Streamern lohnt sich nur in Ausnahmefällen, da sowohl die Geräte als auch die Speichermedien verhältnismäßig teuer sind. Darüber hinaus erschwert die sequenzielle Speichertechnik von Bändern das Wiederherstellen einzelner Daten erheblich: Unter Umständen warten Sie eine Minute darauf, bis das Tape zur richtigen Stelle spult.

Sicherungsmethoden

Die klassische Datensicherung unterscheidet zwischen drei verschiedenen Verfahren (Abbildung 3). Jedes davon bringt spezifische Vorzüge und Nachteile mit sich, weswegen sie in der Regel in Kombination zum Einsatz kommen.

Eine Volldatensicherung speichert alle auf einem Medium lagernden Daten. So lassen sich alle Dateien einfach rekonstruieren. Allerdings fallen hohe Datenvolumina an, die selbst große Speichermedien schnell an ihre Grenzen bringen und lange Backup-Zeiten erzwingen.

Ein differenzielles Backup sichert dagegen nur jene Daten, die sich seit der letzten Vollsicherung geändert haben oder neu hinzukamen. Mittels des letzten Voll-Backups und des letzten differenziellen Backups lassen sich alle Daten einfach wiederherstellen. Durch die Redundanzen der differenziellen Backups fällt aber auch hier ein relativ hohes Datenvolumen an.

Daher sichert ein inkrementelles Backup lediglich jene Daten, die sich seit dem letzten inkrementellen Backup verändert haben oder neu hinzukamen. Somit enthält ein inkrementelles Backup anders als ein differenzielles keine doppelten Daten. Ein Wiederherstellen erfordert aber immer alle Backup-Sätze seit der letzten Vollsicherung. Dafür benötigt diese Methode mit Abstand am wenigsten Speicherplatz.

Abbildung 3: W&auml;hrend die differenzielle Datensicherung stets alle Dateien seit der letzten Vollsicherung ber&uuml;cksichtigt, speichert die inkrementelle nur die jeweils ge&auml;nderten Daten seit der letzten inkrementellen Sicherung.

Abbildung 3: Während die differenzielle Datensicherung stets alle Dateien seit der letzten Vollsicherung berücksichtigt, speichert die inkrementelle nur die jeweils geänderten Daten seit der letzten inkrementellen Sicherung.

Private Datensicherung

Der Anspruch bei der privaten Datensicherung unterscheidet sich in vielen Punkten essenziell von jenem in Unternehmen: Hier steht eine möglichst einfache Handhabung im Vordergrund. Das betrifft sowohl das Erstellen der Backups als auch das Wiederherstellen verloren gegangener Daten.

Zunächst gilt es jedoch festzulegen, welche Daten Sie in welchem Turnus sichern möchten. So lohnt es sich beispielsweise nicht, von der mehr oder weniger statischen Musiksammlung alle drei Tage ein Backup zu erstellen, während bei den Dokumenten oder dem E-Mail-Postfach unter Umständen sogar eine mehrfache tägliche Sicherung sinnvoll erscheint.

Generell sollten Sie externe Backup-Medien nicht unmittelbar beim PC aufbewahren. Viele Firmen verwahren einen Teil ihrer Datensicherung sogar im Banktresor, um beispielsweise im Falle eines Brands nicht alle Daten zu verlieren. Das erscheint für Privatanwender wenig praktikabel, jedoch sollten Sie zumindest die Jahressicherung im Keller oder einem anderen Raum aufbewahren.

Es ergibt auch wenig Sinn, den Rechner vor dem Zugriff Fremder abzusichern, während das Backup-Medium jedermann Einsicht in die persönlichen Daten gewährt. Deswegen sollten Sie die Daten entsprechend schützen. Das gilt insbesondere, wenn Sie in Erwägung ziehen, die Daten in der Cloud zu speichern, etwa bei Dropbox [3] oder HiDrive [4].

Den sichersten Schutz vor dem Zugriff Dritter bietet zweifellos der Einsatz von Veracrypt-Containern [5], die sich im eingehängten Zustand wie ein normales Laufwerk verhalten [6]. Wie Sie einen solchen Container im Kontext mit Dropbox am sinnvollsten verwenden, zeigt der Kasten “Weggesperrt”. Alternativ komprimieren Sie die gesicherten Dateien und versehen das Archiv mit einem Passwort.

Weggesperrt

Wichtige Daten sollten Sie keinesfalls ungeschützt in der Cloud speichern. Es besteht nicht nur die Gefahr, dass jemand an Ihre Zugangsdaten gelangt und sich der Daten bemächtigt: Knackt der Angreifer den Hosting-Anbieter selbst, bekommt er häufig auch uneingeschränkten Zugriff auf sämtliche Konten. Darüber hinaus sind vor allem amerikanische Anbieter (darunter Dropbox) gesetzlich verpflichtet, staatlichen Diensten Zugriff auf die Konten zu gewähren. Schließlich führt unter Umständen auch eigene Unvorsichtigkeit oder Unkenntnis dazu, dass Dateien ungewollt an die Öffentlichkeit gelangen [10]. Abhilfe schafft hier der Einsatz eines Veracrypt-Containers, der nur Ihnen Zugriff auf die Daten gewährleistet.

Bei Dropbox handelt es sich um einen Online-Storage-Anbieter, der Clients für alle gängigen Betriebssysteme einschließlich Linux, Android und iOS bereitstellt. Nach der Installation legen Sie einen Dropbox-Ordner im lokalen Dateisystem fest, den der Dienst zukünftig sowohl mit dem Online-Speicher als auch allen angeschlossenen Client-Rechnern synchronisiert.

Genauso verhält es sich mit Veracrypt-Containern: Legen Sie einen solchen im Dropbox-Ordner ab, lädt der Dienst ihn hoch und verteilt ihn an alle angeschlossene Clients. Das ist für sich in der Praxis schon ziemlich praktisch. Mindestens ebenso nützlich: Der Dienst gleicht bei Dateien (und damit auch bei Veracrypt-Containern) jeweils nur die Änderungen ab. Kopieren Sie beispielsweise eine Datei mit 1 MByte Umfang in den Container, synchronisiert Dropbox auch nur diese und nicht den gesamten Container. Allerdings sollten Sie darauf achten, dass jeweils nur ein Client die Container-Datei öffnet, da es anderenfalls zu Inkonsistenzen kommt. Dropbox synchronisiert die Datei erst, nachdem Sie von Truecrypt geschlossen wurde.

Wo Licht ist, gibt es auch Schatten: Der große Vorteil von Dropbox – dass Sie an jedem Ort und mit fast jedem Device an Ihre Daten gelangen – geht in diesem Szenario naturgemäß verloren.

Einen Sonderfall der Datensicherung, der sich nicht nur für private Anwender eignet, stellt das Erzeugen von Festplatten- oder Partitionsabbildern dar. In der Open-Source-Welt hat sich dafür das Programm Clonezilla [7] etabliert. Diese Methode eignet sich aber nur bedingt zur Datensicherung, sie dient in erster Linie zur Systemwiederherstellung. Liegt Ihr Heimatverzeichnis aber auf einer eigenen Partition, stellt Clonezilla eine durchaus brauchbare Alternative dar. Allerdings erlaubt die Software weder eine inkrementelle noch eine differenzielle Sicherung. Dafür ermöglicht das Programm, das Image nicht nur auf einer lokalen Platte zu speichern, sondern auch in einem NFS- oder SSH-Verzeichnis im Netz.

Backup mit Bordmitteln

Das Sichern der persönlichen Daten erfordert nicht zwangsläufig den Einsatz externer Programme: Linux bringt alle dafür notwendigen Tools bereits frei Haus mit. Am einfachsten erledigen Sie das Backup mit dem Tool Zip. Im Gegensatz zu Tar, Gzip und Bzip enthält es eine Option, das erstellte Archiv mit einem Passwort zu versehen. Außerdem ermöglicht es, nur neue oder veränderte Daten zu sichern, die das Archiv noch nicht enthält.

Mit dem Kommando aus der ersten Zeile von Listing 1 erstellen Sie rekursiv aus den angegebenen Dateien und Ordnern ein mit einem Passwort versehenes ZIP-Archiv. Der Schalter -u bewirkt, dass das Programm lediglich neue oder geänderte Daten berücksichtigt. Um die Sicherung zu automatisieren, müssen Sie die Befehlskette lediglich in ein Skript kopieren, das Sie im Verzeichnis /etc/cron.daily speichern.

Listing 1

Backup per ZIP-Archiv

$ zip -9 -P Passwort -u backup1.zip -r Datei1 Ordner1 Ordner2
$ unzip -P Passwort -n backup1.zip -d /

Wenn Sie das erzeugte Archiv nun regelmäßig auf einen externen Datenträger kopieren, haben Sie schon eine relativ effiziente Methode der Datensicherung. Geben Sie zu den Dateien und Verzeichnissen, die Sie packen möchten, absolute Pfade an, speichert Zip diese mit, was die Wiederherstellung unter Umständen deutlich erleichtert.

Um mit Zip gepackte Dateien zu verwalten, verwenden Sie das Programm Unzip. Es ermöglicht Ihnen, anhand diverser Schalter genau festzulegen, welche Dateien in welchem Umfang es wiederherstellen soll. Beispielsweise bewirkt der Aufruf aus der zweiten Zeile von Listing 1, dass das Programm nur nicht vorhandene Dateien entpackt. Mit dem Schalter -d geben Sie den Pfad an, in den Sie das Verzeichnis extrahieren möchten. Haben Sie die Sicherung mit absoluten Pfaden erstellt, entpackt das Programm die Dateien im Ursprungsverzeichnis. Eine vollständige Übersicht aller Parameter finden Sie in der Manpage (man unzip).

Eine weitere elegante Möglichkeit bietet das Programm Duplicati [8]: Es speichert Ihre Daten inkrementell, verschlüsselt sie auf Wunsch mit AES-256 und bietet als Ziel auch diverse Cloud-Storages an, unter anderem die von Google, Microsoft und Amazon. Einen umfassenden Überblick zu Duplicati bietet der Artikel “Auf Knopfdruck” [9] im Schwerpunkt dieser Ausgabe. (tle)

Glossar

SSDs

Bei den auf NAND-Flash basierenden Solid State Drives handelt es sich ähnlich wie bei USB-Sticks oder Speicherkarten um ein nichtflüchtiges Speichermedium ohne mechanische Bauteile. Daher zeigen sich SSDs wesentlich unempfindlicher gegenüber mechanischen Belastungen als herkömmliche Festplatten.

Over-Provisioning

Diese Methode dient dazu, die Geschwindigkeit und Lebensdauer einer SSD zu erhöhen. Ein bestimmter Speicherbereich wird dabei exklusiv für das Datenmanagement reserviert und steht ausschließlich dem SSD-Controller zur Verfügung.

DNG

Digital Negative. Von Adobe propagiertes, offen gelegtes Rohdatenformat für Bilder. Das Speichern erfolgt unkomprimiert, sodass DNG-Dateien im Vergleich zu anderen RAW-Formaten nicht selten größer ausfallen.

Aufbewahrungsfrist

Das Handelsgesetzbuch (HGB §257 Abs. 4) schreibt vor, wie lange Firmen unternehmensrelevante Dokumente vorhalten müssen. Für Bücher, Buchungsbelege, Bilanzen oder Inventare sieht es eine Dauer von zehn Jahren vor.

Infos

  1. Desktop-RAID: Marcus Nasarek, “Easy RAIDer”, LU 04/2006, S. 42, http://www.linux-community.de/10536

  2. DVD-RAM: http://de.wikipedia.org/wiki/DVD-RAM

  3. Dropbox: http://www.dropbox.com

  4. Strato HiDrive: https://www.hidrive.strato.com

  5. Veracrypt: Thomas Leichtenstern, “Panzerschrank”, LU 08/2018, S. 40, https://www.linux-community.de/41412

  6. Truecrypt 4.3a: Tim Schürmann “Verriegelt und verrammelt”, LU 08/2007, S. 50, http://www.linux-community.de/12971

  7. Clonezilla: Tim Schürmann, “Auf Knopfdruck neu”, LU 04/2013, S. 26, http://www.linux-community.de/28406

  8. Duplicati: https://www.duplicati.com

  9. Duplicati im Test: Ferdinand Thommes, “Auf Knopfdruck”, LU 08/2023, S. 26, https://www.linux-community.de/49451

  10. Dropbox – öffentliche Bilder: http://stadt-bremerhaven.de/dropbox-denkt-mal-dran-dass-der-photo-ordner-oeffentlich-ist/

DIESEN ARTIKEL ALS PDF KAUFEN
EXPRESS-KAUF ALS PDF
LinuxUser 08/2023 KAUFEN
EINZELNE AUSGABE
ABONNEMENTS
TABLET & SMARTPHONE APPS
E-Mail Benachrichtigung
Benachrichtige mich zu:

Hinweis: Dieser Artikel ist älter als ein Jahr, enthaltene Informationen sind möglicherweise veraltet.

0 Kommentare
Älteste
Neuste Beste Bewertung
Inline Feedbacks
Alle Kommentare anzeigen
Nach oben