Easy Raider

Desktop-RAID

01.04.2006
RAID verspricht rasante Plattenzugriffe und optimale Datensicherheit. Mit Linux ist das auch auf dem Desktop kein Problem.

In den letzten 15 Jahren hat sich die Festplattenkapazität fast vertausendfacht. Waren es zu jener Zeit noch 300 bis 500 MByte, bietet eine handelsübliche Scheibe nun schon 300 bis 500 GByte Platz – und das zu vergleichbaren Kosten. Zwei oder mehr Festplatten in einem Standard-PC stellen keine Seltenheit mehr dar. Damit kann sich der Heimanwender inzwischen leisten, was früher nur für die Server von Unternehmen bezahlbar war: Datensicherheit im laufenden Betrieb oder doppelte Performance für schnellen Plattenzugriff. Die Technik, die das möglich macht, heißt RAID.

RAID – Eine Einführung

Das Konzept für RAID [1] wurde vor knapp 20 Jahren von den drei Berkley-Doktoranden D. Patterson, G. Gibson und R. Katz entwickelt. RAID war die Lösung einer kniffelige Frage: Benötigte man damals große Datenkapazitäten, hatte man die Wahl zwischen einer einzelnen, sehr groß dimensionierten und relativ ausfallsicheren Festplatte und vielen kleinen, relativ unzuverlässigen Platten. Eine große Einzelplatte war exorbitant teuer, die kleinen Neuentwicklungen dagegen relativ preiswert.

Beim Ersetzen einer großen Festplatte durch mehrere kleine fiel allerdings ein unangemessener hoher Verwaltungsaufwand an. Die drei Doktoranden traten diesem Problem mit einem Konzept entgegen, bei dem sich der Verbund von vielen Festplatten als eine Einheit ansprechen ließ. Gleichzeitig schlugen sie Verfahren vor, die bei einem Ausfall einer einzelnen Platte des Verbundes das Risiko des Datenverlustes deutlich reduzierten. Das Papier der Drei trug den Titel "A Case for Redundant Array of Inexpensive Disks (RAID)", zu deutsch etwa: "Argumente für einen redundant speichernden Verbund preiswerter Festplatten". Als später die kostspieligen großen Festplatten bedeutungslos wurden, ersetzte man das "Inexpensive" durch "Independent" (unabhängig).

Im einfachsten Fall kann man eine bestimmte Anzahl von Festplatten zu einer Einheit zusammenfassen und sie der Anwendungsschicht als eine einzige logische Festplatte präsentieren. Damit erhält man, was Techniker im Jargon gerne als JBOD ("Just a Bundle of Disks") umschreiben. RAID leistet allerdings weit mehr: Als Verwaltungsschicht zwischen Dateisystem und Hardware geschaltet, ermöglicht es, die physikalischen Eigenschaften eines Plattenverbundes geschickt auszunutzten. Dabei erlauben verschiedene Varianten, das Ergebnis in Richtung höherer Performance oder geringerem Ausfallrisiko zu optimieren.

Die verschiedenen Techniken des RAID-Konzepts bezeichnet man als RAID-Level. Das spiegelt jedoch keineswegs eine Art Hierarchie wider, bei den Levels handelt es sich um voneinander unabhängige Konzepte. Es gibt im wesentlichen sieben RAID-Level, die man als RAID 0 bis RAID 7 durchnummeriert. Der Kasten "RAID-Level im Überblick" stellt die einzelnen Level näher vor.

RAID-Level im Überblick

Neben den bekanntesten RAID-Leveln 0 und 1 gibt es eine Vielzahl weiterer Konzepte. Die Originalarbeit von Patterson, Gibson und Katz umfasste die Level 1 bis 5. Später kamen 0 und 6, sowie verschiedene proprietäre Lösungen hinzu. Die RAID-Level 2 bis 4 und 6 sowie 7 sind weniger verbreitet bzw. nahezu bedeutungslos geworden. Aus der Kombination verschiedener Konzepte entstanden die Level 0+1, 10, 30, 15, 50, 51, 55 und RAID-Z. Im folgenden finden Sie einen Überblick zur Funktionsweise der grundlegenden RAID-Level.

RAID 0: Beschleunigung durch Parallelbetrieb

RAID 0 schließt die Platten zusammen und teilt die Arbeit unter den Platten parallel auf. Das beschleunigt die Zugriffe deutlich. Die Gesamtkapazität des Arrays entspricht der Summe der Kapazitäten beider Platten. Auf Grund fehlender Redundanz besteht jedoch ein relativ hohes Ausfallrisiko.

RAID 1: Sicherheit durch Spiegelung

RAID 1 beschreibt alle Festplatten des Verbundes parallel mit identischen Daten. Die Gesamtkapazität des Verbundes entspricht der einer einzigen Platte. Die Lesezugriffe erfolgen in der Regel schneller, die Schreibzugriffe in etwa gleich schnell wie auf einer einzelnen Platte.

RAID 2: Plattenbausiedlung

RAID 2 wurde früher auf Großrechnern implementiert und ist heute nahezu bedeutungslos. Die Mindestgröße eines RAID-2-Verbunds liegt bei 10 Festplatten. Durch die elegante Art der Fehlerprüfung lassen sich neben einem Totalausfall einer Platte auch Schreibfehler entdecken. Bei 10 Platten liegt das Verhältnis der Zugriffszeiten von Schreiben zu Lesen bei 1 zu 8 gegenüber einer Einzelplatte.

RAID 3: Striping mit Kontrolle

Indem man die Daten der Festplatten bitweise miteinander addiert und das Ergebnis speichert, kann man die Daten einer ausgefallenen Festplatte aus den noch vorhandenen Daten und den Additionsergebnissen rekonstruieren. Das Additionsergebnis nennt man Parität. RAID 3 lagert die Paritätsdaten des Verbundes auf einer eigenen Festplatte. Diese Paritätsfestplatte wird ungleich mehr beansprucht als die Datenplatten, statistisch fällt sie daher zuerst aus.

RAID 4: RAID 3 für die Kleinen

RAID-4 stellt eine geringfügige Modifikation von RAID 3 dar: Während RAID 3 mit Byte-weisem Striping operiert, verarbeitet RAID 4 jeweils einen ganzer Nutzdatenblock. Damit kann RAID 4 wesentlich effektiver mit kleinen Dateien umgehen, während RAID 3 erst bei großen zusammenhängenden Dateien Vorteile bringt. RAID 4 verwendet wie RAID 3 eine eigene Festplatte für die Paritätsinformationen.

RAID 5: Sichere Lese-Performance

RAID 5 bietet die preiswerteste Variante der redundanten Datenhaltung: Bei mindestens drei Platten im Verbund bietet es 66 Prozent der Gesamtkapazität für Nutzdaten – im Gegensatz zu nur 50 Prozent bei RAID 1. Mit steigender Plattenanzahl verbessert sich dieses Verhältnis noch. RAID 5 verteilt Daten und Paritätsinformationen gleichmäßig auf alle beteiligten Platten, sodass alle Disks in etwa gleich beansprucht werden. Ein Wiederaufbau des RAIDs nach einem Defekt einer Platte ist deutlich langsamer als bei RAID 1.

RAID Kombinationen

Je nach Anwendungsfall lassen sich die RAID-Basislevel beinahe beliebig kombinieren. RAID 10 beispielsweise erstellt ein RAID 0 über zwei RAID-1-Verbünde. RAID 1 sorgt dabei durch Redundanz für Datensicherheit durch Redundanz, RAID 0 für Performance. Stehen mindestens sechs Festplatten zur Verfügung, ist eine Kombination von RAID 5 und 0 (RAID 50) noch wirtschaftlicher.

Für den privaten Einsatz sind vor allem die RAID-Level 0 und 1 von Bedeutung. Level 0 bezeichnet man auch als Striping, es steht für maximale Performance. Level 1 deckt den Bedarf nach höherer Ausfallsicherheit und wird als Mirroring bezeichnet. Für Anwender, die sich nicht zwischen Performance und Sicherheit entscheiden können, gibt es noch ein spezielles RAID-Level für den Heimbedarf: RAID 1.5. Es stellt allerdings einen Kompromiss dar: Um die Eigenschaften von Level 0 und Level 1 zu verknüpfen, benötigt man eigentlich mindestens vier Festplatten. RAID 1.5 kombiniert die Level 0 und 1 auf nur zwei Festplatten und bietet der Anwendungsschicht die jeweiligen RAID-Disks separat an. Abbildung 1 stellt die drei Level schematisch dar.

Performance mit Striping

Beim Striping (RAID 0) werden die Festplatten quasi hintereinander aufgereiht und jeweils blockweise (in "Streifen") abwechselnd angesprochen. Gilt es Daten zu schreiben, dann verteilt der RAID-Controller die Arbeit auf die beteiligten Platten. Da die Schreib- und Lesezugriffe parallel auf allen Platten erfolgen, verkürzen sich die Zugriffszeiten erheblich.

Technisch gesehen, legt der Controller die Daten lediglich beim jeweiligen Festplatten-Cache ab geht sofort zur nächsten Platte über. Ist die erste Platte wieder an der Reihe, hatte sie inzwischen genügend Zeit zur Ausführung der Aufträge und steht mit den Rückgabewerten wieder zur Verfügung. Bei der Verwendung von zwei Festplatten halbiert sich theoretisch die Zugriffszeit.

Teil 1 der Abbildung 1 demonstriert diesen Vorgang anhand der Aufteilung der Zeichen des Satzes "Und sie dreht sich doch!" auf die beiden Festplatten. Auf jeder Platte befindet sich nur ein Teil der Daten. Fällt eine der Disks aus, lassen sich die Daten allerdings nicht wieder herstellen.

RAID 0 nimmt die Aufteilung der Daten auf die einzelnen Platten nicht zeichenweise, sondern in Datenblöcken mit einer gewissen Striping-Granularität vorgenommen. Die Wahrscheinlichkeit eines Ausfalls erhöht sich mit der steigenden Anzahl beteiligter Festplatten. Striping empfiehlt sich daher für Systeme, bei denen es mehr auf Geschwindigkeit als auf Ausfallsicherheit ankommt.

LinuxCommunity kaufen

Einzelne Ausgabe
 
Abonnements
 

Ähnliche Artikel

  • Doppeltes Volumen
    Ganz ohne zusätzliche Hardware und Kosten sorgt Linux bei der Verwaltung der Datenträger durch RAID-Support für Ausfallsicherheit und mittels LVM für ein flexibles Partitionsmanagent.
  • Fünf SATA-RAID-Controller im Test
    Der Ausfall einer einzigen Festplatte und der damit verbundene Zeitverlust bringt Selbständige oder Studenten schnell in Bedrängnis. Für wenige Euro versprechen RAID-Systeme eine zusätzliche Absicherung. Der Test zeigt, wann der Aufwand lohnt.
  • 1,25-TByte-Array von Lacie
    Mancher Benutzer speichert heute bereits mehrere Tausend Musikstücke auf seinem Computer. Doch was tun, wenn man die gleiche Menge an Videos speichern will? Eine mögliche Antwort heißt Biggest S2S und kommt vom Storage-Spezialisten Lacie.
  • Lichtblick am Horizont
    Zwar verhindern lizenzrechtliche Gründe die Integration von Suns ZFS in den Linux-Kernel – über einen Trick kommen aber auch Linux-Anwender in den Genuss des viel gelobten Dateisystems.
  • Tux in Black
    Mit bis zu 8 TByte Kapazität bietet Buffalos Terastation III reichlich Platz für Daten aller Art. Das kompakte NAS auf Linux-Basis beherrscht zudem alle gängigen Netzwerkprotokolle.
Kommentare

Infos zur Publikation

LU 01/2015: E-Books im Griff

Digitale Ausgabe: Preis € 4,95
(inkl. 19% MwSt.)

Mit der Zeitschrift LinuxUser sind Sie als Power-User, Shell-Guru oder Administrator im kleinen Unternehmen monatlich auf dem aktuelle Stand in Sachen Linux und Open Source.

Sie sind sich nicht sicher, ob die Themen Ihnen liegen? Im Probeabo erhalten Sie drei Ausgaben zum reduzierten Preis. Einzelhefte, Abonnements sowie digitale Ausgaben erwerben Sie ganz einfach in unserem Online-Shop.

NEU: DIGITALE AUSGABEN FÜR TABLET & SMARTPHONE

HINWEIS ZU PAYPAL: Die Zahlung ist auch ohne eigenes Paypal-Konto ganz einfach per Kreditkarte oder Lastschrift möglich!       

Tipp der Woche

Ubuntu 14.10 und VirtualBox
Ubuntu 14.10 und VirtualBox
Tim Schürmann, 08.11.2014 18:45, 0 Kommentare

Wer Ubuntu 14.10 in einer virtuellen Maschine unter VirtualBox startet, der landet unter Umständen in einem Fenster mit Grafikmüll. Zu einem korrekt ...

Aktuelle Fragen

PCLinuxOS Version 2014.08 "FullMonty" Umstellung auf deutsch
Karl-Heinz Welz, 19.12.2014 09:55, 3 Antworten
Hallo, liebe Community, ich bin 63 Jahre alt und möchte jetzt nach Jahrzehnten Windows zu Linux...
ICEauthority
Thomas Mann, 17.12.2014 14:49, 2 Antworten
Fehlermeldung beim Start von Linux Mint: Could not update ICEauthority file / home/user/.ICEauth...
Linux einrichten
Sigrid Bölke, 10.12.2014 10:46, 5 Antworten
Hallo, liebe Community, bin hier ganz neu,also entschuldigt,wenn ich hier falsch bin. Mein Prob...
Externe USB-Festplatte mit Ext4 formatiert, USB-Stick wird nicht mehr eingebunden
Wimpy *, 02.12.2014 16:31, 0 Antworten
Hallo, ich habe die externe USB-FP, die nur für Daten-Backup benutzt wird, mit dem YaST-Partition...
Steuern mit Linux
Siegfried Markner, 01.12.2014 11:56, 2 Antworten
Welches Linux eignet sich am besten für Steuerungen.