Home / LinuxUser / 2006 / 04 / Desktop-RAID

Newsletter abonnieren

Lies uns auf...

Folge LinuxCommunity auf Twitter

Top-Beiträge

Mandriva gibt Distribution in die Hände der Community
(268 Punkte bei 24 Stimmen)
Neues vom Systemd
(179 Punkte bei 5 Stimmen)
Mandriva in Nöten
(161 Punkte bei 4 Stimmen)
Mageia 2 ist fertig
(161 Punkte bei 4 Stimmen)

Heftarchiv

LinuxUser Heftarchiv

EasyLinux Heftarchiv

Ubuntu User Heftarchiv

Ubuntu User Heftarchiv

Partner-Links:

Shopping
Topsuche
 
Yatego Deutschlands größte Shoppingmall. 10000 Shops,
3.5 Mio Artikel. Alle Bestseller, Servertechnik und Technik Themenwelten.

Notebooks und Netzwerkhardware bei Mercateo günstig kaufen.
Internet Telefonie mit VoIP Telefonen von Gigaset
Das B2B Portal www.Linx.de informiert über Produkte und Dienstleistungen.
Günstige Digitalkameras finden Sie im Preisvergleich.

Easy Raider

Desktop-RAID

01.04.2006 RAID verspricht rasante Plattenzugriffe und optimale Datensicherheit. Mit Linux ist das auch auf dem Desktop kein Problem.

In den letzten 15 Jahren hat sich die Festplattenkapazität fast vertausendfacht. Waren es zu jener Zeit noch 300 bis 500 MByte, bietet eine handelsübliche Scheibe nun schon 300 bis 500 GByte Platz – und das zu vergleichbaren Kosten. Zwei oder mehr Festplatten in einem Standard-PC stellen keine Seltenheit mehr dar. Damit kann sich der Heimanwender inzwischen leisten, was früher nur für die Server von Unternehmen bezahlbar war: Datensicherheit im laufenden Betrieb oder doppelte Performance für schnellen Plattenzugriff. Die Technik, die das möglich macht, heißt RAID.

RAID – Eine Einführung

Das Konzept für RAID [1] wurde vor knapp 20 Jahren von den drei Berkley-Doktoranden D. Patterson, G. Gibson und R. Katz entwickelt. RAID war die Lösung einer kniffelige Frage: Benötigte man damals große Datenkapazitäten, hatte man die Wahl zwischen einer einzelnen, sehr groß dimensionierten und relativ ausfallsicheren Festplatte und vielen kleinen, relativ unzuverlässigen Platten. Eine große Einzelplatte war exorbitant teuer, die kleinen Neuentwicklungen dagegen relativ preiswert.

Beim Ersetzen einer großen Festplatte durch mehrere kleine fiel allerdings ein unangemessener hoher Verwaltungsaufwand an. Die drei Doktoranden traten diesem Problem mit einem Konzept entgegen, bei dem sich der Verbund von vielen Festplatten als eine Einheit ansprechen ließ. Gleichzeitig schlugen sie Verfahren vor, die bei einem Ausfall einer einzelnen Platte des Verbundes das Risiko des Datenverlustes deutlich reduzierten. Das Papier der Drei trug den Titel "A Case for Redundant Array of Inexpensive Disks (RAID)", zu deutsch etwa: "Argumente für einen redundant speichernden Verbund preiswerter Festplatten". Als später die kostspieligen großen Festplatten bedeutungslos wurden, ersetzte man das "Inexpensive" durch "Independent" (unabhängig).

Im einfachsten Fall kann man eine bestimmte Anzahl von Festplatten zu einer Einheit zusammenfassen und sie der Anwendungsschicht als eine einzige logische Festplatte präsentieren. Damit erhält man, was Techniker im Jargon gerne als JBOD ("Just a Bundle of Disks") umschreiben. RAID leistet allerdings weit mehr: Als Verwaltungsschicht zwischen Dateisystem und Hardware geschaltet, ermöglicht es, die physikalischen Eigenschaften eines Plattenverbundes geschickt auszunutzten. Dabei erlauben verschiedene Varianten, das Ergebnis in Richtung höherer Performance oder geringerem Ausfallrisiko zu optimieren.

Die verschiedenen Techniken des RAID-Konzepts bezeichnet man als RAID-Level. Das spiegelt jedoch keineswegs eine Art Hierarchie wider, bei den Levels handelt es sich um voneinander unabhängige Konzepte. Es gibt im wesentlichen sieben RAID-Level, die man als RAID 0 bis RAID 7 durchnummeriert. Der Kasten "RAID-Level im Überblick" stellt die einzelnen Level näher vor.

RAID-Level im Überblick

Neben den bekanntesten RAID-Leveln 0 und 1 gibt es eine Vielzahl weiterer Konzepte. Die Originalarbeit von Patterson, Gibson und Katz umfasste die Level 1 bis 5. Später kamen 0 und 6, sowie verschiedene proprietäre Lösungen hinzu. Die RAID-Level 2 bis 4 und 6 sowie 7 sind weniger verbreitet bzw. nahezu bedeutungslos geworden. Aus der Kombination verschiedener Konzepte entstanden die Level 0+1, 10, 30, 15, 50, 51, 55 und RAID-Z. Im folgenden finden Sie einen Überblick zur Funktionsweise der grundlegenden RAID-Level.

RAID 0: Beschleunigung durch Parallelbetrieb

RAID 0 schließt die Platten zusammen und teilt die Arbeit unter den Platten parallel auf. Das beschleunigt die Zugriffe deutlich. Die Gesamtkapazität des Arrays entspricht der Summe der Kapazitäten beider Platten. Auf Grund fehlender Redundanz besteht jedoch ein relativ hohes Ausfallrisiko.

RAID 1: Sicherheit durch Spiegelung

RAID 1 beschreibt alle Festplatten des Verbundes parallel mit identischen Daten. Die Gesamtkapazität des Verbundes entspricht der einer einzigen Platte. Die Lesezugriffe erfolgen in der Regel schneller, die Schreibzugriffe in etwa gleich schnell wie auf einer einzelnen Platte.

RAID 2: Plattenbausiedlung

RAID 2 wurde früher auf Großrechnern implementiert und ist heute nahezu bedeutungslos. Die Mindestgröße eines RAID-2-Verbunds liegt bei 10 Festplatten. Durch die elegante Art der Fehlerprüfung lassen sich neben einem Totalausfall einer Platte auch Schreibfehler entdecken. Bei 10 Platten liegt das Verhältnis der Zugriffszeiten von Schreiben zu Lesen bei 1 zu 8 gegenüber einer Einzelplatte.

RAID 3: Striping mit Kontrolle

Indem man die Daten der Festplatten bitweise miteinander addiert und das Ergebnis speichert, kann man die Daten einer ausgefallenen Festplatte aus den noch vorhandenen Daten und den Additionsergebnissen rekonstruieren. Das Additionsergebnis nennt man Parität. RAID 3 lagert die Paritätsdaten des Verbundes auf einer eigenen Festplatte. Diese Paritätsfestplatte wird ungleich mehr beansprucht als die Datenplatten, statistisch fällt sie daher zuerst aus.

RAID 4: RAID 3 für die Kleinen

RAID-4 stellt eine geringfügige Modifikation von RAID 3 dar: Während RAID 3 mit Byte-weisem Striping operiert, verarbeitet RAID 4 jeweils einen ganzer Nutzdatenblock. Damit kann RAID 4 wesentlich effektiver mit kleinen Dateien umgehen, während RAID 3 erst bei großen zusammenhängenden Dateien Vorteile bringt. RAID 4 verwendet wie RAID 3 eine eigene Festplatte für die Paritätsinformationen.

RAID 5: Sichere Lese-Performance

RAID 5 bietet die preiswerteste Variante der redundanten Datenhaltung: Bei mindestens drei Platten im Verbund bietet es 66 Prozent der Gesamtkapazität für Nutzdaten – im Gegensatz zu nur 50 Prozent bei RAID 1. Mit steigender Plattenanzahl verbessert sich dieses Verhältnis noch. RAID 5 verteilt Daten und Paritätsinformationen gleichmäßig auf alle beteiligten Platten, sodass alle Disks in etwa gleich beansprucht werden. Ein Wiederaufbau des RAIDs nach einem Defekt einer Platte ist deutlich langsamer als bei RAID 1.

RAID Kombinationen

Je nach Anwendungsfall lassen sich die RAID-Basislevel beinahe beliebig kombinieren. RAID 10 beispielsweise erstellt ein RAID 0 über zwei RAID-1-Verbünde. RAID 1 sorgt dabei durch Redundanz für Datensicherheit durch Redundanz, RAID 0 für Performance. Stehen mindestens sechs Festplatten zur Verfügung, ist eine Kombination von RAID 5 und 0 (RAID 50) noch wirtschaftlicher.

Für den privaten Einsatz sind vor allem die RAID-Level 0 und 1 von Bedeutung. Level 0 bezeichnet man auch als Striping, es steht für maximale Performance. Level 1 deckt den Bedarf nach höherer Ausfallsicherheit und wird als Mirroring bezeichnet. Für Anwender, die sich nicht zwischen Performance und Sicherheit entscheiden können, gibt es noch ein spezielles RAID-Level für den Heimbedarf: RAID 1.5. Es stellt allerdings einen Kompromiss dar: Um die Eigenschaften von Level 0 und Level 1 zu verknüpfen, benötigt man eigentlich mindestens vier Festplatten. RAID 1.5 kombiniert die Level 0 und 1 auf nur zwei Festplatten und bietet der Anwendungsschicht die jeweiligen RAID-Disks separat an. Abbildung 1 stellt die drei Level schematisch dar.

Abbildung 1: Eine schematische Darstellung von Striping (RAID-0), Mirroring (RAID-1) und RAID-1.5.

Performance mit Striping

Beim Striping (RAID 0) werden die Festplatten quasi hintereinander aufgereiht und jeweils blockweise (in "Streifen") abwechselnd angesprochen. Gilt es Daten zu schreiben, dann verteilt der RAID-Controller die Arbeit auf die beteiligten Platten. Da die Schreib- und Lesezugriffe parallel auf allen Platten erfolgen, verkürzen sich die Zugriffszeiten erheblich.

Technisch gesehen, legt der Controller die Daten lediglich beim jeweiligen Festplatten-Cache ab geht sofort zur nächsten Platte über. Ist die erste Platte wieder an der Reihe, hatte sie inzwischen genügend Zeit zur Ausführung der Aufträge und steht mit den Rückgabewerten wieder zur Verfügung. Bei der Verwendung von zwei Festplatten halbiert sich theoretisch die Zugriffszeit.

Teil 1 der Abbildung 1 demonstriert diesen Vorgang anhand der Aufteilung der Zeichen des Satzes "Und sie dreht sich doch!" auf die beiden Festplatten. Auf jeder Platte befindet sich nur ein Teil der Daten. Fällt eine der Disks aus, lassen sich die Daten allerdings nicht wieder herstellen.

RAID 0 nimmt die Aufteilung der Daten auf die einzelnen Platten nicht zeichenweise, sondern in Datenblöcken mit einer gewissen Striping-Granularität vorgenommen. Die Wahrscheinlichkeit eines Ausfalls erhöht sich mit der steigenden Anzahl beteiligter Festplatten. Striping empfiehlt sich daher für Systeme, bei denen es mehr auf Geschwindigkeit als auf Ausfallsicherheit ankommt.

Einem Freund empfehlen    Druckansicht Bookmark and Share
Kommentare

1191 Hits
Wertung: 69 Punkte (1 Stimme)

Schlecht Gut

Infos zum Autor


Infos zur Publikation

Infos zur Publikation

LinuxUser 06/2012

Aktuelle Ausgabe kaufen:

Heft bestellen Heft als PDF kaufen

LinuxUser erscheint monatlich und kostet in der Nomedia-Ausgabe EUR 5,50 und mit DVD EUR 8,50. Weitere Informationen zum Heft finden Sie auf der LinuxUser-Homepage.

Im LinuxUser-Probeabo erhalten Sie drei Ausgaben für 3 Euro. Das Jahresabo (ab EUR 56,10) können Sie im LNM-Shop bestellen.

Tipp der Woche

Adobe AIR
Adobe-AIR-Programme installieren und (manuell) starten
Tim Schürmann, 14.05.2012 13:09, 0 Kommentare

Es gibt sie noch: neue Anwendungen, die Adobes Integrated Runtime voraussetzen. Aktuellstes und vermutlich auch größtes Beispiel ist das Adventure Botanicula

Aktuelle Fragen

gibt es ein Kommandozeilen Tool, um ein X11-Fenster in ein Anderes einzubetten?
GoaSkin , 21.05.2012 16:44, 0 Antworten
Das XEmbed-Protokoll ist u.A. dazu gedacht, dass man eine X11-Anwendung in eine andere wie ein Wi...
Apache2, Options -Indexes geht nicht
no no, 12.05.2012 19:01, 8 Antworten
Habe in apache2.conf folgendes stehen: Options -Indexes ...
LInux auf Dell LS H500
Andreas Endresl, 09.05.2012 08:54, 2 Antworten
Habe einen alten Dell Latitude LS H500 nur mit ext. Floppy und CD es geht nur immer eines von den...
Datenwiederherstellung unter Ubuntu 12.04 mit "Simple Backup" nach Umzug von Linux Mint
Christian Lottmann, 07.05.2012 13:33, 0 Antworten
Vor dem Umzug auf Ubuntu 12.04 habe ich unter Linux MInt mit "Simple Backup" voll (15.4.2012) und...
DKMS für den propritären NVIDIA-Treiber
Commander Data, 26.04.2012 22:02, 2 Antworten
Hallo an die Gemeinde. Ich habe hier ein interessantes Stück openSuSE gefunden. http://forums.op...