PO-20342-Fotolia-Sebastian_Kaulitzki_Fotolia-Kartons.jpg

© Sebastian Kaulitzki, Fotolia

Clever schachteln

Das neue Linux-Dateisystem Btrfs im Detail

11.03.2009
Btrfs bringt alles mit, was die großen Spieler im Linux-Business von einem Dateisystem erwarten: Es ist schnell, erweiterbar und flexibel. Dieser Artikel stellt Ihnen das neue Linux-Dateisystem vor.

Das Dateisystem Btrfs stammt von Chris Mason [1] und entstand ursprünglich unter den Fittichen von Oracle. Mason beantragte im Dezember 2008 die Integration in den Kernel, was nach einer kurzen Diskussion auch klappte. Btrfs gehört somit ab Kernel 2.6.29 zu den offiziellen unterstützten Linux-Dateisystemen. Das als Journaling-Filesystem ausgelegte Btrfs benutzt klassische B-Trees zur Datenspeicherung. Zu den wichtigsten Features gehören Copy on Write (COW), Snapshots und integrierter RAID-Support. Der Kasten "Dateisystem-Grundlagen" erklärt einige Grundbegriffe zu Dateisystemen.

Chris Mason arbeitete früher bei Suse und war unter anderem für den Support von ReiserFS verantwortlich – er kennt sich somit mit dem Thema Dateisysteme bestens aus. Parallel zu Btrfs arbeitet Oracle auch an dem neuen Netzwerkdateisystem "Coherent Remote File System" (Crfs) [2], das ebenfalls über Snapshot-Fähigkeiten verfügen soll. Es befindet sich aber noch in einem sehr frühen Entwicklungsstadium.

Auch Btrfs selbst muss man noch mit aller Vorsicht benutzen: Das Dateisystemformat dürfte sich in den nächsten Monaten noch ändern, wodurch die Kompatibilität zwischen alten und neuen Btrfs-Volumen verlorengeht.

Dateisystem-Grundlagen

Ein Dateisystem stellt man sich am besten als ein Regal mit sehr vielen Kisten vor. In jeder davon befinden sich weitere Kisten, die ihrerseits wiederum kleinere Kisten enthalten können. Die kleinsten Kisten sind so groß wie die Blockgröße des Dateisystems, in den meisten Fällen also 4 KByte.

Steht man nun vor dem Regal und hat die Aufgabe, etwas darin zu verstauen, muss man sich entscheiden, in welche Kiste man es packt. Eine Strategie besteht darin, eine Kiste so gut wie möglich voll zu packen, dann die nächste zu füllen und so weiter. Eine andere Herangehensweise wäre, so wenig Kisten wie möglich öffnen zu müssen. Damit Sie die verstauten Gegenstände so schnell wie möglich wieder finden, schreiben Sie dann auf eine Kiste zum Beispiel "Lego" oder "Buntstifte". Die Informationen, was sich wo befindet, nennt man Metadaten, die Legosteine entsprechen dann den Daten.

Das Dateisystem kämpft mit ähnlichen Problemen, es legt Dateifragmente in so genannten Bäumen ab. Btrfs nutzt dazu B-Bäume (B-Tree-FS). Ein Baum besteht aus Blättern ("leaves") und Verzweigungen/Knoten ("nodes"). B-Trees versuchen, den Baum so flach wie möglich zu halten, um die Schreib- und Lesezugriffe zu beschleunigen. B+-Bäume speichern die Metadaten nur in den Knoten, die eigentlichen Daten in den Blättern. Traditionelle B-Bäume, wie sie auch Btrfs benutzt, halten sich nicht streng daran. Im Unterschied zu den fest vorgegebenen H-Bäumen, wie sie zum Beispiel Ext4 benutzt, legt Btrfs die Anzahl der möglichen Knoten und Blätter nicht beim Anlegen des Dateisystems fest, sondern bei Bedarf dynamisch. Die Zahl der möglichen Dateien pro Dateisystem hängt deshalb nicht von der Größe des Speichermediums ab.

Wie bei den meisten aktuellen Dateisystemen handelt es sich auch bei Btrfs ein so genanntes Journaling-Filesystem: Das bedeutet, dass das Dateisystem über sämtliche Dateioperationen Buch führt und so verhindert, dass eine Datei in einem nicht benutzbaren Zustand verbleibt. Dazu schreibt das Filesystem die Dateien zunächst in den Journal-Bereich, und erst wenn dieser Vorgang erfolgreich war, frischt es die Informationen dazu auf.

Traditionelle Dateisysteme überschreiben beim Speichern einer Datei die vorhandenen Datenblöcke. Ändert sich dabei die Größe einer Datei, benutzt das Dateisystem freie Blöcke in der unmittelbaren Nähe. Je nachdem, wie viel Zeit zwischen dem ersten Speichern und dem Überschreiben verging, kann diese "unmittelbare Nähe" schon ganz weit entfernt sein – der Lesekopf muss somit größere Distanzen zurücklegen. Moderne Dateisysteme schreiben Daten stets an einen freien Ort, bei jedem Speichern wird somit eine neue Kopie angelegt. Diesen Mechanismus nennt man Copy on Write. COW bringt mehr Performance, da der Lesekopf die Daten in der Regel am Stück einlesen kann, und als nützliche Zusatzfunktion eine Versionsverwaltung: Die ursprünglichen Daten sind ja noch vorhanden.

Installation

Wer Btrfs ausprobieren möchte, nutzt dazu am besten den Kernel 2.6.29, der das Dateisystem bereits mitbringt. Damit der Kernel das Dateisystem nutzt, muss in der .config-Datei ein Eintrag CONFIG_BTRFS_FS=y vorhanden sein. Für diesen Artikel und die Tests im Dateisystem-Benchmark-Artikel kompilierten wir den Kernel 2.6.29-rc4 unter OpenSuse in der 64-Bit-Version. Btrfs übersetzten wir als Modul inklusive ACL-Support (CONFIG_BTRFS_FS_POSIX_ACL=y).

Neben dem Kernelmodul benötigt man auch die entsprechenden Tools, um Btrfs-Dateisysteme anzulegen und zu verwalten. Diese findet man auf Kernel.org [3]. Wir nutzten Version 0.18 der btrfs-progs vom 17. Januar 2009. Sowohl der Kernel als auch btrfs-progs ließen sich problemlos kompilieren.

Vorteile von Btrfs

Während Ext4 Dateien und Dateisysteme von maximal 1 Exabyte unterstützt, sind es bei Btrfs gleich 16 EByte (16 Millionen TByte). Die eigentlichen Vorteile liegen aber nicht beim typischen "schneller" und "besser", sondern bei den Features: Btrfs lässt sich ohne zusätzliches Volume-Management oder Software-RAID über mehrere Datenträger hinweg als RAID 0, RAID 1 oder RAID 10 nutzen. Dazu ruft man einfach mkfs.btrfs mit den gewünschten Gerätedateien auf und legt danach den RAID-Modus fest:

# mkfs.btfs /dev/sdb /dev/sdc
# mkfs.btrfs -m raid1 /dev/sdb /dev/sdc

Weitere Festplatten lassen sich bei Bedarf auch im laufenden Betrieb (online) hinzufügen beziehungsweise entfernen.

Im Gegensatz zu Ext4, das nur das Journal mit Prüfsummen versieht, erzeugt Btrfs für alle Dateien eine Prüfsumme (aktuell per CRC32C). Über diese Checksumme kann das Dateisystem fehlerhafte Dateien praktisch sofort erkennen, was bei Dateisystemen von mehreren Terabyte enorm wichtig ist, um lange Dateisystemchecks zu vermeiden.

Ein weiterer Vorteil gegenüber Ext4 besteht in der dynamischen Vergabe von Inodes. Ext3 legt diese beim Formatieren an, die Größe des Datenträgers bestimmt somit die Anzahl Inodes. Da sich aber pro Inode nur eine Datei respektive ein Verzeichnis speichern lässt, kann es bei Ext3 vorkommen, dass man keinen neuen Dateien mehr anlegen darf, obwohl auf der Platte noch freier Platz bleibt. Ext4 kann zwar deutlich mehr Inodes vergeben und umgeht durch die Extents auch das Ext3-Limit von 32 000 Unterverzeichnissen; die Zahl der Inodes bleibt aber weiterhin durch das anfängliche Formatieren festgelegt. Btrfs vergibt sie dagegen komplett dynamisch: Erst, wenn eine Datei auf die Platte geschrieben wird, teilt ihr das Dateisystem einen Inode zu.

LinuxCommunity kaufen

Einzelne Ausgabe
 
Abonnements
 

Ähnliche Artikel

Kommentare

Infos zur Publikation

LU 01/2015: E-Books im Griff

Digitale Ausgabe: Preis € 4,95
(inkl. 19% MwSt.)

Mit der Zeitschrift LinuxUser sind Sie als Power-User, Shell-Guru oder Administrator im kleinen Unternehmen monatlich auf dem aktuelle Stand in Sachen Linux und Open Source.

Sie sind sich nicht sicher, ob die Themen Ihnen liegen? Im Probeabo erhalten Sie drei Ausgaben zum reduzierten Preis. Einzelhefte, Abonnements sowie digitale Ausgaben erwerben Sie ganz einfach in unserem Online-Shop.

NEU: DIGITALE AUSGABEN FÜR TABLET & SMARTPHONE

HINWEIS ZU PAYPAL: Die Zahlung ist auch ohne eigenes Paypal-Konto ganz einfach per Kreditkarte oder Lastschrift möglich!       

Tipp der Woche

Ubuntu 14.10 und VirtualBox
Ubuntu 14.10 und VirtualBox
Tim Schürmann, 08.11.2014 18:45, 0 Kommentare

Wer Ubuntu 14.10 in einer virtuellen Maschine unter VirtualBox startet, der landet unter Umständen in einem Fenster mit Grafikmüll. Zu einem korrekt ...

Aktuelle Fragen

PCLinuxOS Version 2014.08 "FullMonty" Umstellung auf deutsch
Karl-Heinz Welz, 19.12.2014 09:55, 3 Antworten
Hallo, liebe Community, ich bin 63 Jahre alt und möchte jetzt nach Jahrzehnten Windows zu Linux...
ICEauthority
Thomas Mann, 17.12.2014 14:49, 2 Antworten
Fehlermeldung beim Start von Linux Mint: Could not update ICEauthority file / home/user/.ICEauth...
Linux einrichten
Sigrid Bölke, 10.12.2014 10:46, 5 Antworten
Hallo, liebe Community, bin hier ganz neu,also entschuldigt,wenn ich hier falsch bin. Mein Prob...
Externe USB-Festplatte mit Ext4 formatiert, USB-Stick wird nicht mehr eingebunden
Wimpy *, 02.12.2014 16:31, 0 Antworten
Hallo, ich habe die externe USB-FP, die nur für Daten-Backup benutzt wird, mit dem YaST-Partition...
Steuern mit Linux
Siegfried Markner, 01.12.2014 11:56, 2 Antworten
Welches Linux eignet sich am besten für Steuerungen.