Für sechs Stunden standen bei Facebook die Räder still, nichts ging mehr. Der Ausfall kostet das Unternehmen Millionen von Dollar. Uns Linux-User sollte der Crash daran erinnern, nicht zu sorglos mit unseren Systemen zu hantieren und Backups nicht zu vergessen, meint Redakteur Christoph Langner.
Sehr geehrte Leserinnen und Leser,
Nobody is perfect, jeder macht mal Fehler. Doch es gibt Fehler und es gibt kapitale Böcke. Zur zweiten, signifikanten Kategorie dürfte wohl die Ursache hinter dem Ausfall aller Facebook-Dienste Anfang Oktober gehören – Facebook, Instagram und Whatsapp waren über Stunden nicht zu erreichen. In der von Facebook selbst veröffentlichten Post-mortem-Analyse [1] erklärt Santosh Janardhan, Vizepräsident für Entwicklung und Infrastruktur, dass ein einziges fehlgeleitetes Kommando für die Störung verantwortlich war. Der Befehl hätte eigentlich die Verfügbarkeit des weltweiten Backbones bewerten sollen, stattdessen klemmte er Router vom Backbone-Netz des Unternehmens ab. Nichts ging mehr.
Facebook ist sich durchaus bewusst, dass Administratoren nicht einfach wild kritische Kommandos auf den Systemen ausführen können sollten. Daher gibt es ein internes Audit-System, das problematische Aktionen abfängt – zumindest in der Theorie. Doch der Überwachungsmechanismus hatte wohl einen schlechten Tag und verhinderte die fatale Aktion nicht. Die Folgen wird selbst Facebook in seinem Geldbeutel spüren. Bei einem Gewinn von über 10 Milliarden US-Dollar im zweiten Quartal 2021 [2] dürfte der sechsstündige Ausfall aller Facebook-Dienste das Unternehmen über 25 Millionen Dollar gekostet haben. Schlimmer wiegt jedoch der Gesichtsverlust. Neben all den Skandalen, der öffentlichen Kritik am Missbrauch seiner Macht, versagt nun auch die Technik des Unternehmens.
Janardhan nimmt die Situation recht sportlich: Man übe regelmäßig den Ausfall kritischer Infrastruktur, doch einen globalen Ausfall des Backbones hatte man zuvor noch nicht simuliert. Letztendlich habe man jedoch alle Systeme relativ schnell wieder ans Netz bringen können. Um dabei die Stromversorgung der Rechenzentren nicht zu gefährden, musste man dabei jedoch mit Vorsicht agieren und die Systeme nach und nach hochfahren. Für zusätzliche Verzögerung sorgten die Sicherheitsmaßnahmen in den Rechenzentren: Selbst die hauseigenen Techniker können vor Ort nicht so einfach in die Rechenzentren spazieren. Die Server und Router sind zudem so aufgebaut, dass sie sich selbst mit direktem Zugang nicht so einfach manipulieren lassen.
Als Linux-User und Admin unserer eigenen Systeme und Netzwerkinfrastruktur sollte der Facebook-Crash eine Warnung sein: Wir müssen uns wenig um Viren und Trojaner sorgen, doch allzu oft befindet sich das Problem zwischen Tastatur und Stuhl (“PEBKAC” – “Problem Exists Between Keyboard And Chair”). Ich selbst habe schon einmal versehentlich mit dd if=/dev/zero of=/dev/sda eine ganze Festplatte genullt, obwohl ich doch eigentlich nur den Inhalt der Partition /dev/sda2 löschen wollte. Zusammen mit der Eingabetaste hatte ich aus Versehen Backspace getroffen und die Zahl aus der Gerätekennung gelöscht. Mit viel Mühe konnte ich Teile der überschriebenen Daten wiederherstellen, manches ging jedoch unwiederbringlich verloren. Auch für eine solche Aktion gibt es im IT-Jargon eine nette Umschreibung: Fat-Finger-Fehler [3].
Der einzig nachhaltige Schutz gegen die eigene Dummheit und den unbeholfenen Leichtsinn sind Backups und Sicherheitskopien. Doch sind wir mal ehrlich: Wer kümmert sich regelmäßig um die Sicherung der eigenen Daten? Wer wirft alle paar Tage ein Backup an, spätestens nach ein paar Wochen? Und wer achtet darauf, dass das Backup auch sicher gelagert ist? Schließlich nützt die beste Sicherungsstrategie nichts, wenn man Laptop und Backup-Festplatte mit der fertigen Master-Arbeit im Rucksack transportiert und den dann in der Straßenbahn vergisst [4]. In diesem Heft finden Sie daher im Schwerpunkt die Besprechungen einiger Programme, mit denen Sie Daten einfach zwischen Rechnern abgleichen. Mit EasyNAS stellen wir zudem eine Netzwerkspeichersoftware vor, mit der Sie aus einem betagten Rechner schnell ein funktionierendes Network-Attached-Storage-System aufbauen.
Ich wünsche Ihnen auf jeden Fall wieder viel Spaß bei der Lektüre der aktuellen Ausgabe – und bleiben Sie gesund!
Herzliche Grüße,
Christoph Langner
Redakteur
Infos
-
“More details about the October 4 outage”: https://engineering.fb.com/2021/10/05/networking-traffic/outage-details
-
Gewinn/Verlust von Facebook weltweit bis zum 2. Quartal 2021: https://de.statista.com/statistik/daten/studie/237450/umfrage/gewinn-von-facebook-weltweit-quartalszahlen
-
Fat-Finger-Fehler: https://de.wikipedia.org/wiki/Fat-Finger-Fehler
-
“Laptop mit Masterarbeit verloren, Finderlohn 1000 Euro”: https://www.reddit.com/r/Leipzig/comments/kaenyp/laptop_mit_masterarbeit_verloren_finderlohn_1000/



