Absturz SuSE 8.1 und 8.2

Autor

Mittwoch, 23. Februar 2005 12:00:09

Hallo,

ich habe ein mir unerklärliches Fenomen bei meinen SuSE Linux 8.1 u. 8.2 Servern.
Nach einigen Tagen stürzen die Server einfach ab, es gibt keine Logeinträge gar nichts. Es blinken nur die Num und Capslock leuchte.
Das habe ich mit allen 8.1 und 8.2 Servern. Die sind alle identisch installiert. Dort laufen folgende Daemons: Samba, Apache, Squid, Bind, SSH, und XNTP.
Es kann mal sein das ein Server 3-4 Tage läuft, es kommt aber auch vor das ein Server nur einen Tag läuft.
Ich habe dafür keine Erklärung, hat da jemand vielleicht eine Idee?

Ansgar Stalbold

9 Antworten


Antworten
Re: Absturz SuSE 8.1 und 8.2
Andreas Matthus, Mittwoch, 23. Februar 2005 21:57:15
Ein/Ausklappen

Hallo Ansgar,

Das Blinken heißt "kernel Panic". Wenn man einen laufenden Konsolenmonitor hat, kann man eventuell die letzte Meldung vom Absturz noch auf dem Bildschirm sehen ohne dass dies je in ein Logfile kommen kann.

Die Ursache kann in der Hardware, in der Software, oder in Hardware und Software liegen. In der Regel liegt es an der Hardware, wobei man bei den Distributoren mit ihren massengepatchten Kerneln nie weiß.

In Frage kämen Beispielsweise Überhitzung von bspw. CPU oder GPU/Graka. Ein häufiger Kandidat ist der RAM (es kann ja theoretisch) schon reichen, wenn von über 2.000.000.000 Bits eins kaputt ist). Vielleicht ist einfach der L1 oder L2 Cache hinüber.

Auf alle Fälle sollte auf Servern kein X laufen. Dann ist schon eine Fehlerquelle weniger. Den RAM kann man mal mit Memtest untersuchen. Die CPU-Lüfter mal physich anschauen. Ist in letzter Zeit irgendwas an Patches oder neuer Software eingespielt worden?

mfg
Andreas


Bewertung: 122 Punkte bei 32 Stimmen.
Den Beitrag bewerten: Gut / Schlecht
-
Re: Absturz SuSE 8.1 und 8.2
Ansgar Stalbold, Donnerstag, 24. Februar 2005 16:28:52
Ein/Ausklappen

Hi @all,

alle Server haben exakt die gleiche Hardware! alles identisch. Auf den Server läuft ein SuSE Linux 8.2 Pro in minimal Installation. haben nur die obengenannten Dienste nachinstalliert. Und natürlich die Konfig Files angepasst.
Sonst laufen dort keine Dienste, Scripte hab ich auch nicht (zumindest keine von mir erstellten oder installierten)
Es läuft auch kein X-Server Grafik Geraffel.

Habe auch seit der installation keinerlei Patches installiert...

Ich kann mir auch nicht vorstellen das dort die Hardware defekt ist, bei allen der selbe Fehler halte ich für sehr unwahrscheinlich.
Mit SuSE 9.2 hab ich die Fehler nicht.

Ich kann mir leider auch nach dem Absturz nicht mehr die consolen anschauen weil der server sich ja aufgehangen hat...
... alles dunkel! ;-)

ich hab mir ein kleines Workaround gebaut in dem ich die Server per Cronjob jeden morgen einmal rebooten lasse um 6 Uhr. Das hat die Abstürze schon merklich reduziert. Ändert allerdings nichts am Problem (leider)

Ich werde bei ein zwei Servern nochmal die Hardware checken, vielleicht find ich ja doch noch was.

Wenn ihr noch ne idee habt wäre ich euch dankbar.


Bewertung: 120 Punkte bei 35 Stimmen.
Den Beitrag bewerten: Gut / Schlecht
-
Re: Absturz SuSE 8.1 und 8.2
Andreas Matthus, Freitag, 25. Februar 2005 06:53:17
Ein/Ausklappen

Hallo Ansgar,

irgendwas verschweigst Du noch :-;
Was heißt: "Mit SuSE 9.2 hab ich die Fehler nicht."? Hast Du noch identische Konfigurationen mit einer 9.2 oder gar auf den gleichen Maschinen diese probiert? Was hindert dann um Update? Welche Kernelversionen laufen?

Kann es sein, dass sich jemand in die Systeme eingeschlichen hat? Wie scharf ist die Firewall geschaltet? Was sagen die Firewall-Log-Files (Ich kann mir nicht vorstellen, dass es einen ständig erreichbaren Server im Internet gibt, der _nicht_ permanent attakiert wird; es sei denn, er liegt schon hinter einer guten Firewall und selbst dann wird auf den offenen Ports [z. B. ssh] nach "Schwachstellen" gesucht).

Haben die Kisten womoglich identische Paßwörter? Die sollte man umgehend ändern und einen root-Kit-hunter ansetzen. Kann ja sein, dass nicht Du, sondern ein "Gast" neue Software installiert hat (Dann viel Spaß!).

Stürzen die Maschinen auch ab, wenn sie vom Netz getrennt sind?

mfg
Andreas


Bewertung: 123 Punkte bei 30 Stimmen.
Den Beitrag bewerten: Gut / Schlecht
-
Re: Absturz SuSE 8.1 und 8.2
Ansgar Stalbold, Freitag, 25. Februar 2005 08:58:39
Ein/Ausklappen

Hi Andreas,

genau das hab ich gemacht, habe mir den Testserver (ist identisch mit den Problemservern) geschnappt und dort ein SuSE 9.2 inst. mit den selben Diensten und der selben Konfiguration soweit möglich.
Um Updates einzuspielen muss ich zu den Servern fahren, ist einfach eine Zeitfrage und die Dienste laufen ja (eigentlich...).
Auf den Kisten läuft ein SuSE Kernel 2.4.20.
Ich werde aber mal an einem Standort die Patches einspielen, vielleicht bringt das ja Besserung.

Es kann natürlich sein das sich jemand eingeschlichen hat, will ich nicht ausschliessen, konnte dafür aber keine Anzeichen erkennen. Die Server stehen alle hinter Cisco Firewalls. Es gibt keinen Zugriff von aussen.

Vom Netzgenommen hab ich die Kisten noch nie, könnte ich über Ostern mal testen.

Danke


Bewertung: 111 Punkte bei 35 Stimmen.
Den Beitrag bewerten: Gut / Schlecht
-
Re: Absturz SuSE 8.1 und 8.2
Andreas Matthus, Sonntag, 27. Februar 2005 18:44:39
Ein/Ausklappen

Hallo Ansgar,

dass Du dran bleibst finde ich gut. Und die Sicherung durch eine Cisco auch. Wird deren Log-Datei auch mal gelesen?

Unverständlich, warum Du zu den Maschinen fahren musst, um ein update zu machen. yast im Textmodus geht wunderbar über ssh.

mfg
Andreas


Bewertung: 101 Punkte bei 31 Stimmen.
Den Beitrag bewerten: Gut / Schlecht
-
Re: Absturz SuSE 8.1 und 8.2
Ansgar Stalbold, Mittwoch, 09. März 2005 17:26:07
Ein/Ausklappen

Hi,

die LogDateien bekomme ich einmal pro Woche und in der Regel kontrolliere ich die auch, hab dafür ein kleines Prog.
Ist bisher aber nichts auffälliges drin, das war auch mein erster Gedanke bei den abstürzen.

Das sind keine Standleitungen und die Ciscos können kein DynDNS, auf jedenfall konnte ich die Biester dazu nicht überreden.

Bei Updates auf Servern bin ich lieber vor Ort.


Bewertung: 62 Punkte bei 29 Stimmen.
Den Beitrag bewerten: Gut / Schlecht
Re: Absturz SuSE 8.1 und 8.2
rottriges , Mittwoch, 23. Februar 2005 13:30:05
Ein/Ausklappen

Hallo,

ich glaube, dass dein Problem nicht softwaretechnisch ist sondern eher physischer Natur.
Wenn wirklich alle Server gleichzeitig abstürzen und es keine Logeinträge gibt, dann tippe ich darauf, dass mit deiner Stromversorgung etwas nicht stimmt. Sind die Server an eine USV-Anlage angeschlossen? Ich würde probehalber mal einen Server an einen seperate Stromkreis anschließen. (Falls das möglich ist)




Bewertung: 114 Punkte bei 36 Stimmen.
Den Beitrag bewerten: Gut / Schlecht
-
Re: Absturz SuSE 8.1 und 8.2
Ansgar Stalbold, Mittwoch, 23. Februar 2005 18:03:57
Ein/Ausklappen

sorry, ich hab mich wohl ein wenig unglücklich ausgedrückt bzw. was vergessen. Hier die Ergänzung:

Die Server stehen an unterschiedlichen Standorten/Gebäuden. Sie stürzen nicht alle zur gleichen Zeit ab, sondern völlig zufällig (wenn sie gerade mal keine lust haben...) Der Fehler tritt mit und ohne USV auf.
Auf meinem Testserver (identisch mit den Problemservern) hab ich die Probleme mit SuSE 9.2 bisher nicht, ein Update auf 9.2 ist zur Zeit bzw. in nächster Zeit nicht möglich.

ich habe keine idee mehr...


Bewertung: 195 Punkte bei 35 Stimmen.
Den Beitrag bewerten: Gut / Schlecht
-
Re: Absturz SuSE 8.1 und 8.2
rottriges , Donnerstag, 24. Februar 2005 08:07:51
Ein/Ausklappen

Wenn es ein Hardwaredefekt wäre müssten ja zufällig alle Server, die auch noch an unterschiedlichen Orten stehen gleichzeitig einen (möglicherweise noch den gleichen) Schaden haben.
Rein logisch betrachtet kann ich mir das aber nicht vorstellen. Das wäre schon ein großer Zufall.
Um eine genauere Diagnose zu erstellen (wenn diese überhaupt möglich ist), bräuchte man noch ein paar Angaben.

Da das Phänomen bei allen Servern auftritt, wäre es interessant zu wissen, ob auch alle Server exakt baugleich sind.
Wenn nicht, welche Hardware ist identisch? (z.B in jeden Server ist der gleiche Raidcontroller usw.)
Wenn das zu keiner Lösung führt, würde ich den oberen Ansatz auch in Bezug auf die Software anwenden. Angefangen bei "exotischen" Diensten bzw. Programmen über selbstgeschriebene Scripts/Programme bis hin zu den Standartprogrammen. (genau in der Reihenfolge und immer den Focus auf die Gemeinsamkeit legen)

Meine Vermutung nach bisherigen Kenntnisstand:
Bei deinen Servern läuft irgendein Script, Treiber oder Programm, welches auf jeden Server installiert ist, aus dem Ruder.

Ich hoffe einen Denkanstoß gegeben zu haben.

gruß rottriges


Bewertung: 97 Punkte bei 34 Stimmen.
Den Beitrag bewerten: Gut / Schlecht

Ähnliche Artikel

Tipp der Woche

Grammatikprüfung in LibreOffice nachrüsten
Grammatikprüfung in LibreOffice nachrüsten
Tim Schürmann, 24.04.2015 19:36, 0 Kommentare

LibreOffice kommt zwar mit einer deutschen Rechtschreibprüfung und einem guten Thesaurus, eine Grammatikprüfung fehlt jedoch. In ältere 32-Bit-Versionen ...

Aktuelle Fragen

Konsole / Terminal in Linux Mint 17.1 deutsch
Dirk Resag, 09.05.2015 23:39, 12 Antworten
Hallo an die Community, ich habe vor kurzem ein älteres Notebook, Amilo A1650G, 1GB Arbeitsspe...
Admin Probleme mit Q4os
Thomas Weiss, 30.03.2015 20:27, 6 Antworten
Hallo Leute, ich habe zwei Fragen zu Q4os. Die Installation auf meinem Dell Latitude D600 verl...
eeepc 1005HA externer sound Ausgang geht nicht
Dieter Drewanz, 18.03.2015 15:00, 1 Antworten
Hallo LC, nach dem Update () funktioniert unter KDE der externe Soundausgang an der Klinkenbuc...
AceCad DigiMemo A 402
Dr. Ulrich Andree, 15.03.2015 17:38, 2 Antworten
Moin zusammen, ich habe mir den elektronischen Notizblock "AceCad DigiMemo A 402" zugelegt und m...
Start-Job behindert Bootvorgang, Suse 13.2, KDE,
Wimpy *, 20.02.2015 10:32, 4 Antworten
Beim Bootvorgang ist ein Timeout von 1 Min 30 Sec. weil eine Partition sdb1 gesucht und nicht gef...

Jetzt auf den Mailinglisten

Re: [EasyLinux-Ubuntu] [Erledigt]_Bessere_Auflösung_einer_Historischen_Karte
Alfred Zahlten, 25.05.2015 00:58
Am 24.05.2015 um 20:16 schrieb Oliver Christ: >>> http://vsff.rivido.de/Landkarte Europa.pdf >...
Re: [EasyLinux-Ubuntu] Google Chorme
Richard Kraut, 24.05.2015 23:00
Am Sonntag, den 24.05.2015, 20:24 +0200 schrieb Karl-Heinz: > weiss von euch jemand den Unterschied zwisch...
Re: [EasyLinux-Ubuntu] Google Chorme
Matthias Müller, 24.05.2015 22:37
Hallo, Am Sonntag, 24. Mai 2015 schrieb Karl-Heinz: > Hallo zusammen, > > weiss von euch jema...
[EasyLinux-Ubuntu] lpr-dateien
bernhard, 24.05.2015 20:50
Hallo Liste und Frohe Pfingsten, Frage: wo finde ich die LPR-Dateien auf einer Install-CD? Ich meine, irge...
[EasyLinux-Ubuntu] Google Chorme
Karl-Heinz, 24.05.2015 20:24
Hallo zusammen, weiss von euch jemand den Unterschied zwischen den Browsern Chromium - aus den Repos von D...