Absturz SuSE 8.1 und 8.2

Ansgar Stalbold - Mittwoch, 23. Februar 2005 12:00:09 - 9 Antworten

Hallo,

ich habe ein mir unerklärliches Fenomen bei meinen SuSE Linux 8.1 u. 8.2 Servern.
Nach einigen Tagen stürzen die Server einfach ab, es gibt keine Logeinträge gar nichts. Es blinken nur die Num und Capslock leuchte.
Das habe ich mit allen 8.1 und 8.2 Servern. Die sind alle identisch installiert. Dort laufen folgende Daemons: Samba, Apache, Squid, Bind, SSH, und XNTP.
Es kann mal sein das ein Server 3-4 Tage läuft, es kommt aber auch vor das ein Server nur einen Tag läuft.
Ich habe dafür keine Erklärung, hat da jemand vielleicht eine Idee?

Antworten
Re: Absturz SuSE 8.1 und 8.2
Andreas Matthus, Mittwoch, 23. Februar 2005 21:57:15
Ein/Ausklappen

Hallo Ansgar,

Das Blinken heißt "kernel Panic". Wenn man einen laufenden Konsolenmonitor hat, kann man eventuell die letzte Meldung vom Absturz noch auf dem Bildschirm sehen ohne dass dies je in ein Logfile kommen kann.

Die Ursache kann in der Hardware, in der Software, oder in Hardware und Software liegen. In der Regel liegt es an der Hardware, wobei man bei den Distributoren mit ihren massengepatchten Kerneln nie weiß.

In Frage kämen Beispielsweise Überhitzung von bspw. CPU oder GPU/Graka. Ein häufiger Kandidat ist der RAM (es kann ja theoretisch) schon reichen, wenn von über 2.000.000.000 Bits eins kaputt ist). Vielleicht ist einfach der L1 oder L2 Cache hinüber.

Auf alle Fälle sollte auf Servern kein X laufen. Dann ist schon eine Fehlerquelle weniger. Den RAM kann man mal mit Memtest untersuchen. Die CPU-Lüfter mal physich anschauen. Ist in letzter Zeit irgendwas an Patches oder neuer Software eingespielt worden?

mfg
Andreas


Bewertung: 194 Punkte bei 56 Stimmen.
Den Beitrag bewerten: Gut / Schlecht
-
Re: Absturz SuSE 8.1 und 8.2
Ansgar Stalbold, Donnerstag, 24. Februar 2005 16:28:52
Ein/Ausklappen

Hi @all,

alle Server haben exakt die gleiche Hardware! alles identisch. Auf den Server läuft ein SuSE Linux 8.2 Pro in minimal Installation. haben nur die obengenannten Dienste nachinstalliert. Und natürlich die Konfig Files angepasst.
Sonst laufen dort keine Dienste, Scripte hab ich auch nicht (zumindest keine von mir erstellten oder installierten)
Es läuft auch kein X-Server Grafik Geraffel.

Habe auch seit der installation keinerlei Patches installiert...

Ich kann mir auch nicht vorstellen das dort die Hardware defekt ist, bei allen der selbe Fehler halte ich für sehr unwahrscheinlich.
Mit SuSE 9.2 hab ich die Fehler nicht.

Ich kann mir leider auch nach dem Absturz nicht mehr die consolen anschauen weil der server sich ja aufgehangen hat...
... alles dunkel! ;-)

ich hab mir ein kleines Workaround gebaut in dem ich die Server per Cronjob jeden morgen einmal rebooten lasse um 6 Uhr. Das hat die Abstürze schon merklich reduziert. Ändert allerdings nichts am Problem (leider)

Ich werde bei ein zwei Servern nochmal die Hardware checken, vielleicht find ich ja doch noch was.

Wenn ihr noch ne idee habt wäre ich euch dankbar.


Bewertung: 166 Punkte bei 60 Stimmen.
Den Beitrag bewerten: Gut / Schlecht
-
Re: Absturz SuSE 8.1 und 8.2
Andreas Matthus, Freitag, 25. Februar 2005 06:53:17
Ein/Ausklappen

Hallo Ansgar,

irgendwas verschweigst Du noch :-;
Was heißt: "Mit SuSE 9.2 hab ich die Fehler nicht."? Hast Du noch identische Konfigurationen mit einer 9.2 oder gar auf den gleichen Maschinen diese probiert? Was hindert dann um Update? Welche Kernelversionen laufen?

Kann es sein, dass sich jemand in die Systeme eingeschlichen hat? Wie scharf ist die Firewall geschaltet? Was sagen die Firewall-Log-Files (Ich kann mir nicht vorstellen, dass es einen ständig erreichbaren Server im Internet gibt, der _nicht_ permanent attakiert wird; es sei denn, er liegt schon hinter einer guten Firewall und selbst dann wird auf den offenen Ports [z. B. ssh] nach "Schwachstellen" gesucht).

Haben die Kisten womoglich identische Paßwörter? Die sollte man umgehend ändern und einen root-Kit-hunter ansetzen. Kann ja sein, dass nicht Du, sondern ein "Gast" neue Software installiert hat (Dann viel Spaß!).

Stürzen die Maschinen auch ab, wenn sie vom Netz getrennt sind?

mfg
Andreas


Bewertung: 158 Punkte bei 50 Stimmen.
Den Beitrag bewerten: Gut / Schlecht
-
Re: Absturz SuSE 8.1 und 8.2
Ansgar Stalbold, Freitag, 25. Februar 2005 08:58:39
Ein/Ausklappen

Hi Andreas,

genau das hab ich gemacht, habe mir den Testserver (ist identisch mit den Problemservern) geschnappt und dort ein SuSE 9.2 inst. mit den selben Diensten und der selben Konfiguration soweit möglich.
Um Updates einzuspielen muss ich zu den Servern fahren, ist einfach eine Zeitfrage und die Dienste laufen ja (eigentlich...).
Auf den Kisten läuft ein SuSE Kernel 2.4.20.
Ich werde aber mal an einem Standort die Patches einspielen, vielleicht bringt das ja Besserung.

Es kann natürlich sein das sich jemand eingeschlichen hat, will ich nicht ausschliessen, konnte dafür aber keine Anzeichen erkennen. Die Server stehen alle hinter Cisco Firewalls. Es gibt keinen Zugriff von aussen.

Vom Netzgenommen hab ich die Kisten noch nie, könnte ich über Ostern mal testen.

Danke


Bewertung: 164 Punkte bei 57 Stimmen.
Den Beitrag bewerten: Gut / Schlecht
-
Re: Absturz SuSE 8.1 und 8.2
Andreas Matthus, Sonntag, 27. Februar 2005 18:44:39
Ein/Ausklappen

Hallo Ansgar,

dass Du dran bleibst finde ich gut. Und die Sicherung durch eine Cisco auch. Wird deren Log-Datei auch mal gelesen?

Unverständlich, warum Du zu den Maschinen fahren musst, um ein update zu machen. yast im Textmodus geht wunderbar über ssh.

mfg
Andreas


Bewertung: 146 Punkte bei 52 Stimmen.
Den Beitrag bewerten: Gut / Schlecht
-
Re: Absturz SuSE 8.1 und 8.2
Ansgar Stalbold, Mittwoch, 09. März 2005 17:26:07
Ein/Ausklappen

Hi,

die LogDateien bekomme ich einmal pro Woche und in der Regel kontrolliere ich die auch, hab dafür ein kleines Prog.
Ist bisher aber nichts auffälliges drin, das war auch mein erster Gedanke bei den abstürzen.

Das sind keine Standleitungen und die Ciscos können kein DynDNS, auf jedenfall konnte ich die Biester dazu nicht überreden.

Bei Updates auf Servern bin ich lieber vor Ort.


Bewertung: 130 Punkte bei 57 Stimmen.
Den Beitrag bewerten: Gut / Schlecht
Re: Absturz SuSE 8.1 und 8.2
rottriges , Mittwoch, 23. Februar 2005 13:30:05
Ein/Ausklappen

Hallo,

ich glaube, dass dein Problem nicht softwaretechnisch ist sondern eher physischer Natur.
Wenn wirklich alle Server gleichzeitig abstürzen und es keine Logeinträge gibt, dann tippe ich darauf, dass mit deiner Stromversorgung etwas nicht stimmt. Sind die Server an eine USV-Anlage angeschlossen? Ich würde probehalber mal einen Server an einen seperate Stromkreis anschließen. (Falls das möglich ist)




Bewertung: 141 Punkte bei 56 Stimmen.
Den Beitrag bewerten: Gut / Schlecht
-
Re: Absturz SuSE 8.1 und 8.2
Ansgar Stalbold, Mittwoch, 23. Februar 2005 18:03:57
Ein/Ausklappen

sorry, ich hab mich wohl ein wenig unglücklich ausgedrückt bzw. was vergessen. Hier die Ergänzung:

Die Server stehen an unterschiedlichen Standorten/Gebäuden. Sie stürzen nicht alle zur gleichen Zeit ab, sondern völlig zufällig (wenn sie gerade mal keine lust haben...) Der Fehler tritt mit und ohne USV auf.
Auf meinem Testserver (identisch mit den Problemservern) hab ich die Probleme mit SuSE 9.2 bisher nicht, ein Update auf 9.2 ist zur Zeit bzw. in nächster Zeit nicht möglich.

ich habe keine idee mehr...


Bewertung: 211 Punkte bei 56 Stimmen.
Den Beitrag bewerten: Gut / Schlecht
-
Re: Absturz SuSE 8.1 und 8.2
rottriges , Donnerstag, 24. Februar 2005 08:07:51
Ein/Ausklappen

Wenn es ein Hardwaredefekt wäre müssten ja zufällig alle Server, die auch noch an unterschiedlichen Orten stehen gleichzeitig einen (möglicherweise noch den gleichen) Schaden haben.
Rein logisch betrachtet kann ich mir das aber nicht vorstellen. Das wäre schon ein großer Zufall.
Um eine genauere Diagnose zu erstellen (wenn diese überhaupt möglich ist), bräuchte man noch ein paar Angaben.

Da das Phänomen bei allen Servern auftritt, wäre es interessant zu wissen, ob auch alle Server exakt baugleich sind.
Wenn nicht, welche Hardware ist identisch? (z.B in jeden Server ist der gleiche Raidcontroller usw.)
Wenn das zu keiner Lösung führt, würde ich den oberen Ansatz auch in Bezug auf die Software anwenden. Angefangen bei "exotischen" Diensten bzw. Programmen über selbstgeschriebene Scripts/Programme bis hin zu den Standartprogrammen. (genau in der Reihenfolge und immer den Focus auf die Gemeinsamkeit legen)

Meine Vermutung nach bisherigen Kenntnisstand:
Bei deinen Servern läuft irgendein Script, Treiber oder Programm, welches auf jeden Server installiert ist, aus dem Ruder.

Ich hoffe einen Denkanstoß gegeben zu haben.

gruß rottriges


Bewertung: 191 Punkte bei 64 Stimmen.
Den Beitrag bewerten: Gut / Schlecht

Ähnliche Artikel

Aktuelle Fragen

Lieber Linux oder Windows- Betriebssystem?
Sina Kaul, 13.10.2017 16:17, 3 Antworten
Hallo, bis jetzt hatte ich immer nur mit
IT-Kurse
Alice Trader, 26.09.2017 11:35, 2 Antworten
Hallo liebe Community, ich brauche Hilfe und bin sehr verzweifelt. Ih bin noch sehr neu in eure...
Backup mit KUP unter Suse 42.3
Horst Schwarz, 24.09.2017 13:16, 3 Antworten
Ich möchte auch wieder unter Suse 42.3 mit Kup meine Backup durchführen. Eine Installationsmöglic...
kein foto, etc. upload möglich, wo liegt mein fehler?
kerstin brums, 17.09.2017 22:08, 5 Antworten
moin, zum erstellen einer einfachen wordpress website kann ich keine fotos uploaden. vom rechne...
Arch Linux Netzwerkkonfigurationen
Franziska Schley, 15.09.2017 18:04, 0 Antworten
Moin liebe Linux community, ich habe momentan Probleme mit der Einstellung des Lan/Wlan in Arc...

Stellenmarkt

Jetzt auf den Mailinglisten

Re: [EasyLinux-Ubuntu] Frage_außer_Konkurrenz_zu_Vectoring
Rainer, 20.10.2017 18:37
Hallo Gerhard, Am Fri, 20 Oct 2017 18:02:54 +0200 schrieb Gerhard Eilers : > Ich warte ab, bis hier be...
Re: [EasyLinux-Ubuntu] Frage_außer_Konkurrenz_zu_Vectoring
Gerhard Eilers, 20.10.2017 18:02
Hallo Nguyen und alle anderen Vielen Dank für die Hinweise und Anregungen. Ich warte ab, bis hier bei uns j...
Re: [EasyLinux-Ubuntu] Frage_außer_Konkurrenz_zu_Vectoring
Nguyen Dong Loan, 20.10.2017 17:50
Am Freitag, den 20.10.2017, 17:13 +0200 schrieb Rainer: Hallo Rainer > Was im Prinzip aber nicht weiter...
Re: [EasyLinux-Ubuntu] Frage_außer_Konkurrenz_zu_Vectoring
Rainer, 20.10.2017 17:13
Hallo, Am Fri, 20 Oct 2017 16:52:14 +0200 schrieb Nguyen Dong Loan : > > > Nein. Das können f...
[EasyLinux-Mandriva] Update Mageia 5 -> Mageia 6
"feinstaubmafiafan@t-online.de", 20.10.2017 17:07
Hallo Liste Habe lange gezögert mit Update auf neues Mageia. Und jetzt wo ich es gemacht habe, es ist...