Hallo,
ich habe folgendes Problem mit meinem Debian 5.0 Lenny Server:
Das System läuft normalerweise 24/7, in den letzten Wochen häuft sich jedoch der Fall, dass der Rechner “spontan” ohne irgendwelche Indizien was der Grund sein könnte neu startet. Manchmal dauert es 2,3 Tage, manchmal nur wenige Stunden. Das System ist uptodate mit den letzten Lenny-Paketen.
Auf dem Server läuft u.a. Xen. Das System hat Kernel 2.6.26-1-xen-686 mit 4 GB RAM (3,3 nutzbar). Platten sind ge-RAID1-ed. Temperaturen sind laut sensors alle im grünen Bereich, Platten haben noch Platz.
/etc/ld.so.conf.d/libc6-xen.conf enthält “hwcap 0 nosegneg” (wurde schon häufiger als Indiz für ein Problem genannt)
In den Logs findet sich leider absolut nichts, außerdass halt dann irgendwann die Meldungen stehen, dass das System neu bootet, aber keine Kernel-Ooops oder sonstiges.
Hat jemand ne Idee wie ich das Problem diagnostizieren könnte? Die laufenden Dienste haben sich nicht wirklich geändert, eine Kompormittierung kann ausgeschlossen werden, HW ist relativ neu (ca. 2 Jahre).
Sofern es ein SW-Problem ist: Kann man dem Kernel nicht irgendwas mitgeben, dass er “in letzter Sekunde” noch irgendwas dumped? Meine einzige Vermutung im Moment ist ein Problem mit dem Netzteil, welches evtl. für einen Abfall der Spannung und dadurch zu einem Reboot führt.
Mein Rechner (Asus Board, Enermax Netzteil, Nvidia GTX460) bootet seit einigen Wochen manchmal spontan neu.
Zack, einfach aus ist er und fängt an, hochzufahren.
Dann geht es wieder einige Tage gut, ganz ohne Reboot, egal was ich mache, es läuft.
Dann kommt wieder so ein Tag, da habe ich mich gerade angemeldet und schon ist er wieder aus.
Gerade hat er das nach ca. eine Stunde arbeiten gemacht und ist nach dem Hochfahren gleich nochmal ausgegangen.
Bios Monitor:
Spannungen OK, Temps OK.
Netzteil ist auch nen gutes Pro87+, grade ein halbes Jahr alt.
Grafikkarte: Furmark Stresstest, bis auf 70 Grad hoch, alles ok, läuft und läuft.
Ereignisanzeige: Nichts erkennbar, außer “System wurde unerwartet heruntergefahren”. Kein Hinweis auf irgendwas.
Ich glaube inzwischen, dass es entweder das Board ist oder die OCZ Vertex SSD.
Weitere Tests (chkdsk, Virensuche usw.) zeigten: Alles i.O.
Ich weiß echt nicht, wo es herkommt.
Hat jemand eine Idee?