ForumBandlaufwerk Problem
BiBaButzeman – Donnerstag, 23. Februar 2006 18:14 Uhr

Hallo,

habe hier einen RHEL 4 Server und ein per SCSI extern angeschlossenes VXA Bandlaufwerk.
NAch einem Reboot des Servers funktioniert nun der Backup nicht mehr.
In der Ausgabe von dmesg steht ganz unten folgendes:

Adapter 0: SCSI-B, ID 1: A media error was reported by the disk drive.
Adapter 0: SCSI-B, ID 1: A media error was reported by the disk drive.
Adapter 0: SCSI-B, ID 1, LUN 0: Reassigning Block

Davon gibt es ein par Zeilen.

Wenn ich einen mt Befehl an das Band geben will passiert folgendes:

[root@hostname log]# mt -f /dev/st0 rewind
/dev/st0: Inappropriate ioctl for device

Wo liegt her der Fehler? Muss irgendetwas manuell gestartet/geladen werden? Habe schon was von 2 Modulen ghört die man laden muss? Welche sind das? wie geht das?

mfg
Butze

1 Antwort
Ottfried Meyer – Donnerstag, 23. Februar 2006 19:58 Uhr

Hi,

schwierig….

Der “inapropiate ioctl” könnte daran liegen, dass zwar der Kernel
fleißig erneuert wurde (möglicherweise sogar ein Update 2.4.x->2.6.x),
aber “mt” nicht neu kompiliert wurde und somit mt “im Innern” noch
die falschen ioctl-Codes animmt?

Das Backupproblem könnte in einem ähnlichen Zusammenhang stehen:
Module nicht passend zum Kernel ?

Ich würde als root einmal ein

cat /dev/ > /dev/null

versuchen und hören, ob das Lauwerk anläuft…

Only my two cents and a shot in the dark….

Viel Erfolg,
mcc

BiBaButzeman – Freitag, 24. Februar 2006 11:16 Uhr

Danke für die Antwort erstmal.
Habe ein cat /dev/st0 > /dev/null
versucht. Konnte aber keine Aktivität am Bandlaufwerk feststellen (ist n bissl laut zwischen den ganzen Servern hier :))

Was beduetet das angedeutete Problem mit dem Kernel für mich?

Danke und Gruß
Butze

Ottfried Meyer – Samstag, 25. Februar 2006 06:09 Uhr

Hi,

cat /dev/ greif “low level” auf das Device zu. Wenn die pure
Kommunikation mit dem Device ok ist, aber der Bandinhalt als solche
zerstört ist, müsste das Band anlaufen und cat würde dann halt
Datenschrott nach /dev/null kopieren. Dies dient zu Unterscheidung,
ob ein von einem “Banddatenverarbeitungsprogramm” (örks) gelieferte
Fehlermeldung auf einer generellen Schwierigkeit in der Kommunikation
mit dem Device beruht oder ob “nur” eventueller Datenschrott des
Band/inhaltes/ den Fehler triggert.

Wenn das Band tatsächlich nicht anläuft (und weiterläuft bis Du cat stoppst),
ist etwas in der Kommunikation gestört.
Wenn Du Dir darüber aufgrund des Kraches im Serverraum nicht sicher bist:
Villeicht gibt es irgendwo am Laufwerk eine “Aktivity-LED”, die man optisch
statt akustisch erfassen kann ??? Nur so ‘ne Idee…vielleicht auch auf der
Rückseite des Laufwerks ?

Das Kernel-Problem ist eher ein Userlandprogramm-Problem.
Übersetze einfach die relevanten Programme aus dem Userland auf der Maschine,
auf der sie ihre Wirkung entfalten sollen (sorry für die etwas barocke
Ausdrucksweise…es ist noch etwas früh… :O). Wichtig dabei ist, das
die Header unter /usr/include/{linux,sys…} im Wesentlichen mit der
eingesetzten Kernelversion überinestimmen. Ansonsten implementieren die
Programme wieder die falschen ioctl’s….

Genrell: Wenn man Linux-Kernel updated (im größeren Stil, also z.,B. von
2.4->2.6) sollte man sicherstellen, dass die Systemintegrotät gewahrt bleibt.
Die betrifft: die glibc, die binutils, die Compilertoolchain und den Kernel
mit seinen Headern. Einfaches Austauschen ist nicht ausreichend.

Systemnahe Programme, die direkt mit komplexeren Devices kommunizieren, müssen
nach einem solchem Umstieg neu übersetzt werden.

Das “Hochsetzen” eines Produktionssystems auf eine neuere Kernelversion “des
großen Stils” (siehe oben) hat vielleicht fatalere Folgen, als das Verbelieben
der Maschine auf einer älteren Kernelversion.
Diese Aktion ist nicht trivial, da es zu ciculären Abhängigkeiten kommen kann.

Viel Erfolg!
mcc

BiBaButzeman – Montag, 27. Februar 2006 09:46 Uhr

Also bin mir inzwischen sicher as sich auf dem Band(-Laufwerk) bei einem cat /dev/st0 nichts tut.
Was ich im Moment nicht verstehe: Wieso soll ich irgendwelche Dinge neu übersetzen etc., es lief doch alles ohne Probleme. Das einzige was passiert ist, ist ein Stromausfall und ein Neustart des Rechners. Es gab kein update des Kernels etc.,
es muss an irgend was anderem liegen.

Gibt es irgendwelche Dienste /Daemons die laufen müssen?

Ulf B. – Montag, 27. Februar 2006 19:39 Uhr

Hi,

hast Du schon mal nachgesehen ob das Laufwerk überhaupt noch funktioniert?

Hing Dein Rechner hinter einem Netzfilter oder gar USV? Wenn nicht würde ich auf einen echten HW-defekt tippen. Denn ein Stromausfall ist je nach Umgebungsumstände (z.B. großer Elektromotor im gleichen Netz) nicht ganz unkritisch, da durch andere Verbraucher Störspannungen auftreten können die von den meisten einfachen PC-Netzteil nicht aufgefangen werden können (siehe auch entsprechende Bemerkungen bei c’t Netzteiltests).

Ciao
Ulf

BiBaButzeman – Montag, 27. März 2006 10:17 Uhr

Hi,

@Ulf B.: der Rechner hing hinter ner USV aber das Bandlaufwerk nicht…

Wie muss ich das Laufwerk einrichten, oder wird es automatisch als dev/st0 erkannt?

gruß
Buzte

Ulf B. – Montag, 27. März 2006 21:46 Uhr

Hi,

willst Du damit sagen das es sich um ein externes Bandlaufwerk mit eigenen Netzteil bzw. externen (Stecker-)Netzteil handelt, welches an einem anderen Netz betrieben wird? Wenn ja würde ich den Sicheren Tod zumindest der Datenschnittsellentreiber vermuten. Denn nun müssen bei schnellen Signaländerungen zwangsweise durch unterschiedliche Lasten an den Zweigen große Spannungsdiferenzen zwischen den beiden Geräten und somit der Datenschnittstelle auftreten. Diese führen zum sofortigen Tod der Ausgangstreiber wenn Sie nicht auf solche Situationen vorbereitet sind. Solche differenzen können meines Wissens nur Ethernet (und verwandte Großenfernungsschnittstellen) abfangen. Aber niehmals SCSI, IEEE oder USB-Schnittstellen.

Ciao
Ulf

BiBaButzeman – Donnerstag, 30. März 2006 09:40 Uhr

Ja, der Rechner hängt an der USV aber das BAndlaufwerk eben nicht. Das Laufwerk ist per SCSI an den Rechner angeschlossen und hat ein integriertes Netzteil.
D.h. also das die Treiber im Eimer sind? Wäre eigentlich nicht so schlimm, oder?
NEu Teiber drauf und fertig, oder sehe ich das falsch?

gruß
Butze

Ulf B. – Freitag, 31. März 2006 09:24 Uhr

Hi Butze,

D.h. also das die Treiber im Eimer sind?
Nicht zwingend, aber die Wahrscheinlichkeit ist hoch.

Wäre eigentlich nicht so schlimm, oder?
Doch, weil es sich um Hardware Handelt. Sind seperate Treiber Bausteine Verwendet worden, kann man diese evtl. noch tauschen (man sollte dabei aber recht gut mit dem Lötkolben umgehen können).

NEu Teiber drauf und fertig, oder sehe ich das falsch?
Ja, leider. Es handelt sich hierbei um Hardware (siehe oben)!

Ciao
Ulf

BiBaButzeman – Mittwoch, 19. April 2006 09:17 Uhr

wie kann ich abschließend beurteilen ob ich nun tatsächlich ein neues bandlaufwerk brauche oder nicht?
Wieso geht so ein Ding bei nem Stromausfall kaputt? Sind die so empfindlich?
Bisher dachte ich immer das Treiber Software sind, aber naja…. :(

danke für die Hilfe

Butze