Serverausfall wegen Western Digital
14.02.2007
Es ist echt zum Kotzen. Da hat man mal einen freien Tag und dann passiert das…
Heute morgen habe ich die Hälfte meines Software-Raids — das seit zwei Wochen schon nicht mehr läuft — ausgebaut und mit der Diagnose-Software von Western Digital getestet. Die hat dann auch direkt vermeldet, dass ich mich mit dem Support in Verbindung setzen soll, da der S.M.A.R.T.-Wert 5 (Reallocated Sectors Count) zu hoch wäre. Das bedeutet, dass es jede Menge Schreibfehler auf der Platte gab. Also habe ich schön die RMA vorbereitet und die Platte, übrigens eine WDC WD800JD-55MU, verpackt.
Das gibt mir natürlich zu denken, da die andere Hälfte des Software-Raids genau die gleiche Platte ist. Als könnte sie Gedanken lesen, hat sie dann auch gegen 11:40 Uhr den Dienst quittiert in dem sich das System aufhing. Glücklicherweise konnte ich dann aber mit einem
# dd if=/dev/hda of=/dev/sda conv=noerror,sync bs=4k
alle Daten auf eine IDE-Platte kopieren und das System mit dieser dann wieder zum Leben erwecken.
Jetzt ist IDE-Platte der Master und die angeblich defekte SATA-Platte der Slave im Raid. Bis jetzt läuft die Wiederherstellung des Spiegels ohne Probleme. Nach 20 Minuten hat die dann auch ihren Geist aufgegeben.
ata2: translated ATA stat/err 0×61/04 to SCSI SK/ASC/ASCQ 0xb/00/00
ata2: status=0×61 { DriveReady DeviceFault Error }
ata2: error=0×04 { DriveStatusError }
Mit der RMA warte ich erstmal …
Update 28.03.2007
Western Digital hat beide Festplatten kommentarlos umgetauscht. Kosten auf meiner Seite waren dafür gut 12 €.





Dein Kommentar