LaoBlog

Raid 1: kicking no fresh hdc2 from array ovvero quando un disco del raid mirror salta


Oggi mi sono svegliato, sono andato su uno dei pc della mia rete domestica ed ho tentato di loggarmi. Niente. Il mio server openldap che autentica il mio utente non rispondeva. Apro una TTY come root, vedo che è tutto molto lento. Pingo il server openldap, non risponde... Vado a vedere il server. E' acceso come al solito, ma le schede di rete non blinkano. Il modem adsl, acceso, segnala che non vi sono dati in transito. Non essendo possibile entrare con una shell remota sul server, non mi è rimasto altro da fare che spegnerlo brutalmente (ahi ahi ). Però non voleva spegnersi. Pareva in coma. A quel punto, ho tolto la corrente col pulsante dell'alimentatore. Aspetto qualche decina di secondi, poi riavvio. Il computer parte, e dopo un po', risulta finalmente raggiungibile anche dal pc della lan, da cui riesco ora ad autenticarmi. Controllo se tutto funziona, e mi accorgo che apache2 non va. Riavvio il servizio, ottengo un bel "address already in use make_sock could not bind to address 80". Da linea di comando digito lsof|grep apache e vedo che c'è un sacco di roba "appesa". Mi sono rotto! killall -9 apache ripristina l'ordine nel pc, e finalmente posso startare nuovamente apache2 che ora parte correttamente. Poi però un'altra amara sorpresa. Consultando i logs, vedo che una delle partizioni del mio Raid 1 (mirroring) non è più in bind !! Orrore!!!  md: raid1 personality registered for level 1md: md0 stopped.md: bind<hdc2>md: bind<hda2>md: kicking non-fresh hdc2 from array!md: unbind<hdc2>md: export_rdev(hdc2)raid1: raid set md0 active with 1 out of 2 mirrorsPer essere sicuro che la partizione hdc2 sia stata disconnessa correttamente, sempre come utente root:#/mdadm /dev/md0 --fail /dev/hdc2 --remove /dev/hdc2Poi, per includere nuovamente /dev/hdc2 in /dev/md0 (cioè il mio raid 1):#mdadm /dev/md0 --add /dev/hdc2La partizione viene correttamente inclusa, e passa la paura. Per fortuna non si trattava di un guasto del disco. Questa, è una cosa che capita quando si toglie la corrente da un pc che contiene dischi in configurazione raid.