Jump to content

Down odierno


lux

Recommended Posts

Dopo il quarto mp di richiesta di spiegazioni del down ho proferito aprire un topic.

 

Alle ore 1.49 di questa mattina il server del Forum è stato scollegato per errore dalla rete elettrica principale da un tecnico del datacenter in Germania; il server mentre restava acceso con le batterie di emergenza ha cominciato a eseguire le procedure di emergenza, ovvero
1) blocco del database in sola lettura (blocca la possibilità di scrivere dati nel database in modo da salvaguardarne l'integrità)

2) check del database (per verificarne la coerenza e l'integrità)

3) backup del database

4) caricamento del backup sul server di backup negli US

 

Tutta questa procedura avrebbe richiesto 15 minuti per tornare on line se non fosse che il tecnico ha scollegato le batterie di emergenza del server mentre questo stava esportando i backup su un altro server. Appena il server si è spento è arrivata un sms automatico al mio numero di reperebilità e immaginate il brusco risveglio. Dopo un'e-mail di dolci parole hanno ricollegato tutto alla rete elettrica, ho lanciato tutta una serie di procedure che richiedevano diverse ore per arrivare a termine. Il riassunto: 5 ore di lavoro per sistemare il problema; l'alternativa era ripartire immediatamente (in circa 15~20 minuti) con l'ultimo backup ma avrebbe significato perdere due giorni di post/messaggi/etc., si è preferito quindi recuperare tutto.

 

We are back :)

 

lux

Link to comment
Share on other sites

LocoEmotivo

Grazie di vegliare sulle nostre scemenze, @Lux! Voialtre deità meritate un posto speciale nei nostri cuori e nei nostri raduni.

Link to comment
Share on other sites

Voglio immaginarmi questo tedesco che inciampa nel cavo elettrico e lo nasconde con un piede sotto uno scaffale per non farsi scoprire :-D

Link to comment
Share on other sites

 

 

Alle ore 1.49 di questa mattina il server del Forum è stato scollegato per errore dalla rete elettrica principale da un tecnico del datacenter in Germania

 

 

 

Tutta questa procedura avrebbe richiesto 15 minuti per tornare on line se non fosse che il tecnico ha scollegato le batterie di emergenza del server mentre questo stava esportando i backup su un altro server.

 

ed era sempre lo stesso tecnico? una sentinella in piedi? XD

Link to comment
Share on other sites

beh questo tecnico deve aver fatto un grande sforzo: coordinare uno stacco corrente principale a un successivo distacco delle batterie di emergenza non è da tutti!

cos'altro poteva fare per peggiorare la situazione? questo tecnico è il sogno di ogni manager di data center!

Link to comment
Share on other sites

Guest
This topic is now closed to further replies.
×
×
  • Create New...