rssLink RSS for all categories
 
icon_green
icon_green
icon_green
icon_red
icon_red
icon_green
icon_green
icon_orange
icon_green
icon_red
icon_green
icon_green
icon_green
icon_red
icon_green
icon_orange
icon_green
icon_green
icon_red
icon_red
icon_green
icon_green
icon_orange
icon_green
icon_green
icon_green
icon_green
icon_orange
icon_green
icon_green
 

FS#3819 — RBX-2: salle 26 en defaut

Attached to Project— Serveurs dédiés
Incident
RBX2
CLOSED
100%
L'une des salles de RBX-2, la salle 26, n'a pas ressisté aux
tests de groupe du datacentre RBX-2. Les serveurs sont coupés
electriquement.
http://travaux.ovh.com/?do=details&id=3815

Nous sommes en cours de fixation du probleme.

Date:  Tuesday, 02 February 2010, 18:14PM
Reason for closing:  Done
Comment by OVH - Tuesday, 02 February 2010, 11:22AM

Les tests de groupes consiste à basculer la source d'alimentation du
datacentre de "EDF" vers les "groupes" puis revenir sur "EDF". Pendant
ces basculements, l'alimentation du datacentre est assurée par les
onduleurs qui tirent l'energie de ses bateries.

Ce matin,nous avons effectué les tests periodique que nous avons
l'habitude d'effectuer tous les mois sur tous nos datacentres.
http://travaux.ovh.com/?do=details&id=3815
L'objectif est de constater que tout marche bien et qu'en cas d'un
eventuel probleme un jour ou une nuit les clients ne constateront
aucun probleme.

Pendant le test de groupe sur RBX-2, nous avons basculé sur les groupes
sans probleme. L'ensemble des installations fonctionnaient correctement
pendant le basculement d'"EDF" vers les "groupes" et sur les groupes.

Pendant la phase de basculement "groupe" vers "EDF" nous avons eu un
probleme sur l'un des dijoncteurs de bateries d'une des onduleurs
qui alimente la salle 26. Du coup les onduleurs n'ont plus été alimentés
en courant à partir de bateries et comme on était en phase de basculement
des groupes vers EDF, les onduleurs n'ont pas été alimentés non plus en
courant EDF (le basculement dure 55 secondes, reglementaire qu'EDF demande
afin de stabiliser le reseau). Et donc une coupure electrique de l'ensemble
des serveurs de la salle 26 a été constatée.

La salle 26 est à nouveau alimentée. Tous les équipes sont dans la salle
26 pour faire revenir tous les serveurs au plus vite.

En parallele, on est en train de regarder et comprendre pourquoi ce
dijoncteur a sauté mais surtout comment faire pourque ça n'arrive plus.


Comment by OVH - Tuesday, 02 February 2010, 11:38AM

encore 242 serveurs down.


Comment by OVH - Tuesday, 02 February 2010, 11:54AM

beaucoup des serveurs checkent les disques. ça prend son temps.
on verifie tous les serveurs un par un s'il y a un check en
cours ou un autre probleme.


Comment by OVH - Tuesday, 02 February 2010, 12:42PM

116 serveurs encore down.


Comment by OVH - Tuesday, 02 February 2010, 13:07PM

88 serveurs.

il reste les cas problematiques qu'on traite cas par cas et
ont besoins de derackage du serveur et reparation puis rerackage.


Comment by OVH - Tuesday, 02 February 2010, 13:47PM

44 serveurs.


Comment by OVH - Tuesday, 02 February 2010, 14:15PM

35 serveurs


Comment by OVH - Tuesday, 02 February 2010, 15:17PM

17 serveurs


Comment by OVH - Tuesday, 02 February 2010, 16:03PM

4 serveurs


Comment by OVH - Tuesday, 02 February 2010, 18:14PM

Les problemes sont fixés.

On cherche l'origine du probleme avec le fabriquant.