FS#4656 — rbx2 salle 26
Attached to Project— Reseau Internet et Baies
| Incident | |
| Tout le réseau | |
| CLOSED | |
![]() |
L'un des onduleurs de la salle 26 a été en défaut pendant quelques secondes.
C'est up. Et les serveurs sont en train de revenir.
Nous mettons les resources sur les serveurs en défaut.
En regarde en parallele l'origine du probleme.
Date: Friday, 01 October 2010, 12:50PMC'est up. Et les serveurs sont en train de revenir.
Nous mettons les resources sur les serveurs en défaut.
En regarde en parallele l'origine du probleme.
Reason for closing: Done
RSS for all categories

L'onduleur a planté et a rebooté ... tout simplement.
Le constructeur arrive sur le site pour nous expliquer
l'origine du plantage.
encore 63 serveurs. après les serveurs qui reviennent seuls,
on a reglé tous les problemes de "check de disques/ctrl-d".
il reste que des cas très tordu avec les configurations au
boot qui sont cassés. on les fixe un par un. ça va prendre
du temps.
Le contexte:
En cas de coupure électrique, une fois les groupes électrogènes démarrés, les UPS sont programmés pour se réalimenter progressivement (suivant une rampe d'intensité pendant 1 minute). Ceci permet la montée en charge progressive des groupes électrogènes.
Le problème:
On soupçonne un bug logiciel au moment où l'UPS effectue la rampe. Les logs indiquent que quelque-soit le temps de coupure, l'UPS reste en décharge pendant 4 minutes supplémentaires ! Il suffit ainsi de quelques micro-coupures en peu de temps pour décharger complètement les batteries... C'est ce qui s'est passé.
Le constructeur doit mener ses investigations. En attendant et par prévention, nous allons désactiver la fonctionnalité de rampe sur tous les onduleurs (et simuler le comportement en décalant de quelques secondes la recharge de chacun des UPS).