OVHcloud Network Status

Current status
Legend
  • Operational
  • Degraded performance
  • Partial Outage
  • Major Outage
  • Under maintenance
rbx-g1-a9
Incident Report for Network & Infrastructure
Resolved
L'une des 2 cartes de supervision a rebooté.
le spare a repris le routage.



Update(s):

Date: 2014-09-08 18:17:03 UTC
Il s'agit d'un bug qui touche quelques autres clients.
Il n'y a pas de bugfix pour l'instant (SMU). Il faudrait
reinstaller l'ensemble de cartes à partir de ROMMON.
On regarde avec Cisco et on va le faire.

Date: 2014-09-08 17:07:37 UTC
Les 2 sups ont rebooté simultanément suite à un crash du kernel.
13 Mon Sep 8 18:38:43 2014 0x28000016 Crash Reason: Kernel Crash

Le trafic a basculé vers rbx-g2-a9 mais le trafic a été brièvement impacté.

Le routeur a redémarré et se trouve actuellement dans le fonctionnement normal. Nous allons analyser les causes du crash avec le constructeur.

Date: 2014-09-08 17:02:57 UTC
Nous avons eu quelques secondes de coupures sur 50%
du trafic venant et repartant de RBX. Le trafic
s'est automatiquement redirigé sur le 2eme routeur
rbx-g2-a9, puis 2-3 minutes apres la panne rbx-g1-a9
est revenu dans le routage et a repris sa charge.

On regarde avec Cisco pour trouver l'origine du probleme
et changer la carte hardware qui est responsable du
failover.

On aurait dû avoir 0 seconde de coupure. On regarde
pourquoi ça n'a pas été le cas.

Date: 2014-09-08 17:00:11 UTC

RP/0/RSP1/CPU0:Sep 8 16:38:49.603 : init[65540]: %OS-INIT-7-MBI_STARTED : total time 8.856 seconds
RP/0/RSP1/CPU0:Sep 8 16:39:09.365 : sysmgr[93]: %OS-SYSMGR-5-NOTICE : Card is COLD started
RP/0/RSP1/CPU0:Sep 8 16:39:10.779 : init[65540]: %OS-INIT-7-INSTALL_READY : total time 30.032 seconds
RP/0/RSP1/CPU0:Sep 8 16:40:19.734 : sc_reddrv[381]: %PLATFORM-REDDRV-7-ROLE_CHANGE : Detected role change to ACTIVE state due to mastership release
RP/0/RSP1/CPU0:Sep 8 16:40:24.107 : shelfmgr[384]: %PLATFORM-SHELFMGR-6-SYSTEM_COLD_START : System cold start detected. Resetting Line Cards.

RP/0/RSP1/CPU0:rbx-g1-a9#sh platform
Mon Sep 8 18:59:49.866 CEST
Node Type State Config State
-----------------------------------------------------------------------------
0/RSP0/CPU0 A9K-RSP440-TR(Standby) IOS XR RUN PWR,NSHUT,MON
0/RSP1/CPU0 A9K-RSP440-TR(Active) IOS XR RUN PWR,NSHUT,MON
Posted Sep 08, 2014 - 16:56 UTC