OVHcloud Network Status

Current status
Legend
  • Operational
  • Degraded performance
  • Partial Outage
  • Major Outage
  • Under maintenance
vss-3-6k
Incident Report for Network & Infrastructure
Resolved
Le chassis #2 semble avoir crashé. Nous recherchons l'origine du problème. Le routage s'effectue via le chassis #1.

Update(s):

Date: 2010-04-09 22:44:56 UTC
La reconfiguration des liens VSL sur le chassis #1 a permis de corriger le problèmes de synchronisation de config (le chassis #1 ne \"voyait\" en fait pas ses propres ports VSL). Nous n'aurons donc pas à forcer le switchover. Il n'y a pas eu d'impact sur le trafic si ce n'est quelques paquets perdus au moment ou le chassis #2 a rejoint le VSS (du a une sollicitation importante du CPU à ce moment là).
Le chassis #2 est donc maintenant de nouveau en \"STANDBY HOT\", le trafic s'écoulant de nouveau à travers les 2 chassis, c'est à dire le fonctionnement nominal.
Nous rebasculerons lundi, les uplinks des réseaux 188.165.195 et 188.165.199 qui avaient été déplacés sur le chassis #1.

Date: 2010-04-09 22:04:55 UTC
Nous commencons l'intervention.

Date: 2010-04-09 17:21:46 UTC
La synchro n'a pas fonctionnée. Nous allons intervenir cette nuit pour réinitialiser complètement le lien VSL sur le chassis actif ce qui pourrait avoir un impact sur le trafic. Enfin, si cela ne permet pas de revenir dans le fonctionnement normal, nous devrons forcer le switchover sur le chassis #2 ce qui occasionnera un downtime de plusieurs minutes sur le routage à Roubaix3.

Date: 2010-04-09 13:23:02 UTC
Nous tentons une resynchro manuelle de la conf sur le chassis #2.

Date: 2010-04-09 13:22:41 UTC
La solution temporaire est en place.

Date: 2010-04-09 12:50:51 UTC
Un réseaux subit des problèmes de packet loss suite à ce problème : 188.165.195. Nous allons mettre en place une solution temporaire en attendant la résolution définitive.

Date: 2010-04-08 13:16:57 UTC
Nous suspendons les opérations sur les IPs failovers et MACs virtuelles sur le vss-3-6k pendant la resynchronisation de la conf

Date: 2010-04-08 13:05:08 UTC
Nous avons déconnecté complètement le chassis #2 pour tenter de synchroniser la config avec autre méthode.

Date: 2010-04-08 00:00:24 UTC
La synchro de la conf n'a pas fonctionné mais nous préférons ne pas forcer le switchover pour l'instant. Nous allons vérifier avec Cisco qu'elle est la meilleure manière de procéder.

Date: 2010-04-07 21:39:32 UTC
Le routage est actuellement géré à travers le chassis #1 uniquement. Le chassis #2 est en standby en raison d'un problème de synchro entre les 2 chassis. Nous allons maintenant tenter de resynchroniser les 2 chassis à la main afin de revenir dans un fonctionnement sur 2 chassis. Si cela ne fonctionne pas, nous devrons redémmarrer le chassis actif (le #1), le #2 prendra alors le relais mais avec un blackout d'environ 1-2min sur le routage.

Date: 2010-04-07 15:58:38 UTC
Le chassis 2 ne redémarre pas correctement mais se met dans en état \"STANDBY COLD\" ce qui signifie qu'il est prêt à démarrer en cas de problème sur le chassis #1 mais qu'il reste en attente.
Posted Apr 07, 2010 - 15:30 UTC