FS#4079 — vss-3-6k
Attached to Project— Reseau Internet et Baies
| Incident | |
| Tout le réseau | |
| CLOSED | |
![]() |
Le chassis #2 semble avoir crashé. Nous recherchons l'origine du problème. Le routage s'effectue via le chassis #1.
Date: Monday, 12 April 2010, 18:50PMReason for closing: Done
RSS for all categories

Le chassis 2 ne redémarre pas correctement mais se met dans en état "STANDBY COLD" ce qui signifie qu'il est prêt à démarrer en cas de problème sur le chassis #1 mais qu'il reste en attente.
Le routage est actuellement géré à travers le chassis #1 uniquement. Le chassis #2 est en standby en raison d'un problème de synchro entre les 2 chassis. Nous allons maintenant tenter de resynchroniser les 2 chassis à la main afin de revenir dans un fonctionnement sur 2 chassis. Si cela ne fonctionne pas, nous devrons redémmarrer le chassis actif (le #1), le #2 prendra alors le relais mais avec un blackout d'environ 1-2min sur le routage.
La synchro de la conf n'a pas fonctionné mais nous préférons ne pas forcer le switchover pour l'instant. Nous allons vérifier avec Cisco qu'elle est la meilleure manière de procéder.
Nous avons déconnecté complètement le chassis #2 pour tenter de synchroniser la config avec autre méthode.
Nous suspendons les opérations sur les IPs failovers et MACs virtuelles sur le vss-3-6k pendant la resynchronisation de la conf
Un réseaux subit des problèmes de packet loss suite à ce problème : 188.165.195. Nous allons mettre en place une solution temporaire en attendant la résolution définitive.
La solution temporaire est en place.
Nous tentons une resynchro manuelle de la conf sur le chassis #2.
La synchro n'a pas fonctionnée. Nous allons intervenir cette nuit pour réinitialiser complètement le lien VSL sur le chassis actif ce qui pourrait avoir un impact sur le trafic. Enfin, si cela ne permet pas de revenir dans le fonctionnement normal, nous devrons forcer le switchover sur le chassis #2 ce qui occasionnera un downtime de plusieurs minutes sur le routage à Roubaix3.
Nous commencons l'intervention.
La reconfiguration des liens VSL sur le chassis #1 a permis de corriger le problèmes de synchronisation de config (le chassis #1 ne "voyait" en fait pas ses propres ports VSL). Nous n'aurons donc pas à forcer le switchover. Il n'y a pas eu d'impact sur le trafic si ce n'est quelques paquets perdus au moment ou le chassis #2 a rejoint le VSS (du a une sollicitation importante du CPU à ce moment là).
Le chassis #2 est donc maintenant de nouveau en "STANDBY HOT", le trafic s'écoulant de nouveau à travers les 2 chassis, c'est à dire le fonctionnement nominal.
Nous rebasculerons lundi, les uplinks des réseaux 188.165.195 et 188.165.199 qui avaient été déplacés sur le chassis #1.