rssLink RSS for all categories
 
icon_red
icon_red
icon_green
icon_blue
icon_orange
icon_green
icon_green
icon_red
icon_red
icon_blue
icon_green
icon_green
icon_green
icon_green
icon_red
icon_orange
icon_green
icon_green
icon_red
icon_red
icon_red
icon_green
icon_orange
icon_red
icon_orange
icon_green
icon_green
icon_green
icon_green
icon_orange
 

FS#4079 — vss-3-6k

Attached to Project— Reseau Internet et Baies
Incident
Tout le réseau
CLOSED
100%
Le chassis #2 semble avoir crashé. Nous recherchons l'origine du problème. Le routage s'effectue via le chassis #1.
Date:  Monday, 12 April 2010, 18:50PM
Reason for closing:  Done
Comment by OVH - Wednesday, 07 April 2010, 17:58PM

Le chassis 2 ne redémarre pas correctement mais se met dans en état "STANDBY COLD" ce qui signifie qu'il est prêt à démarrer en cas de problème sur le chassis #1 mais qu'il reste en attente.


Comment by OVH - Wednesday, 07 April 2010, 23:39PM

Le routage est actuellement géré à travers le chassis #1 uniquement. Le chassis #2 est en standby en raison d'un problème de synchro entre les 2 chassis. Nous allons maintenant tenter de resynchroniser les 2 chassis à la main afin de revenir dans un fonctionnement sur 2 chassis. Si cela ne fonctionne pas, nous devrons redémmarrer le chassis actif (le #1), le #2 prendra alors le relais mais avec un blackout d'environ 1-2min sur le routage.


Comment by OVH - Thursday, 08 April 2010, 02:00AM

La synchro de la conf n'a pas fonctionné mais nous préférons ne pas forcer le switchover pour l'instant. Nous allons vérifier avec Cisco qu'elle est la meilleure manière de procéder.


Comment by OVH - Thursday, 08 April 2010, 15:05PM

Nous avons déconnecté complètement le chassis #2 pour tenter de synchroniser la config avec autre méthode.


Comment by OVH - Thursday, 08 April 2010, 15:16PM

Nous suspendons les opérations sur les IPs failovers et MACs virtuelles sur le vss-3-6k pendant la resynchronisation de la conf


Comment by OVH - Friday, 09 April 2010, 14:50PM

Un réseaux subit des problèmes de packet loss suite à ce problème : 188.165.195. Nous allons mettre en place une solution temporaire en attendant la résolution définitive.


Comment by OVH - Friday, 09 April 2010, 15:22PM

La solution temporaire est en place.


Comment by OVH - Friday, 09 April 2010, 15:23PM

Nous tentons une resynchro manuelle de la conf sur le chassis #2.


Comment by OVH - Friday, 09 April 2010, 19:21PM

La synchro n'a pas fonctionnée. Nous allons intervenir cette nuit pour réinitialiser complètement le lien VSL sur le chassis actif ce qui pourrait avoir un impact sur le trafic. Enfin, si cela ne permet pas de revenir dans le fonctionnement normal, nous devrons forcer le switchover sur le chassis #2 ce qui occasionnera un downtime de plusieurs minutes sur le routage à Roubaix3.


Comment by OVH - Saturday, 10 April 2010, 00:04AM

Nous commencons l'intervention.


Comment by OVH - Saturday, 10 April 2010, 00:44AM

La reconfiguration des liens VSL sur le chassis #1 a permis de corriger le problèmes de synchronisation de config (le chassis #1 ne "voyait" en fait pas ses propres ports VSL). Nous n'aurons donc pas à forcer le switchover. Il n'y a pas eu d'impact sur le trafic si ce n'est quelques paquets perdus au moment ou le chassis #2 a rejoint le VSS (du a une sollicitation importante du CPU à ce moment là).
Le chassis #2 est donc maintenant de nouveau en "STANDBY HOT", le trafic s'écoulant de nouveau à travers les 2 chassis, c'est à dire le fonctionnement nominal.
Nous rebasculerons lundi, les uplinks des réseaux 188.165.195 et 188.165.199 qui avaient été déplacés sur le chassis #1.