rssLink RSS for all categories
 
icon_red
icon_red
icon_green
icon_blue
icon_red
icon_green
icon_green
icon_red
icon_green
icon_blue
icon_green
icon_green
icon_green
icon_red
icon_red
icon_blue
icon_green
icon_red
icon_red
icon_green
icon_red
icon_green
icon_orange
icon_red
icon_orange
icon_green
icon_red
icon_blue
icon_green
icon_orange
 

FS#24338 — rbx6-sd1b-n9

Attached to Project— Reseau Internet et Baies
Incident
Roubaix   → RBX-6
CLOSED
100%
Le DHCP relay est impacté sur quelques vlans du routeur ; vlan365 (137.74.204.0) et vlan366 (137.74.205.0 )
Nous investiguons
Date:  Tuesday, 25 April 2017, 19:29PM
Reason for closing:  Done
Comment by OVH - Thursday, 20 April 2017, 21:24PM

Nous allons isoler le router a ( rbx6-sd1a-n9 ) dans le but de mettre a jour.
Le rbx6-sd1b-n9 prendra ainsi tout le trafic


Comment by OVH - Thursday, 20 April 2017, 21:58PM

Le rbx6-sd1b-n9 a pris tout le trafic


Comment by OVH - Thursday, 20 April 2017, 22:04PM

Le rbx6-sd1a-n9 reboot


Comment by OVH - Thursday, 20 April 2017, 22:36PM

Nous avons eu un impact lors du rétablissement de rbx6-sd1a-n9 de 22:16 a 22:30


Comment by OVH - Friday, 21 April 2017, 06:21AM

L'upgrade n'a pas fixé les problèmes dhcp.
Nous investiguons d'autres problèmes entre les machines et les N9.
Nous allons continuer les investigations avec les constructeurs.


Comment by OVH - Friday, 21 April 2017, 18:31PM

Nous allons redémarrer rbx6-27a-n56 ce soir 21 Avril 2017 entre 02h00 et 06h00 (GMT +2). Aucun impact prévue.


Comment by OVH - Saturday, 22 April 2017, 02:42AM

Nous allons débuter l'isolation de rbx6-27a-n56.


Comment by OVH - Saturday, 22 April 2017, 03:03AM

Quelque perte d'IP, on reload le A.


Comment by OVH - Saturday, 22 April 2017, 03:15AM

On remet en prod le A. les IP sont revenu UP.


Comment by OVH - Saturday, 22 April 2017, 03:34AM

Le A est UP, on refait la meme opération sur le B. donc on isole le B.


Comment by OVH - Saturday, 22 April 2017, 03:49AM

B isole, nous le rebootons.


Comment by OVH - Saturday, 22 April 2017, 04:01AM

Le switch est reboot. Nous le remettons en production.


Comment by OVH - Saturday, 22 April 2017, 04:21AM

Le switch est remis en prod. Nous continuons les test.


Comment by OVH - Saturday, 22 April 2017, 05:30AM

Nous voyons encore très peu de cas d'IP down qui semble être très isolé. Nous récoltons l'informations pour remonté à Cisco.


Comment by OVH - Saturday, 22 April 2017, 06:55AM

Nous voyons des packet drop sur rbx6-27a:
2017-04-22 04:20:01.527512 0c:c4:7a:df:27:a8 -> ff:ff:ff:ff:ff:ff LLC [Malformed Packet]
2017-04-22 04:20:01.582747 00:1e:67:ed:0c:ee -> ff:ff:ff:ff:ff:ff LLC [Malformed Packet]
2017-04-22 04:20:01.652621 00:1e:67:ed:14:76 -> ff:ff:ff:ff:ff:ff LLC [Malformed Packet]

Certaine mac voit leurs paquet broadcast bloqué. ARP, DHCP, etc. Ce qui explique les pertes de connectivité.


Comment by OVH - Saturday, 22 April 2017, 07:17AM

On remplace rbx6-27a par un spare. Nous l'isolons.


Comment by OVH - Saturday, 22 April 2017, 07:38AM

Nous avons un probleme VPC, tout les FEX sont passé en offline.


Comment by OVH - Saturday, 22 April 2017, 07:44AM

Les fex remonte peu à peu. 15 sur 20 up.


Comment by OVH - Saturday, 22 April 2017, 08:11AM

Les FEX vienne de retomber. Ça remonte à nouveau. La VPC semble revenu à la normale.


Comment by OVH - Saturday, 22 April 2017, 09:53AM

C'est stable, mais encore le même problème initiale. Nous ouvrons un case P1 avec Cisco.


Comment by OVH - Saturday, 22 April 2017, 10:41AM

La case est ouvert chez Cisco.
Nous allons isoler un des switchs


Comment by OVH - Saturday, 22 April 2017, 11:21AM

En coupant uniquement les uplinks des fex côté B le problème est fixé.
Nous restons dans cette configuration en attendant l'intervention de cisco


Comment by OVH - Tuesday, 25 April 2017, 19:29PM

Nous avons remis le B en production sauf FEX 114. Le vlan est stable. Il reste que le FEX 114 isolé sur le B car il est stable. Nous allons planifier lors d'une maintenance un diagnostique avancé sur le FEX 114. Nous n'avons pas trouvé la source de ce soucis temporaire et complètement aléatoire. Nous allons ouvrir une autre tâche pour le suivi du FEX 114.