rssLink RSS for all categories
 
icon_red
icon_red
icon_green
icon_blue
icon_orange
icon_green
icon_green
icon_red
icon_red
icon_blue
icon_green
icon_green
icon_green
icon_green
icon_red
icon_orange
icon_green
icon_green
icon_red
icon_red
icon_red
icon_green
icon_orange
icon_red
icon_orange
icon_green
icon_green
icon_green
icon_green
icon_orange
 

FS#3447 — fra-1-6k

Attached to Project— Reseau Internet et Baies
Incident
Tout le réseau
CLOSED
100%
Nous rencontrons actuellement les mêmes problème que sur le task #3428.
Date:  Sunday, 04 October 2009, 16:35PM
Reason for closing:  Done
Comment by OVH - Sunday, 04 October 2009, 02:15AM

Nous travaillons toujours sur le problème avec les ingénieurs du TAC cisco. L'utilisation du CPU sur la sup est anormalement élevée en raison d'une utilisation CPU anormale du process "IP Input". Le routeur effectue probablement en software une partie de traitements habituellement gérés en hardware.

Cette après-midi, nous avons tenté de redémarrer complètement le chassis sans succés. Nous avons coupé toutes les sessions BGP vers le routeur et depuis le routeur vers DEC-IX et TPSA. Ramener le trafic a un niveau plus bas nous a permis de récupérer progressivement la main sur le routeur et de pouvoir lancer les commandes de diag. L'utilisation CPU étant en effet maintenant directement lié au traffic. Nous sommes actuellement a un peu plus de 70% d'utilisation CPU.

Parallèlement au travail avec Cisco, un technicien partira sur Francfort dans quelques heures avec du matériel de spare afin d'éventuellement remplacer la sup ou l'une des cartes 10G. Arrivée prévue sur place aux environ de 12:00.

Une partie du traffic DEC-IX s'écoulant habituellement vers fra-1 s'écoule actuellement via notre second routeur, vers les autres points de peerings ou vers les transits. Le trafic TSPA s'écoule via les transits.


Comment by OVH - Sunday, 04 October 2009, 13:41PM

Le technicien est actuellement sur le site avec le matériel de spare. Nous allons remplacer la sup720. Le routeur sera offline pendant une dizaine de minutes.


Comment by OVH - Sunday, 04 October 2009, 14:49PM

Nous remontons les ports et les sessions BGP progressivement.


Comment by OVH - Sunday, 04 October 2009, 15:10PM

Il semble que le problème soit lié au lien vers Zurich. Dès que nous rétablissons ce lien, les symptomes réapparaissent. Nous avons pour l'instant réactivé toutes les sessions BGP et tous les liens sauf Zurich et le CPU utilisé par le process "IP Input" reste stable:

123 70848 172214 411 2.63% 3.22% 2.52% 0 IP Input

Nous allons installer une 6704 de spare sur le chassis et tenter de monter le lien vers Zurich dessus.


Comment by OVH - Sunday, 04 October 2009, 15:17PM

Dès que le lien vers Zurich remonte même sur une carte neuve, le "IP Input" commence à utiliser le CPU de manière anormale:

123 127580 289564 440 18.71% 15.58% 8.13% 0 IP Input


Comment by OVH - Sunday, 04 October 2009, 15:33PM

Même sans BGP, sans OSPF, sans trafic sur lien, le problème se manifeste. En fait dès que le port monte, l'utilisation CPU augmente instantanément. Idem en changeant l'optique.


Comment by OVH - Sunday, 04 October 2009, 16:35PM

On a changé les IP et ça marche.