OVHcloud Bare Metal Cloud Status

Current status
Legend
  • Operational
  • Degraded performance
  • Partial Outage
  • Major Outage
  • Under maintenance
HG2010 qlogic
Incident Report for Bare Metal Cloud
Resolved
Nous constatons un bug très pénalisant sur certains serveurs HG2010 équipés des cartes 10Gbps Qlogic.
A un certain moment, une 20aine de serveurs ne sont plus accessibles sur le réseau.
On ne constate le problème que sur les serveurs sous Linux pour le moment.

Pendant cette coupure, la table ARP ne contient plus aucune MAC, et même si on force les entrées statiquement, ca ne fonctionne pas.
On pense à un bug du driver, mais on ne trouve aucune remontée ni bugfix dans ce sens.

La seule solution pour l'instant est le reboot soft effectué par nos équipes.

Toute information complémentaire (ou contradictoire par rapport à notre diagnostique) est la bienvenue: geg@ovh.net

Update(s):

Date: 2010-04-01 17:18:36 UTC
Un lot de serveurs est actuellement en panne a cause des qlogic.
Nous intervenons pour effectuer les remplacements par des cartes Intel

Date: 2010-04-01 17:15:22 UTC
Nous n'avancons pas suffisament sur la résolution.
Nous allons remplacer les Qlogic par des Intel.

Date: 2010-03-31 09:07:06 UTC
Nous avons localiser un problème au niveau du driver/firmware de la carte qlogic.
Nous sommes en contact avec qlogic afin d'obtenir rapidement une résolution pour updater/flasher les serveurs en question.
Posted Mar 29, 2010 - 09:52 UTC
This incident affected: Dedicated Servers || Global Infrastructure (RBX).