OVHcloud Web Hosting Status

Current status
Legend
  • Operational
  • Degraded performance
  • Partial Outage
  • Major Outage
  • Under maintenance
ralentissement p19
Incident Report for Web Cloud
Resolved
Nous constatons des ralentissement sur les cluster de p19 nous investiguons

Update(s):

Date: 2018-04-27 17:26:35 UTC
L’ensemble des clusters est de nouveau opérationnel depuis 17h43, tous les services ont retrouvé leur niveau de performance nominal.

Voici quelques éléments concernant cet incident :

• 2018/04/27 09:30 CET : une attaque démarre, cette dernière n’est pas immédiatement détectée par nos anti-ddos et HIDS.

• 2018/04/27 10:30 CET : la surconsommation CPU liée à cette attaque provoque une surcharge électrique de 3 baies.

• 2018/04/27 11:00 CET : nos équipes corrigent ce problème de charge, les 3 baies sont alors remontées, les machines commencent à être redémarrées.

• 2018/04/27 12:30 CET : 80 % des machines sont opérationnelles.

• 2018/04/27 13:15 CET : l'ensemble des clusters est remonté. Cependant certaines machines présentent toujours de fortes instabilités. Les systèmes de répartition de charge d’OVH permettent de distribuer le trafic entrant afin de rétablir un niveau de performance satisfaisant.

• 2018/04/27 15:00 CET : plusieurs clusters sont de nouveau impactés par l'attaque. Des actions additionnelles sont mises en place via nos différents systèmes HIDS et anti-ddos.

• 2018/04/27 16:30 CET : l'attaque est mitigée, la charge des clusters diminue et les machines commencent à être remontées.

• 2018/04/27 17:43 CET : tous les clusters et l’ensemble des machines sont de nouveaux opérationnels.


Date: 2018-04-27 15:05:50 UTC
Dernier cluster006 en cours de résolution

Date: 2018-04-27 14:19:46 UTC
Nous stabilisons l'ensemble des clusters encore impactés :

cluster003 / cluster005 / cluster006 / cluster011 / cluster013

Date: 2018-04-27 13:19:51 UTC
Le problème semble persister, nous investiguons.

Date: 2018-04-27 11:59:48 UTC
De forts ralentissements ont été ressentis, voire dans certains cas des indisponibilités, sur les clusters suivants :

cluster002 (90) / cluster003 (240) / cluster005 (720) / cluster006 (media) / cluster011 (300gp) / cluster13 (20gp) / cluster014 (start) / cluster015 (mp) / cluster017

La situation est revenue à la normale à 13h15.


Date: 2018-04-27 11:10:45 UTC
Nous avons un souci sur 7 baies à P19. Nous sommes en train de fixer la situation.
Posted Apr 27, 2018 - 08:34 UTC
This incident affected: Web Hosting || Datacenter GRA (Cluster002, Cluster003, Cluster006, Cluster007, Cluster011, Cluster012, Cluster013, Cluster014, Cluster015, Cluster017, Cluster020, Cluster021, Cluster023, Cluster024, Cluster025, Cluster026, Cluster027, Cluster028, Cluster029, Cluster030, Cluster031).