OVHcloud Web Hosting Status

Current status
Legend
  • Operational
  • Degraded performance
  • Partial Outage
  • Major Outage
  • Under maintenance
Appels entrants
Incident Report for Web Cloud
Resolved
Les appels entrants sont aléatoirement impactés par un problème réseau interne sur une machine interconnectée à nos SBCs d’interconnexion.
Ceci se manifeste par des appels coupés.

---

Les appels intra OVH ne sont pas impactés. Les appels provenant des clusters de proxys d’interconnexions (Appels hors réseau OVH) et nos briques Carrier SIP sont impactées par l'incident.

Update(s):

Date: 2020-11-17 10:14:48 UTC
Bonjour,

L'incident est totalement résolu suite à la mise en place du cache. Nous fermons cette tâche travaux.

Date: 2020-11-16 14:52:08 UTC
Le pic de trafic a été atteint, et nous ne constatons plus d'appels cassés avant ou après établissement. Le retour est donc positif.

Date: 2020-11-16 13:02:28 UTC
Le trafic augmente et nous ne constatons plus d'erreurs. Nous continuons le monitoring afin de s'assurer que la situation est bien résolue.

Date: 2020-11-16 12:09:06 UTC
Nous venons de :

- Remettre le nouveau cluster sur les trois briques
- Remettre le trafic des autres clusters sur la brique isolée (qui servait uniquement pour le nouveau cluster)

La situation est positive, nous continuons de monitorer.

Date: 2020-11-16 12:02:06 UTC
Ce matin nous nous sommes concentrés sur les queues TCP utilisées par notre stack SIP, pensant que notre dysfonctionnement provenait d'une saturation de ce côté. Après modification de la configuration, la situation ne s'est pas améliorée.

Afin d'éliminer un trafic qui provoquerait un mauvais comportement, nous avons isolé notre nouveau cluster de proxys d'interconnexion portant la nouvelle interconnexion Bouygues mise en production Mardi 10 Novembre sur une seule brique de routage.
Cette isolation nous a permis de constater une latence liée aux DNS utilisés pour nos briques de routage. Nous avons décidé d'appliquer un système de cache afin d’accélérer le traitement des requêtes. Cette modification a été appliquée sur deux briques, et les résultats sont positifs.

Nous surveillons les logs, et vous tenons informés.

Date: 2020-11-16 11:12:30 UTC
Depuis ce matin nous investiguons sur des appels qui sont cassés avant l'établissement ou après établissement de la communication. Ces cas arrivent car des réponses intermédiaires à un dialogue ne sont pas reçue
s par nos équipements de routage.
Les actions menées depuis ce matin ne donnent pas satisfactions pour le moment et ne permettent pas de résoudre totalement l'incident. Nous sommes toujours en cours de travail, et faisons la maximum pour rétablir la situation.

Nous vous prions de nous excuser pour la gêne occasionnée, et vous tiendrons informés via la tâche travaux.
Posted Nov 16, 2020 - 08:55 UTC
This incident affected: VoIP || Core Network.