OVHcloud Web Hosting Status

Current status
Legend
  • Operational
  • Degraded performance
  • Partial Outage
  • Major Outage
  • Under maintenance
HA Infrastructure voix
Scheduled Maintenance Report for Web Cloud
Completed
Bonjour,

Un important correctif de gestion de la haute disponibilité de nos clusters nous a été livré par notre constructeur. Ce module corrige un bug que nous avons rencontré à deux reprises, pouvant provoquer une bascule de cluster inopinée.

Afin de vous assurer un service stable, et une gestion de la haute disponibilité sans failles nous allons déployer ce correctif sur l'ensemble de l'infrastructure. L'intervention comporte plusieurs étapes :

- Appliquer le correctif sur le cluster passif
- Appliquer le correctif sur le cluster actif
- Relancer le module de haute disponibilité sur le cluster actif

La relance du module provoquera une perturbation de quelques secondes sur le service concerné. Nous serons sur le pont afin d'assurer une reprise du trafic en douceur et sans impacts pour votre service.

Les dates d'intervention sont :

- C4 : Nuit du 11 Juin 2018 au 12 Juin 2018 à partir de 23h30 -> DONE
- C5B / C5C : Nuit du 12 Juin 2018 au 13 Juin 2018 à partir de 23h30 -> DONE
- C5D / Proxy Abonnés 1 : Nuit du 13 Juin 2018 au 14 Juin 2018 à partir de 23h30 -> DONE
- Proxy Abonnés 2 / Proxy Abonnés 3 : Nuit du 18 Juin 2018 au 19 Juin 2018 à partir de 00h00 -> DONE
- Proy interco 1 et 2 : Nuit du 19 Juin 2018 au 20 Juin 2018 à partir de 23h30 -> DONE
- C5A : Nuit du 20 au 21 Juin 2018 à partir de 2h -> DONE
- Base de données 1 : Nuit du 25 au 26 Juin 2018 à partir de 23h30 -> DONE
- Base de données 2 : Nuit du 26 au 27 Juin 2018 à partir de 23h30 -> DONE
- Base de données 3 : Nuit du 27 au 28 Juin 2018 à partir de 23h30 -> DONE
- Base de données 4 : Nuit du 28 au 29 Juin 2018 à partir de 23h30 -> DONE

Nous vous tenons informé via cette tâche du bon déroulement des interventions.

Update(s):

Date: 2018-06-28 22:58:22 UTC
All done !

Date: 2018-06-28 22:55:12 UTC
Tout s'est bien déroulé, le cluster HA est rétabli.

Date: 2018-06-28 22:43:47 UTC
Le correctif est appliqué sur l'actif, nous passons au cluster passif.

Date: 2018-06-28 22:31:00 UTC
Bonsoir,

Nous démarrons l'intervention sur DB4, associée à C5D. Pas d'impact à prévoir. Nous commençons par l'actif.

Date: 2018-06-27 22:50:11 UTC
Intervention réalisée avec succès. Prochaine intervention la nuit du 28 au 29 Juin.

Date: 2018-06-27 22:34:19 UTC
Le correctif est appliqué sur l'actif, nous passons au cluster passif.

Date: 2018-06-27 22:19:01 UTC
Bonsoir,

Nous démarrons l'intervention sur DB3, associée à C5C. Pas d'impact à prévoir. Nous commençons par l'actif.

Date: 2018-06-26 22:19:48 UTC
Intervention réalisée avec succès. Prochaine intervention la nuit du 27 au 28 Juin.

Date: 2018-06-26 22:09:08 UTC
Le correctif est appliqué sur l'actif, nous passons au cluster passif.

Date: 2018-06-26 22:04:18 UTC
Bonsoir,

Nous démarrons l'intervention sur DB2, associée à C5B. Pas d'impact à prévoir. Nous commençons par l'actif.

Date: 2018-06-25 22:00:47 UTC
Le correctif a été appliqué sur le passif également. Le cluster HA est rétablit sur DB1.

Prochaine intervention dans la nuit du 26 au 27 Juin à partir de 23h30.

Date: 2018-06-25 21:54:26 UTC
Tout est ok, nous relançons le passif. Aucun impact sur le service à signaler.

Date: 2018-06-25 21:37:12 UTC
Correctif appliqué sur le cluster actif. Nous vérifions les logs.

Date: 2018-06-25 21:32:55 UTC
Bonsoir,

Nous allons opérer ce soir sur la base de données liée à C5A. Nous démarrons par le cluster actif.

Date: 2018-06-21 01:18:45 UTC
Le module a été relancé sur le passif.

Le module est à jour sur C5A, le HA est rétablit.

Date: 2018-06-21 01:00:19 UTC
La reprise des MGCP en état instable est en cours. L'opération devrait être terminé d'ici 5 min.
Tout se passe comme prévu sur le cluster.

Date: 2018-06-21 00:56:33 UTC
Le module a été relancé et le service reprend. Tout se passe bien.
Nous vérifions la reprise des MGCP.

Date: 2018-06-21 00:54:54 UTC
Nous allons relancer le module sur l'actif. Perturbations durant quelques secondes sur l'émission et la réception d'appels.

Date: 2018-06-21 00:17:37 UTC
Bonsoir,

L'intervention va démarrer sur C5A. Pas d'impact : nous préparons le correctif sur le cluster puis le module sera relancé.



Date: 2018-06-20 12:20:06 UTC
Bonjour,

Nous décalons l'intervention de ce 20 Juin à un peu plus tard dans la nuit afin de limiter au maximum l'impact sur le service.

Date: 2018-06-19 23:09:33 UTC
Cluster HA de nouveau opérationnel sur le second proxy d'interconnexions.

L'intervention est terminée pour cette nuit.

Date: 2018-06-19 23:08:01 UTC
Nous relançons le passif, pas d'impact à prévoir.

Date: 2018-06-19 23:01:28 UTC
Équipement actif du proxy d'interconnexions 2 relancé. Nous attaquons le passif, pas d'impact à prévoir.

Date: 2018-06-19 22:59:12 UTC
Nous allons relancer le module sur le passif. Perturbations sur les appels établis depuis ou vers certaines interconnexions à prévoir durant quelques secondes.

Date: 2018-06-19 22:52:44 UTC
La relance a été effectuée sur le passif, le cluster a maintenant retrouvé son HA.

Nous attaquons le second proxy d'interconnexions.

Date: 2018-06-19 22:48:04 UTC
La relance s'est bien passé le service est de nouveau fonctionnel après une coupure de quelques secondes sur ce proxy.

Nous appliquons le correctif sur le passif, pour rétablir le cluster HA.

Date: 2018-06-19 22:39:16 UTC
Relance du module sur l'actif. Perturbations sur les appels établis depuis ou vers certaines interconnexions à prévoir durant quelques secondes.

Date: 2018-06-19 22:25:52 UTC
Bonsoir,

Nous allons démarrer l'intervention sur les proxys d'interconnexions. Nous avons décalé l'heure de démarrage afin de limiter l'impact.
Lors de la relance du module, les appels établis ou en cours d'établissement pourront être perturbés.

Nous démarrons par le proxy d'interconnexions 1. Pas d'impact pour le moment.

Date: 2018-06-18 23:38:52 UTC
Le module a correctement été relancé sur le passif du proxy 3.
L'intervention est terminée pour cette nuit, les sessions ont repris sur les deux proxy et le HA est rétablit.

La suite demain, sur nos deux proxys d'interconnexions à partir de 23h30.

Date: 2018-06-18 23:36:30 UTC
Le module va être relancé sur le proxy 3 afin de rétablir le HA. Pas d'impact à prévoir.

Date: 2018-06-18 23:26:11 UTC
L'actif a été relancé, tout se passe comme prévu. Les sessions remontent.

Une fois cette étape terminée, nous relancerons le passif afin de rétablir le cluster HA.

Date: 2018-06-18 23:24:20 UTC
Tout est bon pour le proxy 2.

Nous relançons le module sur l'actif du proxy 3. Les enregistrements sur ce proxy peuvent êtres perturbés durant quelques secondes.

Date: 2018-06-18 22:58:16 UTC
La relance du module sur le passif a été effectuée avec succès sur le proxy 2.

Le proxy 3 est prêt à être relancé, nous attendons la fin de la reprise des dernières sessions sur le proxy 2.

Date: 2018-06-18 22:54:59 UTC
Nous relançons le module sur le passif. Pas d'impact à prévoir sur le service.

Nous préparons en parallèle l'intervention sur le troisième proxy.

Date: 2018-06-18 22:32:56 UTC
La relance du module a été faite est s'est bien passée ! Les sessions remontent progressivement sur le proxy. Tout se passe comme prévu.
Nous surveillons que la reprise s'effectue correctement avant de relancer le passif.

Date: 2018-06-18 22:29:46 UTC
Nous allons relancer le module de gestion du HA sur le proxy d'abonnés numéro 2. Les enregistrements sur ce proxy peuvent êtres perturbés durant quelques secondes.

Date: 2018-06-18 22:15:58 UTC
Bonsoir,

Intervention sur nos deux derniers proxy d'accès cette nuit.

Nous commençons par notre proxy numéro 2 : intervention en cours sur le passif. Pas d’impact sur le service.



Date: 2018-06-13 23:36:19 UTC
C'est terminé pour ce soir, tout est ok : le service est pleinement fonctionnel.

Date: 2018-06-13 23:17:25 UTC
Le cluster C5D est terminé. Nous surveillons les logs et le comportement du service.

Date: 2018-06-13 23:16:21 UTC
La relance du module sur l'actif a été effectuée : tout s'est bien passé. L'impact a été très faible, le traitement sur les MGCP est terminé.

Nous relançons le module sur le passif.

Date: 2018-06-13 23:15:40 UTC
Tout est prêt sur C5D. Nous allons relancer le module. Des difficultés à recevoir ou émettre les appels durant les prochaines secondes sont possibles.

Date: 2018-06-13 23:00:00 UTC
Tout s'est bien passé pour notre proxy.

Nous démarrons maintenant l'intervention sur C5D. Pas d'impact à prévoir, nous préparons le correctif.

Date: 2018-06-13 22:36:57 UTC
Nous relaçons le module sur le passif, pas d'impact à prévoir.

Date: 2018-06-13 22:19:43 UTC
Le module a été correctement relancé. Le traitement des enregistrements reprend normalement, nous surveillons l'activité.

Date: 2018-06-13 22:17:02 UTC
Nous allons relancer le module sur le proxy, les enregistrements des téléphones seront perturbés durant quelques secondes.

Date: 2018-06-13 21:57:52 UTC
Bonsoir,

Nous démarrons l'intervention. Nous débutons par le premier proxy d'accès. Pas d'impact à prévoir a cet instant.

Date: 2018-06-13 00:04:19 UTC
C'est terminé pour C5C. Tout s'est bien passé pour ces deux infras.

Date: 2018-06-12 23:39:56 UTC
Le module est relancé, le service est fonctionnel. Nous surveillons la reprise, et lançons le traitement sur les MGCP.

Date: 2018-06-12 23:35:37 UTC
Le module va être relancé sur l'actif de C5C. Les appels sortants et entrants peuvent êtres perturbés durant quelques secondes.

Date: 2018-06-12 23:28:06 UTC
Le traitement des MGCP est maintenant terminé sur C5B ! Le service est pleinement fonctionnel, nous attaquons maintenant le cluster C5C.

Date: 2018-06-12 22:57:27 UTC
Le passif est à présent sur le dernier correctif. Le cluster HA est rétablit sur C5B.

Le traitement des MGCP est toujours en cours, nous préparons ne parallèle l'intervention sur C5C.

Date: 2018-06-12 22:55:23 UTC
Pendant que le traitement sur les MGCP se fait, nous relançons le module sur le passif. Pas d'impact à prévoir.

Date: 2018-06-12 22:37:29 UTC
Rien à signaler depuis le déploiement du correctif. La vérification et correction des MGCP est toujours en cours.

Date: 2018-06-12 22:26:28 UTC
Le correctif est déployé sur l'actif. Tout se passe comme prévu, nous vérifions actuellement les téléphones MGCP.

En parallèle nous maintenons la surveillance des logs afin de s'assurer que tout se déroule comme il faut.

Date: 2018-06-12 22:16:41 UTC
Le correctif est appliqué sur les deux cluster. Nous allons relancer le module sur l'actif. Les appels entrants et sortants peuvent être perturbés durant quelques secondes.

Date: 2018-06-12 22:02:22 UTC
Bonsoir,

Nous reprenons les interventions. Nous démarrons par le cluster C5B.

Date: 2018-06-11 23:11:39 UTC
Le comportement obtenu sur le cluster C4 n'est pas normal. Nous préférons annuler l'intervention pour C5A ce soir, et nous contactons notre constructeur afin de vérifier les logs générés.

Nous vous tenons informé via cette tâche dés que nous avons un retour. Le service est pleinement opérationnel.

Date: 2018-06-11 23:03:06 UTC
Le cluster C4 est mis à jour. Nous avons eu un redémarrage d'une lame, nous analysons les logs afin de comprendre la raison.

Le service est opérationnel.

Date: 2018-06-11 22:53:12 UTC
Nous relançons sur le C4. Le service sera impacté durant quelques secondes avec des difficultés à emmètre / recevoir des appels.

Date: 2018-06-11 22:17:16 UTC
Tout est prêt sur le C4, nous temporisons l'intervention afin d'être un peu plus dans le creux d'appels.

Nous préparons en parallèle le cluster C5A.

Date: 2018-06-11 21:54:13 UTC
Bonsoir,

Nous démarrons par le C4.
Pas d'impact à prévoir pour le moment, nous installons le correctif sans relancer le module.
Posted May 31, 2018 - 09:21 UTC
This scheduled maintenance affected: VoIP || Core Network.