OVHcloud Customer Services Status

Current status
Legend
  • Operational
  • Degraded performance
  • Partial Outage
  • Major Outage
  • Under maintenance
ovh.*
Incident Report for Customer Service
Resolved
Suite au lancement de .ovh, l'infrastructure qui héberge
a explosé. On est en train d'ajouter 50 nouveaux serveurs
dans le cluster pour essayer de tenir la charge.

Update(s):

Date: 2014-10-21 11:29:56 UTC
L'opération s'est déroulée avec succès

Date: 2014-10-02 15:55:58 UTC
Le systeme fonctionne désormais sans probleme.
Vous avez pu deposer 15000 noms de domaines
en .ovh et on continue les enregistrements à
la vitesse de 40 par minute. Le plus grand pic
était 100 par minute.

Les activitations de toutes les commandes vont
commencer. Vous allez pouvoir commencer à jouer
avec le nom de domaine :)

Date: 2014-10-02 13:47:52 UTC
Nous avons remis en route la commande.
Désolé pour le probleme sur le systeme
de la commande ce matin.

Depuis 9 mois on bosse sur la nouvelle
commande. Il y a encore pour 3 à 6 mois
et on va sortir de l'ancien systeme trop
monolitique pour nos besoins et le nombre
de commandes qu'on doit accepter par seconde

Date: 2014-10-02 13:05:44 UTC
La base a été migrée, on fixe le code pour prendre
la difference de comportement entre MySQL et PG
(majuscules/minuscules) et on redemarre. 15 min.

Date: 2014-10-02 11:26:56 UTC
On fixe un bout de code qui fait les mauvaises requetes
et qui est à l'origine de pannes d'un serveur SQL.

En parallele, on prepare la migration de cette base vers
PostGreSQL qui est mieux adaptée à ce type de requetes.

Date: 2014-10-02 11:06:05 UTC
Tous les termes de la TMCH sont dans la liste des termes bloqués.

Date: 2014-10-02 11:02:00 UTC
Nous avons recodé 90% du code pour le simplifier
en integrant tous les checks. La commande est UP
mais encaisse quand même difficilement la charge
qui est de 100 noms de domaines créés par .. seconde !
On a encore une requete à reecrire et on devrait
être plus rapide sur le depot.

Date: 2014-10-02 09:46:32 UTC
Le probleme vient en partie de check domaine sur
l'infrastructure technique de la Registry. Il est
limité à 100 res/min (!?) On le recode en interne
chez nous et on va l'enlever pour accepter toutes
les commandes.

Date: 2014-10-02 08:50:07 UTC
Allez, on reessaie si avec 35 serveurs ça tient ..

Date: 2014-10-02 08:34:03 UTC
Dans 5 minutes on redemarre la commande.

Date: 2014-10-02 08:24:04 UTC
On va redemarrer la commande vers 10h40

Date: 2014-10-02 08:02:21 UTC
Dans 30 minutes environ nous allons ajouter 15 premiers
serveurs dans le cluster (le temps de syncroniser le
systeme) et verifier l'ensemble. Et on essaie de tenir
la charge avec les 35 serveurs.

Dans tous les cas, on va rajouter 15 suivants avant midi.

Date: 2014-10-02 07:44:34 UTC
Nous avons coupé la commande. On rajoute les serveurs
et on remet la commande.
Posted Oct 02, 2014 - 07:22 UTC
This incident affected: Control panel & API || Control panel (EU, CA).