Il y a eu un problème électrique chez OVH, qui a coupé l'alimentation en énergie sur des baies entières.
Le problème se situait sur des barres conductrices dans une armoire électrique. Ce composant n'est pas redondé car passif (il ne s'agit que de conducteurs). Côté blg, le stockage de données se fait sur des NAS redondés 3 fois (3 serveurs différents avec une réplication de données).
Ce système nous permet de gérer sans impact / avec un rapide temps de bascule la perte d'un serveur, et peut aussi fonctionner avec une remise en route manuelle en cas de perte de deux serveurs sur les 3.Malheureusement, le problème technique OVH a impacté ces 3 machines, impactant les instances dont les données étaient stockées dessus.Si le problème avait perduré, nous aurions restauré des sauvegardes sur d'autres clusters.Une fois l'alimentation électrique rétablie par OVH, vers 21h40, les services impactés ont redémarré sans encombre.Informations publiques OVH : https://network.status-ovhcloud.com/incidents/8mq79l7wcx8p
Point d'amélioration :