#ovhdown : une panne OVH sur un point de peering à Francfort
Cet après-midi, un incident réseau a perturbé 75% du trafic d’OVH. Octave Klaba a pris la main sur la comm’ clients.
OVH a rencontré un problème sérieux mais ponctuel de routage qui a impacté sérieusement son réseau. Le souci devrait être résolu en soirée.
Vers 17H00, des clients commençaient à émettre des alertes sur Twitter pour signaler l’anomalie via le hashtag #ovhdown.
En fait, cela a affecté 75% du trafic du fournisseur de services Internet (hébergement, location de serveurs…), selon Octave Klaba, fondateur d’OVH et Directeur technique et de l’innovation.
Dans une contribution sur le forum OVH Tasks, il précise l’origine de l’incident qui « vient d’un point de peering DECIX à Francfort ».
Octave Klaba poursuit : « L’un des réseaux AS31500 nous a annoncé via le BGP ‘tout Internet’. C’est une erreur de manipulation qui arrive assez souvent et nous avons des mécanismes de protection pour filtrer ce genre d’erreurs humaines. »
Mais, a priori, ce mécanisme n’a pas été mis en place sur la connexion avec ce réseau-là.
C’est l’engrenage : « 75% de notre trafic a été aspiré par ce réseau, à travers Francfort et ça a provoqué une panne. Nous avons coupé la session BGP avec cet AS et nous avons stabilisé le routage. »
Octave Klaba fournit toujours des efforts pour donner des explications rapides à la communauté des clients OVH en cas de défaillance. Ce qui est loin d’être le cas parmi les prestataires réseaux et services BtoB à destination des entreprises.
L’incident est présenté comme « un oubli » de la part d’OVH « lors de récentes migrations de routeurs en Europe ». « On cherche à quel moment cette erreur s’est glissée dans nos configurations », poursuit le directeur technique à l’origine d’OVH.
Le 29 juillet 2015, le prestataire IT du Nord de la France avait aussi rencontré des soucis temporaires de réseau d’une portée inhabituelle en raison d’une « erreur humaine » sur la gestion d’un routeur et d’un bug BGP.
Là aussi, une communication par voie de forum avait été enclenchée rapidement pour rassurer les clients.
(Illustration : photothèque OVH)