France.fr : les erreurs à éviter lors du lancement d’un site Web d’envergure
Après l’incident technique du portail France.fr, quelles sont les leçons à tirer pour éviter un tel cafouillage ? Enquête avec des témoignages d’experts IT.
L’incident technique, qui a contraint le portail France.fr à couper le service afin de revoir son architecture technique, sera-t-il un énième cas d’école ?
La médiatisation importante liée à l’ouverture de sites Web d’envergure entraîne ce genre de mésaventure.
Ce fut le cas du Géoportail inauguré en juin 2006 ou plus récemment du site de Carla Bruni ouvert en octobre 2009.
Pourtant, selon les chiffres communiqués par les responsables IT de France.fr, l’hébergement semblait correctement dimensionné : une dizaine de serveurs ont livré le contenu à 50 000 visiteurs durant la première journée d’exploitation.
Mais hélas, l’infrastructure n’aura pas tenu la charge.
Tentative de décryptage de cet incident déplorable avec l’appui de plusieurs experts IT.
Le choix du CMS : stratégique
Pour l’exploitation éditoriale du portail France.fr (géré par le Service d’information du gouvernement ou SIG), c’est Drupal qui a été retenu.
L’outil open source de gestion de contenus (CMS en anglais) est bien connu puisqu’il sert de moteur pour des médias en ligne comme Rue89 ou encore le site Web de la chaîne France24.
Les équipes de développement des deux médias contribuent d’ailleurs à l’amélioration de l’application capable, selon ses créateurs, de supporter une certaine charge de trafic (voir entretien Silicon.fr de juillet 2009).
Mais malgré la bonne volonté des développeurs de Drupal, il semblerait que des utilisateurs aient déjà rencontré des problèmes avec la montée en charge ou les pics de trafic.
France24 explique notamment dans une étude de cas qu’elle a rencontré des soucis avec la base de données.
C’est précisément sur ce point que semble avoir péché France.fr si l’on en croit les propos d’un responsable du projet pour le compte de Cyberscope, en charge de l’hébergement du site.
Selon les éléments fournis à l’AFP, le problème technique serait lié à la base de données: « Elle a été construite d’une manière qui ne correspond pas à l’usage » du site.
Interrogé par ITespresso.fr, Benoit Jacquemont, directeur technique chez Smile (intégration de solutions open source) considère « qu’il n’y a pas vraiment de CMS adapté à une montée en charge. Car tous sont conçus pour éviter ce genre d’incident. Un CMS est là pour fournir du contenu en lecture. »
D’un point de vue général, Benoit Jacquemont explique que « le choix d’un CMS est avant tout lié aux fonctionnalités. »
« La complexité de Drupal réside dans l’ajout de modules supplémentaires et dans la bonne compréhension de ces modules qui fonctionnent comme des applications indépendantes », déclare-t-il. « Mais le système cache peut soulager les machines lors d’une forte sollicitation et ainsi réduire les accès à la base de données pour éviter l’incident. »
Selon le représentant de Smile qui a publié en 2010 un livre blanc sur le choix d’un CMS,« le système de cache est primordial pour soulager l’infrastructure (…) généralement, on va ajouter du cache (reverse proxy, proxy cache). »
« Nous avons déjà repoussé légèrement la date de mise en production d’un projet pour améliorer l’architecture technique (…) on ne met pas en ligne un site en ligne si l’on sait qu’il ne tiendra pas la charge » , conclut Benoit Jacquemont.
(Lire la suite de l’article page 2)