Pour gérer vos consentements :

Challenge Cdiscount : le big data à la rescousse de la catégorisation des produits

Cdiscount (groupe Cnova) vient de récompenser les lauréats d’un concours orienté big data organisé via la plateforme Datascience.net .

Le challenge avait démarré en mai et il s’est étalé sur trois mois.

Avec un thème qui tient à cœur l’e-marchand qui dispose de 13 millions d’articles dans son catalogue répartis dans plus de 6000 catégories : la catégorisation automatique des produits à partir de leur description et de leur image.

Au final, 838 participants et 3533 contributions ont été recensés dans le cadre de ce Challenge. Et le meilleur score obtenu flirtait avec les 70% de réussite (68,32739%) à partir du jeu de données fourni par Cdiscount aux participants.

Bravo à Romain Ayres (Master intelligence artificielle, UMPC et Data scientist chez Octo) qui est parvenu à se hisser en haut du podium de ce « Challenge Cdiscount-datascience.net » et qui remporte au passage une prime de 9000 euros (et une tablette Cdisplay).

Les lauréats ont été distingués hier soir à l’occasion d’une cérémonie organisée hier soir à l’espace numérique parisien NUMA.

Elle est bien loin l’époque pionnière de Cdiscount qui vendait uniquement des CD/DVD sur Internet…

Emmanuel Grenier, co-CEO de Cnova, a remercié chaudement les participants à ce challenge sur un sujet qui lui tient à cœur : les données au sens large dans une méga-base de références, leur catégorisation qui prend en compte les spécificités des produits (taille, couleur…), leur qualité et leur rigueur d’exploitation pour en tirer le meilleur bénéfice.

Le sujet se complique encore plus quand Cdiscount intègre son propre catalogue avec celui de ses vendeurs en marketplace.

« Nous effectuons 100 millions de mises à jour au quotidien. Le système est assez darwinien », constate Emmanuel Grenier.

Les problématiques big data ne manquent pas pour un poids lourd du e-commerce en France comme Cdiscount.com (2,3 milliards d’euros de volume d’affaires en 2014, 16 millions de clients) : « Comment bien classer un produit dans un moteur pour qu’il reponte bien à la demande des clients ? », « Comment rendre le moteur intelligent », « comment cibler avec l’e-mailing », « Comment travailler avec Google », la « personnalisation des offres » et « le cross-sell ».

Le big data : un sujet traité par Cdiscount depuis trois ans

Louis Albert, Directeur Marketing de Cdiscount.com, résume le cœur du challenge : « On recense 3 millions de requêtes par mois sur notre moteur interne. Avec 13 millions de produits disponibles, comment faire le matching ? »

On arrive tout de suite à la barrière des algorithmes capables de soutenir le volume des produits, tout en maintenant le degré de pertinence des résultats.

Par exemple : comment affiner la pertinence de la requête générique « ordinateur portable » qui fournit d’emblée 2600 réponses et comment distinguer les meilleures offres pour le consommateur.

Chez Cdiscount, le big data est véritablement pris en main en interne depuis trois ans.

Au nom de l’enseigne marchande, le Chief Data Scientist Matthieu Cornec (qui a pris à l’occasion la casquette de président du Challenge Datascience de Cdiscount) dispose d’une équipe de 20 data scientists doués en mathématiques et/ou en informatique.

L’approche globale du big data se résume en trois ingrédients : les outils, les compétences et la mesure de la performance des résultats obtenus (A/B testing).

Il est encore trop tôt pour savoir si ce challenge permettra d’avancer dans l’optimisation opérationnelle de la catégorisation des produits sur Cdiscount.

Des méthodes et des approches prometteuses ont émergé avec ce concours de data scientists disposant de plus ou moins d’expériences.

Mais il reste encore beaucoup de chemin à faire pour que les avancées perçues se transforment en hausse de chiffre d’affaires perceptible chez Cdiscount.com.

Car c’est bien l’objectif ultime du site marchand au-delà de la performance technologique accomplie.

Félicitation au vainqueur du Challenge Cdiscount-datascience.net : Romain Ayres

Recent Posts

Cybersécurité : attention aux QR codes dans les PDF

Les attaques de phishing utilisant des QR codes frauduleux intégrés dans des documents PDF joints…

6 heures ago

Windows 11 : une mise à jour majeure apporte de nouvelles fonctionnalités

Microsoft a amorcé le déploiement de Windows 11 24H2. Passage en revue des nouvelles fonctionnalités…

1 mois ago

Microsoft 365 : comment Copilot se déploie dans toutes les applications

L'intégration de Copilot dans la suite bureautique s'accélère. Où trouver l'assistant IA et comment l'utiliser…

2 mois ago

PC Copilot + : Microsoft veut garder Recall

Microsoft annonce une phase expérimentale pour lancer Recall sur les PC Copilot+. Elle doit commencer…

2 mois ago

Windows 11 : comment Microsoft va réduire la taille des mises à jour

Comment réduire la taille des mises à jour de Windows 11 ? Microsoft annonce la…

4 mois ago

Windows 11 : comment Bloc-notes va remplacer WordPad

Déjà doté de la sauvegarde automatique, d'un compteur de caractères et de Copilot, Bloc-notes embarque…

4 mois ago