LookThatUp : ‘Nous analysons l’ADN des images’
La recherche et la navigation par l’image sur le Net ? Un vieux rêve en voie de concrétisation grâce à LookThatUp (« Jette un coup d’oeil » en français), société française créée en juillet 1999 par quatre chercheurs du groupe Images & Multimédia de l’Inria (Institut National de Recherche en Informatique et en Automatique)… Cofondateur et directeur des recherches et développement, Sébastien Gilles nous présente cette nouvelle technologie.
VNUnet : Quel est le principe de la technologie LookThatUp ?
Sébastien Gilles : LookThatUp propose une technologie de reconnaissance par le contenu de l’image exclusivement. Autrement dit, nous apprenons à l’ordinateur à « voir » et à « comprendre » ce que l’utilisateur lui soumet. Pour cela notre technologie s’appuie sur un système d’analyse de l’ADN des images, autrement dit sur les éléments de description de l’image que sont essentiellement les couleurs, les formes, les textures et l’organisation spatiale. A l’aide de puissants algorithmes génériques, basés notamment sur le croisement de l’ensemble de ces critères, le système détermine un paradigme qui servira de modèle sur lequel s’appuient la recherche et l’indexation des images similaires par principe de comparaison. Notre technologie repose donc sur la reconnaissance d’objets dans une image et sa comparaison par rapport à une base d’images qu’il connaît déjà par apprentissage. La base est enrichie automatiquement à chaque nouvelle requête. Le système reconnaît tout type de format d’image : bitmap, vidéo, graphique… L’avantage de cette technologie par rapport à une recherche textuelle est que justement l’image n’est pas soumise aux barrières des langues et parle de la même façon, ou presque, à tous les habitants de la planète.
Vous proposez trois produits : Image-Filter, Image-Seeker et Image-Shopper. Qu’est-ce qui les distingue ?Image-Filter permet de filtrer les images, généralement pornographiques, afin d’en interdire l’exploitation éventuelle. Filter attribue une note à l’image qu’il analyse : 0 pour anodine, 100 pour pornographique et la moyenne pour une image de « nu artistique » ou un peu osée. La pornographie étant une notion très suggestive, il est possible d’ajuster « manuellement » le seuil d’acceptabilité et de faire varier le comportement du logiciel entre laxiste et intransigeant. Filter s’adresse principalement aux fournisseurs d’accès, aux communautés en ligne et aux serveurs de news, des acteurs qui veulent héberger des images sans avoir besoin de les vérifier toutes manuellement.
Image-Shopper est un produit d’e-commerce qui permet aux marchands d’offrir un système de recherche par similarité sur leur catalogue. Concrètement, si je cherche une photo de Tour Eiffel de nuit avec un nuage sur la gauche, je sélectionnerai d’abord une image de Tour Eiffel, puis une tour Eiffel de nuit, puis une tour Eiffel avec nuage. L’objectif étant de trouver l’image en deux ou trois clics.
Sur le même principe de similarité, Image-Seeker permet la recherche sur des bases importantes de plusieurs millions d’images. Nous avons notamment installé ce système à l’Inpi (Institut national de la protection intellectuelle) qui permet des recherches instantanées parmi les millions de dessins stockés depuis 1920. La police s’en sert aussi pour faire des recherches par l’image dans des bases d’images pédophiles saisies afin de faire des recoupements avec d’autres affaires.
Les recherches peuvent s’effectuer à partir d’images déjà référencées ou bien à partir d’une nouvelle image soumise par l’utilisateur (trouvée sur Internet ou envoyée à partir d’une photo numérisée).
Comment s’effectue la mise en application ?Nous fonctionnons sous forme tripartite entre l’utilisateur, le serveur du partenaire et nos serveurs. La requête que soumet l’utilisateur au partenaire est automatiquement transmise à nos serveurs qui effectuent la recherche avant de renvoyer la réponse aux serveurs du partenaire. C’est transparent pour l’utilisateur et le partenaire doit juste introduire quelques lignes dans son code HTML. C’est un modèle ASP (Application Server Provider) où nous facturons selon le trafic généré. Nos serveurs stockent les catalogues d’images des partenaires qui en conservent l’accès pour les gérer en ligne. Filter travaille à partir d’une base interne de 60 000 images. Shopper s’appuie sur un catalogue de 200 000 images de tout ce qui se vend. Enfin, avec Seeker, le partenaire conserve sa base d’images chez lui.
Quel est le taux de fiabilité d’Image-Filter ?Le taux des images effectivement reconnues comme pornographiques est de 98 %. Celui des images mal interprétées, et donc stoppées par erreur, est de 10 à 15 %. Des chiffres qui devraient s’affiner avec « l’apprentissage » du logiciel.
La société a moins de deux ans. Combien de temps de recherche a nécessité cette technologie et vers quoi s’orienteront vos prochains développements ?Si on parle en « temps homme », 40 ans ! Ce qui inclut bien sûr les années passées à étudier l’image informatique avant notre rencontre il y a trois ans à l’Inria. Aujourd’hui, 28 personnes travaillent à LookThatUp. Nos recherches se poursuivent autour de l’amélioration de la recherche tant en termes de temps de calcul que de qualité de résultat. Nous travaillons aussi sur d’autres médias comme la vidéo et le texte.LookThatUp mode d’emploi