Vision API : Google ajoute une dose de machine learning dans son cloud

Le machine learning est au coeur de l’API Vision, dédiée à la reconnaissance d’images et dont Google a agrémenté sa plate-forme cloud.

Greffé aux ERP pour optimiser les processus internes, associé à l’Internet des objets pour la maintenance prédictive, couplé au big data pour la personnalisation du parcours client… Le machine learning prend de l’importance dans l’offre des principaux fournisseurs cloud.

Microsoft en a fait l’une des thématiques centrales de sa Convergence EMEA 2015, organisée en début de semaine à Barcelone.

Du côté de Google, on travaille, entre autres, sur la mise en oeuvre de ces technologies d’apprentissage automatique dans le domaine de la reconnaissance de formes. L’interface de programmation Vision API en est l’illustration.

Ouverte en alpha privée (inscription sur formulaire), elle doit permettre aux développeurs d’intégrer, dans leurs applications, des « capacités d’interprétation » des images : reconnaissance de texte, identification d’objets, détection des visages et des émotions associées…

Sur le principe même du machine learning, Vision API s’améliore avec le temps, à mesure qu’elle est confrontée à de nouveaux concepts.

On pourra notamment l’exploiter pour qualifier, même approximativement, des images et des vidéos, en leur attribuant des mots-clés, voire des légendes ; autant d’informations indispensables pour un bon référencement dans les moteurs de recherche.

C’est en ce sens que Dropbox avait fait, l’année passée, l’acquisition de la start-up américaine KVBT. L’objectif était en l’occurrence d’améliorer le tri des photos hébergées par les utilisateurs de la plate-forme de stockage en ligne.

Yahoo avait procédé à un rachat similaire l’année précédente, avec LookFlow et sa solution de tri d’images « à la volée », avec des critères comme la récurrence d’un élément de décor ou les conditions météo.

Outre la construction de métadonnées, Vision API peut être utilisée pour modérer du contenu choquant ou mettre en place des actions marketing par analyse des sentiments.

Des perspectives s’ouvrent également dans la robotique, l’assistance aux personnes aveugles ou malvoyantes, la vidéo-protection (détection de comportements à risques ; mais pas l’identification des personnes, non disponible avec Vision API) et l’automobile (anticipation des situations dangereuses).

Google fait régulièrement le point sur ses avancées en matière d’intelligence artificielle appliquée à la reconnaissance d’images, avec en toile de fond ces travaux menés autour des réseaux neuronaux, inspirés du fonctionnement du cerveau humain.

En pratique, il y a encore des progrès à faire.

La machine fait (presque) aussi bien que l’humain dans certaines situations, par exemple pour reconnaître un groupe de jeunes jouant au frisbee, un cliché pris lors d’une épreuve de motocross, un troupeau d’éléphants dans la savane ou des pizzas posées sur une gazinière. Mais elle a encore du mal à déterminer, entre autres, si les deux joueurs de hockey présentés sur une image se disputent bien le palet ou s’ils se trouvent simplement sur le même plan.

Crédit photo : Kurhan – Shutterstock.com

Les Podcasts de Splunk

sponsorisé

Gestion de crises : les leçons d’un DSI

Gestion de crises : les leçons d’un DSI17:35

SNCF Connect & Tech explore toutes les voies de la rés…23:13

D'une mine à la supply chain, de l'OT à l’industrie 4.…22:33

Champs d'application et exigences NIS220:52

Retour d'expérience : mise en œuvre des exigences par…20:42

Comment simplifier la sécurisation de votre réseau tou…20:23

Sécurité renforcée : comment préparer la conformité à…20:56

Le savoir-faire règlementaire international de Cloudfl…20:32

Se protéger et remédier aux Attaques de Messagerie : U…21:48

[Episode en public] Les leçons de résilience d’OVH29:04

[Énergie] La résilience du réseau et sa mesure d'impact19:43

SASE : La fusion du SD-WAN et du SSE décryptée07:42

Quand la cyber-résilience investit l’espace16:31

Sécurité Multicouche : La clé pour une entreprise rési…16:11

Remettre l’humain au centre du cyber-espace16:55

L’IA, super-pouvoir du cyberespace09:39

Les enjeux de sécurité des médias internationaux de la…14:32

L’IA, un atout pour une continuité de service public p…16:50

Une cyber-résilience à l’aune de l’IA et des régulatio…19:25

Tous les Internets se valent-ils ?10:59

Decathlon : une culture agile à l’international20:08

Comment Carrefour a transformé la crise sanitaire en t…12:48

Comment Groupama s’assure d’être résilient face aux cr…13:48

Comment impulser une culture data dans une grande entr…14:17

Hors-série : La data du futur (Volume 1)08:28

Cegid : la tête dans le Cloud22:16

Hors-série : La data du futur (Volume 2)07:30

La data au service des verres intelligents chez Essilo…09:42

La vision conseil de Deloitte sur la data et l’IA19:04

Data altruisme et IA responsable au Crédit Mutuel Arkéa11:54

[BONUS] La Data Responsable : une vision écologique23:08

Vision API : Google ajoute une dose de machine learning dans son cloud

S’abonner

Google abandonne définitivement Flash

Google : pourquoi la suppression des données ne profite pas aux utilisateurs

Deepfake : Google rentre dans le jeu

Cybersécurité : cinq mesures pour protéger ses réseaux

Comprendre «l'après» peut aider les entreprises à se protéger contre les ransomwares

13 conseils pour télétravailler en toute sécurité

Choisir son fournisseur Cloud, une décision stratégique pour les PME

Le stockage dans le cloud continue d’inquiéter les PME

Numérique : le temps de l'augmentation est venu