Aide à la numérisation d'ouvrages : Google met la main sur ReCaptcha

Pour améliorer la numérisation de livres anciens via Google Books, Google a racheté la start-up ReCaptcha, qui développe des services de sécurisation IT en utilisant la technologie d’identification Captcha.

Google poursuit sa politique de croissance externe : après le rachat cet été de On2 Technologies, fournisseur américain de technologies vidéo, la firme de Mountain View vient de mettre le grappin sur la firme ReCaptcha, qui développe des technologies de sécurisation contre les spams et d’aide à la numérisation d’ouvrages. Le montant de la transaction n’a pas été dévoilé.

Basé à Pittsburgh, aux Etats-Unis, ReCaptcha n’emploie que six personnes et se définit comme « un service anti-bot garuit qui aide à la numérisation de livres ». Cette jeune pousse américaine fournit à plus de 100 000 sites Web une protection de type Captcha contre les spams et la fraude en ligne.

Connue de nombreux internautes, la technologie Captcha (Completely Automated Public Turing test to Tell Computers and Humans Apart) affiche sur l’écran de l’ordinateur une série de lettres et chiffres déformés, afin de vérifier que la personne derrière l’ordinateur est bien un humain, et non un robot pourvoyeur de spams. Cette technique est notamment employée pour la création d’une adresse de messagerie électronique ou un changement de mot de passe.

Mais la raison de l’acquisition de ReCaptcha par Google n’est pas seulement liée à la volonté de mieux sécuriser les services en ligne du géant de l’Internet. Google devrait aussi utiliser les compétences de la start-up pour son service de numérisation d’ouvrages Google Books, actuellement sous le feu des projecteurs, aux Etats-Unis comme en Europe.

La firme de Mountain View compte en effet utiliser une autre technologie mise au point par ReCaptcha : la reconnaissance optique des caractères (OCR – Optical Character Recognition). Les mots Captcha utilisés par ReCaptcha sont issus de la numérisation de journaux ou d’ouvrage anciens. Si les ordinateurs ne peuvent pas reconnaître ce type de texte, c’est parce que, précise Google sur son blog, l’encre et le papier alors utilisés se sont dégradés avec le temps. Les lecteurs optiques actuels sont alors incapables de reconnaître ces caractères anciens.

Mais lorsque les internautes tapent à leur tour les lettres déformées proposées par le Captcha de ReCaptcha à plus de 100 000 sites, ils aident l’ordinateur à comprendre, en tapant les caractères identifiées sur leur machine, les textes mal imprimés des ouvrage numérisés par Google Books.

Les Podcasts de Splunk

sponsorisé

Gestion de crises : les leçons d’un DSI

Gestion de crises : les leçons d’un DSI17:35

SNCF Connect & Tech explore toutes les voies de la rés…23:13

D'une mine à la supply chain, de l'OT à l’industrie 4.…22:33

Champs d'application et exigences NIS220:52

Retour d'expérience : mise en œuvre des exigences par…20:42

Comment simplifier la sécurisation de votre réseau tou…20:23

Sécurité renforcée : comment préparer la conformité à…20:56

Le savoir-faire règlementaire international de Cloudfl…20:32

Se protéger et remédier aux Attaques de Messagerie : U…21:48

[Episode en public] Les leçons de résilience d’OVH29:04

[Énergie] La résilience du réseau et sa mesure d'impact19:43

SASE : La fusion du SD-WAN et du SSE décryptée07:42

Quand la cyber-résilience investit l’espace16:31

Sécurité Multicouche : La clé pour une entreprise rési…16:11

Remettre l’humain au centre du cyber-espace16:55

L’IA, super-pouvoir du cyberespace09:39

Les enjeux de sécurité des médias internationaux de la…14:32

L’IA, un atout pour une continuité de service public p…16:50

Une cyber-résilience à l’aune de l’IA et des régulatio…19:25

Tous les Internets se valent-ils ?10:59

Decathlon : une culture agile à l’international20:08

Comment Carrefour a transformé la crise sanitaire en t…12:48

Comment Groupama s’assure d’être résilient face aux cr…13:48

Comment impulser une culture data dans une grande entr…14:17

Hors-série : La data du futur (Volume 1)08:28

Cegid : la tête dans le Cloud22:16

Hors-série : La data du futur (Volume 2)07:30

La data au service des verres intelligents chez Essilo…09:42

La vision conseil de Deloitte sur la data et l’IA19:04

Data altruisme et IA responsable au Crédit Mutuel Arkéa11:54

[BONUS] La Data Responsable : une vision écologique23:08

Aide à la numérisation d’ouvrages : Google met la main sur ReCaptcha

S’abonner

Sécurité IT : des chercheurs ont pris la tangente avec reCaptcha

Fraude au CAPTCHA : Google passe entre les gouttes

Vicarious invente un logiciel capable de résoudre les captcha

Cybersécurité : cinq mesures pour protéger ses réseaux

Comprendre «l'après» peut aider les entreprises à se protéger contre les ransomwares

13 conseils pour télétravailler en toute sécurité

Choisir son fournisseur Cloud, une décision stratégique pour les PME

Le stockage dans le cloud continue d’inquiéter les PME

Numérique : le temps de l'augmentation est venu