Categories: Cloud

Translate Community : le crowdsourcing appliqué à Google Traduction

Google sollicite les internautes pour faire tomber les barrières de la langue.

Le groupe Internet vient de lancer un programme collaboratif visant à améliorer l’algorithme lié à son service Translate. Pour prendre part à cette expérience en mode crowdsourcing, il faut maîtriser au moins deux langues et posséder nécessairement des compétences en anglais, autour duquel tout gravite.

L’utilisateur aura à traduire des mots, groupes de mots ou phrases simples grâce à un clavier virtuel adaptée à la langue sélectionnée. Son concours sera précieux pour aborder des spécificités grammaticales, syntaxiques et culturelles que la machine a pour le moment des difficultés à interpréter.

En tête de liste, les variations de sens d’un même terme, qu’elles soient d’ordre diatopique (dépendant de la région), diachronique (en fonction des générations), diastratique (selon la dimension sociale et démographique) ou diaphasique (d’après le registre de langue). Il s’agira également de s’ouvrir progressivement aux dialectes non encore pris en charge, comme l’Ouzbek ou le Cherokee. En fonction de l’engouement qui naîtra dans cette communauté, Google n’exclut pas d’aborder la question des langues vernaculaires, c’est-à-dire locales.

L’exercice porte sur des mots ou des phrases simples.

Les membres de la Translate Community seront par ailleurs amenés à évaluer les traductions de leurs pairs. Sur le principe même du bénévolat, les contributions ne sont pas créditées. Google assure néanmoins qu’elles « seront prises en compte […] et auront un impact sur les résultats proposés à des millions d’internautes« .

Un système similaire est attendu pour la plate-forme de streaming vidéo YouTube. Google a déjà franchi une première étape en rapprochant les producteurs de contenus des traducteurs indépendants affiliés aux plates-formes Gengo et Translated.net autour d’un partenariat concernant les sous-titres intégrables en postproduction pour toucher un public multilingue, mais aussi les internautes atteints de déficiences auditives.

L’effort de crowdsourcing est soutenu en parallèle par des éditeurs tiers comme Amara, qui gère déjà la sous-titrage des cours en ligne de la Khan Academy, des spots publicitaires officiels de Twitter et de certains contenus VoD de Netflix.

Il est possible d’évaluer les traductions des autres utilisateurs.

—— A voir aussi ——
Quiz ITespresso.fr : entre Siri, Google Now et Cortana, la reconnaissance vocale, ça vous parle ?

Crédit illustration : Oleksiy Mark – Shutterstock.com

Recent Posts

Microsoft 365 : pourquoi il faut renforcer les mesures de sécurité

Face aux menaces ciblant Microsoft 365, une approche de sécurité multicouche, combinant les fonctionnalités natives,…

2 jours ago

Deux suites collaboratives intègrent des offres cyber packagées

Deux offres de cybersécurité portées par ITrust et Docaposte intègrent des suites collaboratives. Présentation.

3 semaines ago

PC IA : les entreprises sont enthousiastes malgré quelques incertitudes

Les dernières migrations de Windows 10 vers Windows 11 vont accélérer l'adoption des PC IA. Mais des…

1 mois ago

Digital Workplace : comment l’IA Générative s’installe dans l’environnement de travail

L’IA générative excelle dans plusieurs cas d’usage, notamment dans l’analyse, la recherche et la synthèse…

2 mois ago

PC Copilot+ : avec Arm ou x86 ?

Trop tôt pour envisager d'acquérir un PC Copilot+ ? Les roadmaps d'Intel et d'AMD peuvent…

3 mois ago

Copilot+ : une sélection de PC convertibles

Dévoilés lors du CES 2025, les PC Copilot+ au format convertible restent encore limitée dans…

3 mois ago