Google sollicite les internautes pour faire tomber les barrières de la langue.
Le groupe Internet vient de lancer un programme collaboratif visant à améliorer l’algorithme lié à son service Translate. Pour prendre part à cette expérience en mode crowdsourcing, il faut maîtriser au moins deux langues et posséder nécessairement des compétences en anglais, autour duquel tout gravite.
L’utilisateur aura à traduire des mots, groupes de mots ou phrases simples grâce à un clavier virtuel adaptée à la langue sélectionnée. Son concours sera précieux pour aborder des spécificités grammaticales, syntaxiques et culturelles que la machine a pour le moment des difficultés à interpréter.
En tête de liste, les variations de sens d’un même terme, qu’elles soient d’ordre diatopique (dépendant de la région), diachronique (en fonction des générations), diastratique (selon la dimension sociale et démographique) ou diaphasique (d’après le registre de langue). Il s’agira également de s’ouvrir progressivement aux dialectes non encore pris en charge, comme l’Ouzbek ou le Cherokee. En fonction de l’engouement qui naîtra dans cette communauté, Google n’exclut pas d’aborder la question des langues vernaculaires, c’est-à-dire locales.
Les membres de la Translate Community seront par ailleurs amenés à évaluer les traductions de leurs pairs. Sur le principe même du bénévolat, les contributions ne sont pas créditées. Google assure néanmoins qu’elles « seront prises en compte […] et auront un impact sur les résultats proposés à des millions d’internautes« .
Un système similaire est attendu pour la plate-forme de streaming vidéo YouTube. Google a déjà franchi une première étape en rapprochant les producteurs de contenus des traducteurs indépendants affiliés aux plates-formes Gengo et Translated.net autour d’un partenariat concernant les sous-titres intégrables en postproduction pour toucher un public multilingue, mais aussi les internautes atteints de déficiences auditives.
L’effort de crowdsourcing est soutenu en parallèle par des éditeurs tiers comme Amara, qui gère déjà la sous-titrage des cours en ligne de la Khan Academy, des spots publicitaires officiels de Twitter et de certains contenus VoD de Netflix.
—— A voir aussi ——
Quiz ITespresso.fr : entre Siri, Google Now et Cortana, la reconnaissance vocale, ça vous parle ?
Crédit illustration : Oleksiy Mark – Shutterstock.com
Equipés de NPU, les PC Copilot+ peuvent déployer des LLM en local. Un argument suffisant…
Que vous soyez un novice dans le domaine informatique, ou avec un profil plus expérimenté,…
Les attaques de phishing utilisant des QR codes frauduleux intégrés dans des documents PDF joints…
Microsoft a amorcé le déploiement de Windows 11 24H2. Passage en revue des nouvelles fonctionnalités…
L'intégration de Copilot dans la suite bureautique s'accélère. Où trouver l'assistant IA et comment l'utiliser…
Microsoft annonce une phase expérimentale pour lancer Recall sur les PC Copilot+. Elle doit commencer…