Peut-on, sans connexion Internet, tirer le plein potentiel des outils de traduction automatisée ? Microsoft ne l’affirme pas, mais affiche ses progrès en la matière.
Depuis fin 2016, la firme exploite, dans son service Translator, des algorithmes d’apprentissage profond qui apportent notamment une meilleure compréhension du contexte.
Vu la puissance nécessaire pour les exécuter, ces algorithmes n’ont, pendant un temps, été accessibles que dans le cloud Azure.
Il y a quelques mois, Microsoft a commencé à les rendre utilisables hors ligne, sur quelques téléphones Android dotés d’un puce dédiée à l’IA.
L’optimisation s’est poursuivie dans l’optique d’en arriver à un fonctionnement sur tout type de processeur.
Le résultat de ces travaux a été intégré dans dix packs linguistiques (français, allemand, espagnol, italien, portugais, arabe, russe, japonais, thaï, chinois simplifié) permettant aux applications Microsoft Translator (iOS, Android et Windows) de fonctionner hors ligne.
L’éditeur estime que ces nouveaux packs peuvent améliorer de « 23 % » la qualité des traductions, par rapport à celles réalisées avec les packs « sans algorithmes »*.
Une fenêtre s’ouvre en parallèle pour les développeurs Android – pour l’heure en préversion, avec une disponibilité générale prévue sous 90 jours : la possibilité de faire appel à l’application Translator pour intégrer des fonctions de traduction dans n’importe quelle autre app.
Utilisé depuis 2007 chez Microsoft, le moteur de traduction de texte avait été ouvert en 2011 sous la forme d’une API. Il prend aujourd’hui en charge 60 langues. On le trouve entre autres dans Bing, Skype, Edge, Cortana, Office, SharePoint, Yammer et Visual Studio.
La traduction de la parole avait fait ses débuts en 2014 dans Skype, l’ouverture de l’API remontant à début 2016. Les dix langues susmentionnées sont prises en charge. Les applications Microsoft Translator pour iOS et Android en bénéficient, tout comme PowerPoint, par le biais d’un module complémentaire.
Microsoft s’appuyait à l’origine sur des algorithmes utilisant des méthodes statistiques. Sans dictionnaire ni règles grammaticales, ils apprenaient, sur le mode « pierre de Rosette », des transformations du texte d’une langue à l’autre. Avec un écueil majeur : une capacité limitée à interpréter le texte (maximum 3 à 5 mots environnants).
Le basculement vers l’apprentissage profond, avec des réseaux neuronaux artificiels imitant le fonctionnement du cerveau humain, a permis d’élargir la compréhension du contexte.
Chaque mot est transformé en un vecteur à plusieurs centaines de dimensions qui représentent ses caractéristiques propres entre deux langues : genre, niveau de langue, catégorie grammaticale… et des éléments plus implicites.
Chaque vecteur est encodé en un autre vecteur représentant le mot dans le contexte de la phrase. La matrice qui en résulte est exploitée par un algorithme qui, avec l’aide des mots précédemment traduits, structure la phrase. Et ainsi de suite.
Microsoft donne l’exemple de la phrase anglaise « The dog just gave birth to six puppies. » Un modèle de deep learning est capable de comprendre qu’on parle là d’une chienne et non d’un chien.
* Une quarantaine de ces packs sont disponibles pour iOS et Android. On en compte moitié moins pour Windows.
Crédit photo : Microsoft
Equipés de NPU, les PC Copilot+ peuvent déployer des LLM en local. Un argument suffisant…
Que vous soyez un novice dans le domaine informatique, ou avec un profil plus expérimenté,…
Les attaques de phishing utilisant des QR codes frauduleux intégrés dans des documents PDF joints…
Microsoft a amorcé le déploiement de Windows 11 24H2. Passage en revue des nouvelles fonctionnalités…
L'intégration de Copilot dans la suite bureautique s'accélère. Où trouver l'assistant IA et comment l'utiliser…
Microsoft annonce une phase expérimentale pour lancer Recall sur les PC Copilot+. Elle doit commencer…