L’Internet se dote de la parole
Le 22 juillet à Grenoble, cinq centres de recherche internationaux vont expérimenter une technologie de reconnaissance et de synthèse vocale capable d’animer sur Internet une conversation entre des personnes de langues différentes. Bientôt peut-être, plus besoin de savoir parler anglais ou chinois pour discuter en temps réel avec les communautés du Web !
L’Internet a beau être multilingue, mieux vaut s’armer d’un dictionnaire d’anglais pour consulter nombre de sites et échanger des informations sur le Web. Evidemment, le mieux serait de parler dans son microphone pour qu’un interlocuteur vous écoute dans sa langue natale. Un rêve impossible ? Que nenni. Cinq centres de recherche universitaires internationaux prévoient d’expérimenter le 22 juillet à 14 heures -dans le cadre du projet C-Star, une technologie capable de reconstituer entre deux personnes reliées par Internet un dialogue vocal sous plusieurs langues. Réalisée simultanément sur les campus d’Heidelberg (Allemagne), Pittsburg (Etats-Unis), Séoul (Corée), Trento (Italie) et à l’université Joseph Fourier à Grenoble, l’expérimentation mettra en scène des simulations de conversations entre un client et un loueur de voiture ou l’hôtesse d’un centre touristique par exemple. En effet, les premières applications prévues seront celles du commerce électronique et de la réservation à distance sur Internet.
Quel est le principe ? Depuis son poste de visioconférence à Grenoble, un « client » parle en français : « Bonjour, je souhaiterais connaître les offres de voyages pour Pittsburgh », par exemple. Un logiciel analyse alors la voix et la transforme en une sorte de langage conceptuel, une structure sémantique baptisée IF (Interchange Format). Sous la forme d’une chaîne de caractères, le message codé transite via Internet jusqu’au poste de l’interlocuteur de l’université de Pittsburg. Là, l’ordinateur interprète le message codé et énonce la phrase équivalente en anglais grâce à un logiciel de synthèse vocale. Bref, l’ordinateur traduit et parle à la place des interlocuteurs pour donner vie à une conversation en temps réel.« C’est le fruit de dix années de recherche », commente Jean Caelen, directeur de recherche et responsable de l’équipe chargée de la reconnaissance de la parole. Au sein du laboratoire Clips, les chercheurs ont participé à l’élaboration d’un dictionnaire de 5000 mots compréhensibles pour la machine. Ils sont issus du langage courant et des secteurs du transport, de l’hôtellerie et de l’information à vocation touristique. Le dialogue artificiel entre les cinq nations permettra de vérifier que le système fonctionne avec la plupart des langues. En plus de la connexion Internet, six lignes RNIS transporteront la vraie voix des interlocuteurs pour comparer la fidélité des messages humains et informatiques. Si les résultats sont à la hauteur des attentes, on pourra bientôt parler directement sur Internet à un interlocuteur anglais, allemand ou italien pour réserver sa voiture ou son hôtel. Une vraie révolution, rien de moins.
Pour en savoir plus :