Lors de la Conférence développeurs Re:INVENT, Amazon Web Services a dévoilé un service baptisé Transcribe.
C’est un service de reconnaissance automatique de la parole (ASR). Grâce à l’API idoine, les développeurs sont ainsi en mesure d’ajouter facilement des capacités vocales à leurs applications.
Amazon Transcribe est en mesure d’analyser des fichiers audio hébergés sur la plateforme S3 afin d’en extraire un fichier texte correspondant à une retranscription de ou des voix. Il s’agit d’un moteur de reconnaissance vocale.
Le service peut transcrire des fichiers audio stockés dans des formats courants, tels que WAV et MP3, avec un horodatage pour chaque mot afin que vous puissiez facilement localiser l’audio dans la source d’origine en recherchant le texte.
Autre particularité d’Amazon Transcribe : il exploite le machine learning (branche de l’IA) afin d’apprendre et de s’améliorer continuellement pour suivre l’évolution du langage.
Côté performances, Transcribe est capable d’ajouter automatiquement la ponctuation, rendant le texte transcrit fidèle à la source. Il est aussi en mesure de distinguer différents interlocuteurs dans le fichier texte.
Amazon cite différents exemples d’utilisation de son tout nouveau service. Il pourra ainsi être exploité pour la transcription d’appels effectués dans le cadre d’un service client ou pour la génération de sous-titres destinés à du contenu vidéo.
Pour l’heure, il ne comprend que l’anglais et l’espagnol. Mais il est prévu de l’étendre à d’autres langues dans les prochaines semaines.
Des jonctions avec Amazon Translate et Amazon Comprehend, les deux autres nouveaux produits dévoilés, sont prévues.
(Crédit photo : AWS)
Les dernières migrations de Windows 10 vers Windows 11 vont accélérer l'adoption des PC IA. Mais des…
L’IA générative excelle dans plusieurs cas d’usage, notamment dans l’analyse, la recherche et la synthèse…
Trop tôt pour envisager d'acquérir un PC Copilot+ ? Les roadmaps d'Intel et d'AMD peuvent…
Dévoilés lors du CES 2025, les PC Copilot+ au format convertible restent encore limitée dans…
Les fonctionnalités de Gemini sont intégrées dans la suite bureautique Google Workspace. Conséquence : les…
Au CES 2025, les principaux constructeurs ont annoncé l'arrivée des ordinateurs de bureau dotés de…