Categories: Data-stockage

Salesforce esquisse un algorithme polyvalent pour traiter le langage naturel

Registre, syntaxe, vocabulaire, ton, sémantique… Et si le traitement du langage naturel pouvait être assuré par un algorithme « polyvalent » ?

Salesforce vient de rendre compte de ses travaux sur cette question.

Le groupe américain avait fait un point d’étape fin 2017. Il avait dressé un constat : les réseaux neuronaux artificiels exploités dans ce domaine sont généralement optimisés pour un usage et un jeu de données. Ainsi sont-ils, par exemple, rarement efficaces à la fois en traduction, en résumé de texte et en analyse du sentiment.

Les équipes de Richard Socher (fondateur de MetaMind, start-up acquise en 2016 par Salesforce) ont fait le pari d’une approche plus flexible dans la création automatisée de ces réseaux neuronaux.

Elles ont eu recours à un langage dédié suffisamment flexible pour définir des architectures standard de type LSTM (mémoire court terme persistante) capables d’intégrer des éléments non standard tels que les courbes trigonométriques.

salesforce-schema-1
Le générateur d’architectures s’améliore à mesure que sont évaluées celles considérées comme les plus prometteuses.

Pour permettre aux algorithmes de développer des capacités à partir de celles qu’ils possèdent déjà, Salesforce recourt à un framework d’apprentissage renforcé qui identifie les relations entre lesdites capacités.

Chaque tâche est divisée en sous-tâches. Le modèle d’apprentissage détermine alors à quel moment exploiter une capacité connue et à quel moment en apprendre une nouvelle. Il est entraîné pour expliciter ses décisions « en langage humain ».

Sur cette base a été code, en Python, un algorithme MQAN (« Multitask Question Answering Network ») capable de travailler simultanément sur dix tâches liées au traitement du langage naturel.

Un challenge decaNLP (« Natural Language Decathlon ») a été créé dans cette optique. Il regroupe l’ensemble de ces dix tâches : analyse de texte, dialogue orienté, résolution pronominale, création de requêtes SQL, etc.

Toutes les tâches sont modélisées sous forme de questions en langage naturel. L’algorithme en tire parti pour détecter des relations entre les différentes descriptions. Il s’améliore en conséquence et peut surtout résoudre des problèmes pour lesquels il n’a pas été spécifiquement entraîné. Une perspective notable pour les chatbots.

Cette approche « unifiée », Salesforce l’applique aussi à l’analyse d’images. Et plus particulièrement à la comptabilisation d’objets. Le processus est abordé de façon séquentielle ; les objets pertinents sont dénombrés et les relations entre eux permettent de décider s’il convient ou non de les ajouter au compteur.

Crédit photo : Christian Lagerek – Shutterstock.com

Recent Posts

PC IA : les entreprises sont enthousiastes malgré quelques incertitudes

Les dernières migrations de Windows 10 vers Windows 11 vont accélérer l'adoption des PC IA. Mais des…

1 semaine ago

Digital Workplace : comment l’IA Générative s’installe dans l’environnement de travail

L’IA générative excelle dans plusieurs cas d’usage, notamment dans l’analyse, la recherche et la synthèse…

1 mois ago

PC Copilot+ : avec Arm ou x86 ?

Trop tôt pour envisager d'acquérir un PC Copilot+ ? Les roadmaps d'Intel et d'AMD peuvent…

2 mois ago

Copilot+ : une sélection de PC convertibles

Dévoilés lors du CES 2025, les PC Copilot+ au format convertible restent encore limitée dans…

2 mois ago

Avec Gemini intégré à Google Workspace, les prix s’envolent

Les fonctionnalités de Gemini sont intégrées dans la suite bureautique Google Workspace. Conséquence : les…

2 mois ago

PC Copilot+ : c’est parti pour la transformation du parc

Au CES 2025, les principaux constructeurs ont annoncé l'arrivée des ordinateurs de bureau dotés de…

3 mois ago