Développer des systèmes capables non seulement de faire des prédictions, mais aussi de les mettre en pratique et de tirer des enseignements : c’est le principe de l’apprentissage par renforcement.
Facebook en a fait usage pour créer des algorithmes capables entre autres de mettre en avant les éléments les plus susceptibles de faire réagir les utilisateurs. Mais aussi pour améliorer les suggestions délivrées par son assistant M ou encore pour optimiser en temps réel la qualité des vidéos.
La plate-forme utilisée dans ce cadre vient d’être mise en open source. Baptisée Horizon, elle associe les capacités des frameworks Spark et PyTorch pour gérer l’ensemble du cycle de développement, de la préparation des données à l’export des modèles.
Chez Google, la figure de proue de l’apprentissage par renforcement s’appelle AlphaGo.
Ce programme spécialisé dans le jeu de go a battu, l’an dernier, le numéro un mondial de la discipline. Il est basé sur le framework TensorFlow… comme BERT, (Bidirectional Encoder Representations from Transformers) qui a lui aussi rejoint l’univers open source.
Google affirme que quelques heures suffisent sur un GPU traditionnel – et une demi-heure sur une puce TPU dédiée – pour mettre à profit cet outil.
L’idée est de « préentraîner » des algorithmes de traitement du langage naturel à partir de données non structurées disponibles sur le web. Il devient alors plus facile de les adapter ensuite à des tâches spécifiques telles que l’analyse de sentiment.
La phase de « préentraînement » se fait avec compréhension du contexte, aussi bien en fonction de ce qui suit que de ce qui précède chaque mot.
Chez Google comme chez Facebook, reste la barrière de la langue : seul l’anglais est pris en charge.
Equipés de NPU, les PC Copilot+ peuvent déployer des LLM en local. Un argument suffisant…
Que vous soyez un novice dans le domaine informatique, ou avec un profil plus expérimenté,…
Les attaques de phishing utilisant des QR codes frauduleux intégrés dans des documents PDF joints…
Microsoft a amorcé le déploiement de Windows 11 24H2. Passage en revue des nouvelles fonctionnalités…
L'intégration de Copilot dans la suite bureautique s'accélère. Où trouver l'assistant IA et comment l'utiliser…
Microsoft annonce une phase expérimentale pour lancer Recall sur les PC Copilot+. Elle doit commencer…