Google vient de libérer la bêta de son outil open source de développement baptisé Cloud Datalab. Destiné avant tout aux experts scientifiques, il a vocation à faciliter l’exploration des données.
L’outil a été dévoilé lors de l’évènement Next de Google pour les développeurs qui s’est tenu hier à Paris (le 13 octobre 2015).
Basé sur une interface interactive, Google Cloud Datalab permet d’obtenir des informations à partir de données brutes.
L’outil permet en effet d’explorer et d’analyser les données (data mining), ainsi que de partager et de publier des rapports « d’une manière rapide, simple et efficace en termes de coût », précise Google dans un billet de blog.
Google Cloud Datalab associe la puissance de Google BigQuery (analyses big data) à Google Cloud Storage (stockage des données).
Le tout combiné avec des écosystèmes big data familiers tels que Hadoop et Spark.
Mais, de manière sous-jacente, le service exploite surtout IPython, un outil basé sur le langage informatique Python permettant d’analyser et de visualiser des données.
Il a été divisé en plusieurs packages au gré de sa transition vers le projet Jupyter (« open source, data science & scientific computing »)
Au coeur de l’outil de Google, on trouve d’ailleurs Notebook (composante du projet Jupyter) qui consiste en une application web pour le traitement interactif des données.
Notebook permet de créer des documents contenant du code, des graphiques, du texte, des images, des vidéos…
Jupyter a pour avantage d’être utilisé par la communauté scientifique et bénéficie de ce fait d’un écosystème important.
La première étape consiste à déployer Google Cloud Datalab comme une application App Engine (application web basée sur les serveurs de Google).
Cela signifie que l’outil tournera sur l’infrastructure de Google et qu’elle sera associée à un coût après la période de bêta.
Pour l’heure, la firme Internet de Mountain View n’a donné aucune indication sur les tarifs.
L’application installée, il suffit d’initier un nouveau projet pour commencer à exploiter ses données. Des templates de notebooks existent pour se familiariser avec l’outil.
Google Cloud Datalab permet par ailleurs de déployer des modèles basés sur l’auto-apprentissage (machine learning).
D’emblée, l’outil fait penser à Amazon QuickSight, la solution de business intelligence d’AWS (Amazon Web Service) qui permet également de combiner big data et data mining.
(Crédit photo : sakkmesterke, Shuttershock)
Les attaques de phishing utilisant des QR codes frauduleux intégrés dans des documents PDF joints…
Microsoft a amorcé le déploiement de Windows 11 24H2. Passage en revue des nouvelles fonctionnalités…
L'intégration de Copilot dans la suite bureautique s'accélère. Où trouver l'assistant IA et comment l'utiliser…
Microsoft annonce une phase expérimentale pour lancer Recall sur les PC Copilot+. Elle doit commencer…
Comment réduire la taille des mises à jour de Windows 11 ? Microsoft annonce la…
Déjà doté de la sauvegarde automatique, d'un compteur de caractères et de Copilot, Bloc-notes embarque…