Pour gérer vos consentements :
Categories: CloudGestion cloud

Twitter ouvre sa mémoire : tous les tweets publics sont archivés

Twitter annonce l’indexation de tous les tweets diffusés en mode public depuis la création de la plateforme de micro-blogging en 2006. Ce qui représente un volume de plusieurs centaines de milliards de messages en 140 caractères, qui est désormais archivé et qui sera prochainement mis à la disposition des internautes en consultation par requête moteur.

Cette mémoire de Twitter permet de replonger dans les archives de l’actualité ou de thématiques fortes à travers des hashtags associés comme #TEDGlobal (cycles de conférences de prospective), #JapanEarthquake (séisme et tsunami du Japon de mars 2011) ou #HongKong (mouvement actuel de contestation au régime chinois).

« Notre moteur de recherche excelle pour brasser l’actualité brûlante et couvrir les évènements en temps réel et notre infrastructure d’indexation des recherches reflète cette tendance forte d’englober le présent. Mais notre objectif à terme a toujours été de permettre aux gens de chercher à travers tous les tweets publiés », précise un collectif de managers et de chercheurs chez Twitter.

Sachant que le projet d’indexation intégrale des tweets a a démarré en 2012 et qu’il a été supervisé par Yi Zhuang et Paul Burstein. Des schémas de conception technique sont divulgués dans la contribution blog dense synthétisant ce vaste projet.

Pour parvenir à ce degré d’indexation, Twitter a conçu une infrastructure mêlant des capacités de modularités, d’adaptation de montée en charge (« scability », sachant que l’index ingurgite plusieurs milliards de nouveaux tweets par semaine), une certaine rationalité en termes de coûts d’exploitation (l’ensemble de l’index en temps réel est hébergé en technologies mémoire vive RAM à faible latence et à réactualisation rapide), une interface simple et un développement imprégné d’une dimension incrémentale (plusieurs paliers franchis en exploitant une architecture multi-tier).

—-
Utilitaire ITespresso.fr : Savez-vous où se trouve la 4G près de chez vous ?

Crédit photo : Twitter

Recent Posts

Cybersécurité : attention aux QR codes dans les PDF

Les attaques de phishing utilisant des QR codes frauduleux intégrés dans des documents PDF joints…

3 semaines ago

Windows 11 : une mise à jour majeure apporte de nouvelles fonctionnalités

Microsoft a amorcé le déploiement de Windows 11 24H2. Passage en revue des nouvelles fonctionnalités…

2 mois ago

Microsoft 365 : comment Copilot se déploie dans toutes les applications

L'intégration de Copilot dans la suite bureautique s'accélère. Où trouver l'assistant IA et comment l'utiliser…

2 mois ago

PC Copilot + : Microsoft veut garder Recall

Microsoft annonce une phase expérimentale pour lancer Recall sur les PC Copilot+. Elle doit commencer…

3 mois ago

Windows 11 : comment Microsoft va réduire la taille des mises à jour

Comment réduire la taille des mises à jour de Windows 11 ? Microsoft annonce la…

4 mois ago

Windows 11 : comment Bloc-notes va remplacer WordPad

Déjà doté de la sauvegarde automatique, d'un compteur de caractères et de Copilot, Bloc-notes embarque…

4 mois ago